身の回りにあるあんなこと。どういう技術でできているの?
そんな疑問に、情報コースの教員が答えます。

Q:人工知能は病気の診断ができますか?

教授

原 武史

医用画像情報処理

A:「診断」は、法律に基づいて医師が最終的に病名を判断する作業ですから、コンピュータが「診断」を行うことはできません。そのため、診断に関する様々な情報や意見を医師に提示して、医師の判断を支援する仕組みが作られています。人工知能は、そこで提供する情報や意見を構築する方法に使われています。例えば、X線画像やCT/MRI/PET画像を解析して、複雑な形状を持つ臓器の体積や面積を計測したり、過去の検査画像と現在の検査画像の位置合わせを行い、その引き算の結果から、変化があった領域を可視化する技術があります。また、人間では気づかないようなわずかな画像特徴から、病気の進展具合や病名、数値を推定する技術には、畳み込みニューラルネットワークが利用できることが知られており、活発に研究され、実用化にもつながっています。血液検査などの検査結果から病気の深刻度を予測したり、スマートウオッチで計測する心電図や心拍、3次元センサーの動作から、病気の可能性を予測する人工知能システムも広く研究されています。また、人と同様、人工知能も全知全能ではありません。したがって、人と人工知能がどうやって助け合って、よりよい診断結果を導き出すための、人と人工知能の協調作業に関する心理学や認知科学の観点からの研究も必要であることが分かってきました。これらの基本技術は画像処理、画像認識、信号処理、人工知能といった3年生における専門科目で学びます。その学習に必要な数学や物理、電気回路や電子回路、心理学などは1年生から学びます。

Q:人の心を理解するAIはできるの?

教授

寺田 和憲

自律知能システム

A:できます。心とは信念、願望、選好、目的についての脳内の情報です。信念は世界について、何を知っていて何を知らないかです。人は全知全能ではありませんので知っていることに偏りがあります。五感で感じ、蓄積した情報を脳内で信念として保持します。願望、選好、目的は信念に対する評価に関する情報(良し悪し)です。岐阜大学があるということを知っていて(信念)も、岐大が好きかどうか(選好)、岐大に入りたいと思うか(願望)、岐大に入ることを目標にするか(目的)は人ぞれぞれ異なります。信念についてはある程度共通しているので、他者がどのような信念を持っているか推測するのは比較的容易です。しかし、選好、願望、目的は人それぞれ異なりますので観察した振舞から推測する他ありません。書店で岐大の赤本を手にしている人を見れば、その人が岐大を知っていて、岐大に入りたいという願望、目的を持っている可能性が高いことがわかります。そして、その人がその赤本を買えばさらに確信度が高まります。なお、選好はわかりません。誰でも簡単に行うこの推論はどのように行われるのでしょうか?この推論は人の合理性を仮定して、ベイズ推論によって行われます。岐大に入りたい人はだいたい岐大の赤本を買います。p(岐大の赤本買う|岐大に入りたい)=0.9ぐらいでしょう。ですから、赤本を買っている人を見れば、岐大に入りたいのかなと考えるのは当然です。これは、ベイズ推論によってp(岐大に入りたい|岐大の赤本買う)∝p(岐大の赤本買う|岐大に入りたい)p(岐大に入りたい)を計算しているに他なりません。このようにp(振舞|心の状態)についてのモデル(生成モデルと言います)を持っていれば他者の心が推論できるのです。そして、さらに確信度を高めたければ、直接その人に聞けば良いのです。AIが書店で「あなたは岐阜大に入りたいのですね」と話しかけてくる日も近いでしょう。

Q:「自撮りが盛れる」アプリってどうなってるの?

教授

加藤 邦人

コンピュータビジョン、画像認識

A:自撮りアプリで顔を「盛る」機能がありますよね。色白加工、小顔にする、目、鼻、口を加工する。いろいろな機能で顔を「盛れる」アプリです。他にプリクラにも同じような機能があると思います。これらは、どのような技術でできているのでしょう?まず、一つは画像処理という技術です。皆さんはパソコンやスマホで画像を保存していますよね。その画像は「画素」という単位でできていることも聞いたことがあると思います。画像処理は、画像の色や明るさの変換や形の変形を行う処理、画像の特徴を抽出するなど、画像のデータ処理や画像の理解のための技術です。色白機能や、目、鼻、口の変形は画像処理の機能を活用しています。
 また、目、鼻、口を自動で加工してくれる。キャラクターを付加してくれるなどはもっと高度な技術が使われています。スマホやパソコン(コンピュータ)が画像の中から目を自動で検出するには、「画像の中のどこに目があるか」を認識する必要があります。もっと言えば、「これが顔で、これが目で、これが鼻、これが口」とコンピュータが理解しているということです。そのためには「顔、目、鼻、口とはこういうものだ」という知識を持たせてあげなければなりません。このような機能はパターン認識という研究分野の成果です。最近ではパターン認識でも特に画像の理解を研究する分野をコンピュータビジョンと呼びます。人工知能の研究の一分野で、人工知能が「眼で見て頭で理解する」を実現する研究分野になります。近年コンピュータビジョンはすばらしく発展し、いろいろなところで活用されるようになりました。スマホでもたくさん使われていますし、自動車の自動ブレーキや自動運転などにも使われています。他に、コンピュータがカメラで何かを理解する場面を見たら何をどうやって認識しているのだろう?と考えてみるのも面白いです。皆さんの周りにもたくさんあると思います。

Q:インターネットで類義語も検索できるのはなぜ?

准教授

松本 忠博

自然言語処理、計算言語学

A:従来、コンピュータで類義語を扱う方法としては、各単語に対する類義語・対義語などの単語間の関係や単語の意味の階層構造の情報が格納された「辞書」を用いる方法が一般的でした。検索対象の単語が辞書に登録されていれば類義語を直接得ることができます。しかし、辞書は人手で構築する必要があり、新しい単語の登場や、既存の単語の意味の変化に応じて人手で辞書を更新していかなければならず、辞書の構築や保守にとても手間がかかるという問題がありました。また、2つの単語間の類似度など、単語の意味的な情報を数値で表して計算に利用するのにもあまり適していませんでした。
 そこで、単語を「記号」ではなく複数の数値の並び、つまり「ベクトル」として表現することで、ことばを対象としたさまざまな処理(計算)に用いることが一般的になってきました(「ベクトル」というと2次元や3次元のものを思い浮かべる人もいるかもしれませんが、単語は一般に数百次元のベクトルで表されます)。単語をベクトルで表現すれば、単語間の類似度はそのベクトル間のなす角や距離などの情報を使って数値で表すことが可能となり、コンピュータによる処理がしやすくなります。類似の度合いによって単語に順位を付けることもできます。
 単語のベクトル表現は、その単語がどのような文脈で使われているか(どのような単語と一緒に現れるか)といった統計的な情報をもとに計算によって求められます。この統計的な情報を得るには大量の文書データが必要となりますが、Webなどから大量の文書を収集することができれば、人手ではなく機械的な処理によってベクトル表現を得ることができるので、人手で辞書を構築して保守するのに比べると、必要な手間や時間を大幅に減らせます。
 単語のベクトル表現を用いることにより、字面は異なっていても意味の似た単語をコンピュータ内部では同じようなものとして扱うことができます。また、単語だけでなく文や文章に対するベクトル表現を得ることで、類似した文や文章を探したり、分類したりするのにも利用できます。例えば、ニュースサイトで読者の好みや関心に合わせてニュース記事を提示する、迷惑メールかどうかを推測する、商品レビューなどの文が肯定的なものか否定的なものかを自動的に判断するといったことにも利用されています。検索や分類に限らず、機械翻訳(自動翻訳)やそのほかの言語処理システムにおいてもその内部では単語のベクトル表現が広く用いられています。

Q:画像の「ぼかし/モザイク」効果って戻せるの?

助教

淸水 恒輔

各種データ解析、データサイエンス

A:SNSなどで画像をアップしてフォロワーに公開する際、特定の箇所をプライバシー面やモラル面などで見せたくない場合、その部分を「ぼかす」ことがあると思います。このぼかし機能は、現在日常でスマホを持ち歩く皆さんであれば、加工アプリによって容易に利用できます。
  画像をぼかすことは、画像をデータとして扱った際の「ピクセル(画素)情報」を不可逆に加工する画像処理技術であるため、加工後の画像は元のものと同一にはならず、「ぼかし/モザイク」効果を完璧に復元することは「一見」不可能です。このことを利用して、自分以外の者に完全な元データを見られることを阻止できますが、元データを何らかの原因(デバイスの故障、バックアップ不足など)で復元できず、SNS上にアップされた画像データのみを用いて元データを復元したい場合、「自分(もしくは信頼のおける他者)にのみ復元できるぼかし機能」が存在すると便利であると考えます。