画像認識とAIの限界 | 金沢音楽制作

^127）画像認識とAIの限界

AIが人間の笑顔を評価する。まさに「感情の検閲」ともいえる取り組みが今始まろうとしている。

愛知県内で保育園を運営する企業が、面接で面接者の笑顔を採点するAIを導入するようだ（「ＡＩでスマイル判定　愛知の保育園「笑顔採用」募集スタート」産経新聞）。彼らは、人の感情を、人が作ったプログラムに判定させる／されることに何の疑問も抱かないのだろうか。AIを研究・開発、またそれを称賛している連中の想像力の乏しさを浮き彫りにする。

この取組からは、80年代のハリウッド映画に見られるような不気味さを感じる。このように、表情をAIで評価しようとする試みは決して珍しいものではない。以前テレビか何かで、出社時に笑顔をAIに判定してもらい、設定した値を超える笑顔を作らないと仕事に取り掛かれない、という会社が紹介されていた。すでに人間は、感情をAIに抑圧されているのだ。

AIによる笑顔の判定には、二つの問題が考えられる。まず、AIに笑顔を判断させるというのであれば、笑顔とはなにか。この素朴な問いに答える必要があるだろう。仮に、記事に書かれているよう、笑顔とは、人材確保・定着の切り札として、また業績に強く相関するものである、としてみよう。だとすれば、笑顔とは、感情から作り出される顔の筋肉からなる一連の運動ではなく、業績を向上させるものこそが笑顔の本質である、といえるだろう。しかし、その実AIは、対象者の表情をある設定された基準と比較して、点数をはじき出しているだけである。

もう一つの問題は、自然な笑顔が作れることを前提としていることだ。bこれは、感情を表現することが苦手な、あるいは筋肉の運動といった身体的な障害を持った人に対する無意識の差別であろう。記事によれば、笑顔の判定の半分は面接官が判断するから問題ない、というが、それは差別を助長することを正当化させ、かつ責任をAIに転嫁することの他ならない。

笑顔が人を幸福にする力をもつ、というのであれば、笑顔を生み出す環境を作ることが先ではないか。笑顔が業績を向上させるのではなく、環境が笑顔を生み出す、と考えるのが自然な発想である。前後関係と因果関係の違いが分かっていないのだ。

さて、AIの画像認識の無能さを知らしめたエピソードとして、Googleの黒人認識問題がある。これは、AIが黒人の写真をゴリラと判断した事件である。しかし、私たちは、黒人の写真を見て、それがゴリラである、と認識することはありえない。仮に、ゴリラのようなあるいはサルのような容姿の人間をみても、それを「人間」として認知した上で「◯◯のような」と表現するだろう（〇〇のような、というのは、その対象が〇〇でないことを表している）。だとすれば、AIの画像認識は、致命的な欠陥を抱えていることになるのではないか。

画像認識のAIは、事前に大量の画像データが与えられ、そこから対象とする像を学習してのその特徴を捉えるものだ。そして、ある対象が入力された時、それが学習したデータと対照させ、それが何であるかを判定している。これは、プラトンのいうイデアのようなものを、画像データから独自に作り上げ、そのイデアとの類似度をはかるようなものだ。つまり、AIは、ある対象の姿かたちの特徴のみから、それが何であるか評価を下しているのだ。だから、人間と他の霊長類を峻別できないのである。

たとえば、コップとは何だろうか。AIに言わせれば、円柱でその中央に深い窪みのある形状をしたものをコップと判断するかもしれない。しかし、コップの本質は、その姿かたちだけにあるわけではない。コップをコップたらしめるのは、姿かたちといった形状ではなく、注ぎ入れること、溜めること、注ぎ出すこと、という機能にあるのだ。コップが円柱であることは、その実現方法の一つにしか過ぎないのである。フキの葉も手に持てばコップとなり得るのだ。

こうなってくると、AIの限界は、研究／開発者の限界ではないか、とも思えてくる。彼らが抽象化された数理こそが真理である、と盲信している限り、AIが現実的な問題を解決することは不可能であろう。彼らに欠如しているのは、哲学的な発想や想像力、そして何よりも他者に対する思いやりといった倫理観である。AI研究者は、さしずめプラトンのいう哲人王にでもなったつもりなのだろうか。そして彼らが目指すのは、エリートによる《国家》だろうか。AIという幻想から、私たちは早く抜け出さなければならないだろう。

2020-07-24