「ロボットは東大に入れるか」東ロボくん、国立大33大学でA判定 早慶にもリーチ
文系科目は苦戦
文系科目の英語や国語、世界史では記述変換は問題にならず、問題文の単語を統計的に解析して選択肢の中からもっともらしい答えを選べる。英語では英単語の発音など知識問題は正解率が高く、文脈理解が必要な長文問題への対応が課題だった。今回、ディープラーニング(深層学習)を取り入れるなど、解答能力は向上させたが出題傾向が変わり得点が伸びなかった。
例えば文章の穴埋め問題で、穴埋め箇所とキーワードとなる単語までの距離が遠くなっていた。東ロボくんは問題となる文章の前後5単語の関係を評価して解答を選ぶ。今回はキーワードが穴埋めの前の会話文にあるなど、評価方法が苦手とする出題が多かった。だが前後10単語、20単語と評価範囲を無理に広げると、東ロボくんのもつ辞書と一致する文章がなくなるため何も選べなくなる。AI特有の苦手傾向が明らかになった。
リスニング初挑戦
今年初挑戦のリスニングでは、単語の識別率が約90%と平均的な受験生と比べて、聞き取り圧倒的に精度は優れていた。ただ文脈の理解などで苦しみ点が伸びなかった。東大合格を目指すには統計的手法だけでは限界がある。
国語も知識をそのまま問う問題では正解率が高いものの、文章全体から読み取って答える問題は得点が低い。
一方で世界史など問題の形式が決まっている文系科目は得点を伸ばした。日本ユニシスは3種類のAIを開発。誤文検出に強い質問応答AIと、安定した単語相関AI、文章構造を解析する構文木照合AIの3種類の評価を合わせて回答を選んだ。結果、センター試験を安定して解くことに成功。受験生の平均点が45・9点のところ76点を獲得。偏差値66・5をたたきだした。
駿台予備学校の東大模試にも挑戦し、論述試験に答えた。論述では歴史の教科書や用語集などから文を引用し、要約して解答文を作成する。歴史的事実は間違わないため、出題意図を汲み取って文章を構成できるかがポイントだ。結果は意図を理解できていないため「歴史用語の説明に終始し、知識偏重型の受験生の答案になっている」と評価された。「歴史を点で捉え、因果を捉えられていない。抽象的な文言を並べ、具体例に乏しい」という。それでも部分点を取り東大受験生平均の17・2点を上回る21点を獲得した。
人間はどうなる?
新井教授は「現在の技術でも文章の要約支援などは実用間近だ。AIに東大の先生がうなる文章が書けるようになると、人間の仕事の大半がなくなる。優秀な大学でもAIのように部分点を狙う学生はいる。AIに可能な知的活動が広がる中で、人間はどんな仕事を担うか考えていく必要がある」と説明する。
東ロボくんの開発は、将来の人材競争力をどこに見いだすかが問われている。「テストの点は良いけど、仕事はできない」とされる人はAIにその座を譲ることになりそうだ。東ロボくんは詰め込み教育を否定するものではない。知識の活用には基盤となる知識が必要だ。ただビジネスの現場ではAIによる知識の活用が急ピッチで進んでいる。近いうちにAIと肩を並べるために最低限必要な知識は膨大になる。少なくともAIにできる仕事を横目に見ながら、自身の専門やキャリアを考えなければならない。大学受験の頃からAIと比較される、現在の高校生は不幸なのか幸運なのかわからない。同世代の日本人だけではない別次元での競争が始まっているのは確かだ。
ニュースイッチオリジナル