「東大断念と言ってない!」東ロボくん、要素技術に絞り込み特定科目に集中

センター模試の偏差値57。課題・弱点分析、教材開発に生かす

  • 0
  • 0
AIの解答を紙に書くロボット「東ロボ手くん」
 国立情報学研究所などが進める人工知能(AI)開発プロジェクト「ロボットは東大に入れるか」は、中高生の読解力の診断や読解力を身につけるための教材開発を始める。現在のAIは問題文などの意味を理解しないまま解答を生成して好成績を出している。中高生も試験の問題文を理解できていない課題が浮き彫りになっており、人の読解力に焦点を当ててAIで教育を支援する技術を開発する。

数学は76、文章読解に壁


 東ロボくんは2016年度のセンター試験模試では明治大学など、「MARCH」や「関関同立」と呼ばれる難関私立大学への合格可能性が8割を超えた。センター試験模試では15年度が偏差値57・8で、16年度が57・1と安定して得点をとれることを実証した。

 論述式の東大模試では数学が偏差値76・2をたたき出した。プロジェクトディレクターの新井紀子国情研教授は「数学だけみれば東大理IIIも合格できるかもしれない」と胸を張る。

 一方で技術課題も明確になった。AIは問題文などの意味を理解できないのだ。英単語の選択問題などはデータを参照して正解を出せるが、英語の長文読解や物理の問題文を理解できなかった。例えば英語では深層学習を導入し、19億文500億単語を学習させた。文法問題では正答率が67%から86%に向上するなど単語選択問題は成績が伸びた。

 ただ文章の選択問題は正答率が下がった。NTTの東中竜一郎主任研究員は「文と単語の自然さを判定するのに500億単語必要。文と文とでは500億文必要となると膨大ですぐには解けない」という。

 論述式の数学では問題文をAIが扱える形式に直せた問題ではほぼ満点をとった。ただ数学の問題文はシンプルで扱いやすい。世界史では問題や知識の意図や意味は理解せず、用語集などの文書を継ぎ合わせて解答文を作成した。

 このままでは抜本的な成績向上は望めない。そこでセンター試験模試の全科目受験は凍結し、AI開発は英語など特定科目に集中する。

今後は教育現場の課題解決に向き合う


 一方でAIは意味を理解しないまま、テクニカルに問題を解いて合格判定を獲得した。人間の受験生も教科書や問題文を理解しないままテクニカルに問題を解いていないか検証した。

 中高生の読解力を試験したところ文章の係り受けは中学生の29%、高校生の5%が理解できていなかった。文意を推論する問題では理解できない中学生が57%、高校生が27%に達した。そこでAIを応用して人間の読解力を測るテストや教育法を開発する。

 東ロボくんも人間の受験生も意味理解の壁にぶつかっている。読解力の測定は簡単ではなく、係り受けなど文章理解の方法論の延長に、世界史に出てくる社会現象や資本主義などの概念の理解があるとは限らない。そして読解力の向上は教育者や教育研究者が長年取り組んでいる課題の一つだ。

 教員1人当たりの生徒数が多いなど、技術だけではない根深い問題もある。問題を明らかにすることと、解決することは難しさの次元が異なる。AI開発を通して教育界に問題提起してきた東ロボくんが、今後は教育現場の課題解決に向き合うことになる。
(文=小寺貴之)

COMMENT

「東大断念!」と報道されている東ロボくんですが、新井先生は「私は断念とはひと言もいっていない」と何度も説明していました。開発を全試験科目から重要な要素技術に絞り込み、論述試験は引き続き受ける方向。ただ意味理解の壁は高く、現在の延長では解けないように思います。一方で、人間が内容を理解しているか測るのもとても難しい技術。テストや入試の限界もここにあり、その問題点を東ロボくんは鮮明にして社会に提起し、そして実際に問題を解くフェーズに進みます。読解力は学習を支える基盤能力。理解か、丸暗記か、学びを楽しめるかどうかの分かれ目になります。ただ教育現場の抱える問題は、便利なITツール一つで解決できるようにはみえません。1クラスの生徒数を10人にするなど抜本的な変化が必要な気がします。そう問うと、新井先生は「ぜひ5年後にもう一度インタビューしてくれ」と強気でした。(日刊工業新聞科学技術部・小寺貴之)

関連する記事はこちら

特集