手書き数字を98％認識、正解未知データを学習するAI

東大などが開発、画像などにも幅広く活用

2017年06月29日トピックス

　東京大学大学院情報理工学系研究科の胡緯華（フウェイファ）大学院生と、プリファード・ネットワークス（東京都千代田区）の宮戸岳リサーチャーらは、手書き文字や数字のように、正解が事前に分からないデータを効率的に学習する人工知能（ＡＩ）技術を開発した。手書き数字認識の精度が９８・４％と、別の研究グループの最高成績８４・３％から誤差を１０分の１に減らした。手書き文字認識の精度は７０％だった。文字認識に限らず画像など幅広く活用できる。

　一般にＡＩは正解が分かっている大量のデータを事前に用意して学習させる。学習後に未知のデータを与えると、そのデータと最も近い正解群を選び判定する。今回、事前にデータを用意しないで、未知データをそのまま学習する「教師なし学習」で高い識別精度を実現した。

　開発したのは「ＩＭＳＡＴ」というアルゴリズム。まずデータを種類（クラスター）に分類し、各データにノイズを加えても同じ種類に分類するように、深層学習した。

　するとすべてのデータを一つの種類に集める「圧力」がかかるため、元データからの情報量を増やすような圧力を別途かけさせた。この二つの工夫で複雑なデータも精度良く分類できるようになった。

　手書き数字認識では画像データを１０種類に分け、各種類は０―９のどれかに該当するようにした。精度は９８％。手書き文字認識は１００種類分類で精度７０％。データをコードに圧縮するハッシュ学習は９７％だった。

　８月にオーストラリア・シドニーで開催の機械学習の国際会議（ＩＣＭＬ）で発表する。