手書き文字認識、AIで99%。これで伝票処理もらくらく!?

コージェントラボがデータ化システム開発

 コージェントラボ(東京都渋谷区、飯沼純、エリック・ホワイトウェイ共同代表)は、人工知能(AI)技術を使い手書きの文字を高精度にデータ化するシステムを開発した。手入力に頼っていた手書き文字の読み取りをほぼ自動化できる。AIの学習により認識精度が高まる。多言語化やプリント文字と混ざった文書の読み取りも可能。月内に発売する。

 システムの名称は「tegaki(テガキ)」。一般的な光学式文字読み取り装置(OCR)など既存技術では手書き文字の認識精度が低く、ビジネスでの利用が難しかった。

 テガキは研究開発段階で99・22%の認識率が出た。データから学習できるので使えば使うほど精度が上がる。基本の利用料金は月額20万円(消費税抜き)の予定。

 ユーザーは手書きの文章をスキャンしてパソコンに取り込み、データ化したい部分を指定する。

 クラウド側で処理し短時間でテキストデータになる。情報保護が必要な場合はクラウドを使わないシステムも構築できるという。AIの認識が難しい部分は色で示してあり、その部分は人手でチェックする。帳票の形式やどの部分を読み取るかといった細かい設定はユーザー側が簡単にできる。

 独自のAI技術やアルゴリズムで、手書き、プリント文字、英語、中国語などが混じった文章でも高精度にデータ化する。今後は海外展開や、業務受託サービス(BPO)、中小企業向けのインターネットサービスなども検討する。

日刊工業新聞2017年8月23日

石橋 弘彰

石橋 弘彰
08月25日
この記事のファシリテーター

OCRのような一般的な読み取りでは、手書きの文と活字が混ざると認識できないという話は驚いた。人間なら簡単に見分けがつくことでもソフトには難しい。つくづく人間の凄さと不思議さを思い知らされる。

この記事にコメントする

  

ファシリテーター紹介

記者・ファシリテーターへのメッセージ

この記事に関するご意見、ご感想
情報などをお寄せください。