機械学習チップの実力は？　グーグルが自前データセンターでの推論処理に活用

通常の検索・写真・翻訳サービスのほか、「アルファ碁」にも

2017年04月11日テクノロジー

サーバーに挿入して使うTPUのボード

　ネット検索や賢くなったグーグル翻訳のほか、世界トップレベルの囲碁棋士を破った英ディープマインドの人工知能（ＡＩ）「アルファ碁」のサーバーにも使われた米グーグルの機械学習チップ「テンソル・プロセッシング・ユニット」（ＴＰＵ）。グーグルによれば、ＴＰＵを自社データセンター（ＤＣ）に導入したところ、現在使われているＧＰＵ（グラフィックス・プロセッシング・ユニット）やＣＰＵに比べ、ＡＩ関連の推論処理が１５－３０倍高速化できたという。さらにエネルギー消費でも１ワット当たり３０－８０倍効率化されたとしている。

　６月にカナダ・トロントで開催される「第４４回国際コンピューターアーキテクチャーシンポジウム（ＩＳＣＡ２０１７）」に発表する論文のブレプリント版として、５日にその詳細を公開した。

　ただ、こうした性能分析に対して過大評価ではないか、といった見方もある。ＩＥＥＥスペクトラムの報道によれば、ＴＰＵの比較対象としているＧＰＵが、単精度（実数の表現形式が３２ビット）や倍精度（同６４ビット）と、より高い精度の演算性能を持ち、その分、処理速度は相対的に遅くなる。しかも、これらはニューラルネットワークのトレーニングに適したもので通常、トレーニング済みの推論計算には必要ないという。

　そもそもＴＰＵは整数８ビット処理を行なっているため、より高度な処理を行うＧＰＵ、ＣＰＵとの比較は公正ではないのかもしれない。実際、論文の中でＴＰＵと８ビット演算のＣＰＵとの比較は１回しか報告がなく、その場合はＴＰＵの方が３．５倍速かったという。

　７０人を超える今回の論文の共著者の一人にもなっているカリフォルニア大学バークレー校のデイビッド・パターソン名誉教授（コンピューター科学）は、シリコンバレーのコンピューター歴史博物館で５日に行われた全米工学アカデミーのシンポジウムで、「ＴＰＵは現在のＣＰＵやＧＰＵに比べて処理速度は１０倍以内、ワット当たりの性能はさらに大きい」とその要約で述べている。

　ＴＰＵはグーグルが開発したオープンソースの機械学習ソフト「テンソルフロー」と併用することで、１００－１５００行という小さなプログラムでアプリケーションに推論機能を加えられるという。ＴＰＵ自体はサーバーコンピューターのスロットに挿入して使う基板で、グーグルが２０１５年以来、自社のＤＣに採用。検索、写真、ストリートビュー、翻訳といった一般向けのアプリケーションにも使われ、サービスの高速化や機能の高度化に貢献している。

日刊工業新聞電子版2017年4月9日付

藤元正 Fujimoto Tadashi

ＴＰＵの外販は考えにくいにしても、ＤＣによる企業向けのクラウドサービスでアマゾンウェブサービス（ＡＷＳ）やマイクロソフトを追いかけるグーグルだけに、そこでもＴＰＵを使ってサービスを提供するのだろうか。

ニュースイッチ

機械学習チップの実力は？　グーグルが自前データセンターでの推論処理に活用

編集部のおすすめ

注目のキーワード

機械学習チップの実力は？ グーグルが自前データセンターでの推論処理に活用

編集部のおすすめ

注目のキーワード

機械学習チップの実力は？　グーグルが自前データセンターでの推論処理に活用