NTT・ソフトバンク…通信大手が日本語特化LLMに挑む、国産の強み生かす

2023年11月06日テクノロジー

国内通信大手が２０２４年に独自の大規模言語モデル（ＬＬＭ）の提供に乗り出す。ＮＴＴは軽量でありながら世界トップ級の日本語処理性能を持つ「ｔｓｕｚｕｍｉ（ツヅミ）」を２４年３月に提供。ソフトバンクは２４年までに国内最大級の国産ＬＬＭの構築を目指す。ＬＬＭは生成人工知能（ＡＩ）の基盤となる。米オープンＡＩの生成ＡＩ「チャットＧＰＴ」を採用する国内企業が続出する中、国産の強みを生かした差別化が求められる。（編集委員・水嶋真人）

NTT／パラメーター大幅抑制

「日本語に強く費用対効果も高い。低コストでチューニングでき、図表など各種形式に対応できる」―。１日に会見したＮＴＴの島田明社長は、ツヅミが持つ四つの特徴をこう説明する。注目点は、言語モデルの性能指標のパラメーター数をオープンＡＩの「ＧＰＴ―３」に比べ、超小型版で約３００分の１、小型版で約２５分の１に抑えたことだ。

４０年以上の自然言語処理研究を生かし、事前学習済み言語モデルの外部に必要なサブモジュールを追加することで、少ない追加学習量でも業界特有の言語表現や知識を効率的に学ばせることが可能。島田社長は「ＧＰＴ―３規模のＬＬＭと同程度の性能を２５分の１の画像処理半導体（ＧＰＵ）コストで実現する」と自信を示す。

ソフトバンク／文化・商慣習に適応へ

これに対しソフトバンクは国内最大級の生成ＡＩ開発向け計算基盤を稼働。この計算基盤を活用し、日本語に特化した国産ＬＬＭ開発に乗り出した。２４年までにパラメーター数が３５００億の国産ＬＬＭの構築を目指す。

計算基盤には米エヌビディアのテンソルコアＧＰＵ２０００基以上を搭載したＡＩスーパーコンピューター「ＤＧＸスーパーＰＯＤ」などで構成する。段階的に利用しながら２３年度中にすべての投資と構築を完了し、大学や研究機関、企業などに提供する。宮川潤一ソフトバンク社長は「日本の文化やビジネスの慣習などに最適な国産ＬＬＭを開発することで、あらゆる産業への生成ＡＩソリューションの導入を支援し、デジタルの社会実装の実現を目指す」と意気込む。

日本企業では既にチャットＧＰＴが普及し始めている。だがＮＴＴは日本語の専門用語への対応力を生かした医療やコンタクトセンター向けの自動応答などで差別化し、ＬＬＭ関連事業で「まずは２７年度に年間１０００億円以上の売り上げを目指す」（島田社長）方針。複雑な言い回しなど、日本語の特徴への対応が普及のカギとなる。

日刊工業新聞 2023年11月02日