NTT・ソフトバンク…通信大手が日本語特化LLMに挑む、国産の強み生かす
国内通信大手が2024年に独自の大規模言語モデル(LLM)の提供に乗り出す。NTTは軽量でありながら世界トップ級の日本語処理性能を持つ「tsuzumi(ツヅミ)」を24年3月に提供。ソフトバンクは24年までに国内最大級の国産LLMの構築を目指す。LLMは生成人工知能(AI)の基盤となる。米オープンAIの生成AI「チャットGPT」を採用する国内企業が続出する中、国産の強みを生かした差別化が求められる。(編集委員・水嶋真人)
NTT/パラメーター大幅抑制
「日本語に強く費用対効果も高い。低コストでチューニングでき、図表など各種形式に対応できる」―。1日に会見したNTTの島田明社長は、ツヅミが持つ四つの特徴をこう説明する。注目点は、言語モデルの性能指標のパラメーター数をオープンAIの「GPT―3」に比べ、超小型版で約300分の1、小型版で約25分の1に抑えたことだ。
40年以上の自然言語処理研究を生かし、事前学習済み言語モデルの外部に必要なサブモジュールを追加することで、少ない追加学習量でも業界特有の言語表現や知識を効率的に学ばせることが可能。島田社長は「GPT―3規模のLLMと同程度の性能を25分の1の画像処理半導体(GPU)コストで実現する」と自信を示す。
ソフトバンク/文化・商慣習に適応へ
これに対しソフトバンクは国内最大級の生成AI開発向け計算基盤を稼働。この計算基盤を活用し、日本語に特化した国産LLM開発に乗り出した。24年までにパラメーター数が3500億の国産LLMの構築を目指す。
計算基盤には米エヌビディアのテンソルコアGPU2000基以上を搭載したAIスーパーコンピューター「DGXスーパーPOD」などで構成する。段階的に利用しながら23年度中にすべての投資と構築を完了し、大学や研究機関、企業などに提供する。宮川潤一ソフトバンク社長は「日本の文化やビジネスの慣習などに最適な国産LLMを開発することで、あらゆる産業への生成AIソリューションの導入を支援し、デジタルの社会実装の実現を目指す」と意気込む。
日本企業では既にチャットGPTが普及し始めている。だがNTTは日本語の専門用語への対応力を生かした医療やコンタクトセンター向けの自動応答などで差別化し、LLM関連事業で「まずは27年度に年間1000億円以上の売り上げを目指す」(島田社長)方針。複雑な言い回しなど、日本語の特徴への対応が普及のカギとなる。