“信頼されるAI”への試金石…日本IBMが日本語LLMの技術文書公開へ
来年「グラナイト」国内投入
日本IBMは米IBMが開発した大規模言語モデル(LLM)「グラナイト」の国内投入に合わせ、信頼性を証明するテクニカルペーパー(技術文書)を日本語で公開する。学習に用いたデータの出所や学習法を明らかにし、生成人工知能(AI)の基盤技術であるLLMの活用で課題となる透明性や安全性を担保する。こうした取り組みは他に類がなく、日本語LLMのビジネス活用の本格化で問われる“信頼されるAI”への試金石としても注目される。
グラナイトの英語版は米IBMが9月に発売。12月中に学習データを増やした多言語対応版を市場投入する予定だ。日本語版は言語処理が特殊なため、多言語版とは別に日本IBMが日本語だけを切り出し、現在、追加学習をしている。2024年2月に日英のバイリンガル仕様として発売する見込み。
公開する日本語のテクニカルペーパーは数十ページで記述する予定。英語版と同様に、収集した学習データなどの前処理段階を明らかにすることで、顧客企業が自社のサービスやシステムなどにグラナイトを組み込んだ際のリスクの低減を図る。
米オープンAIが提供する「チャットGPT」などの汎用的な生成AIサービスは不適切な表現や回答を出力しないように“出口”で制御をしている。グラナイトはデータを収集する“入り口”の段階からガバナンス(統治)を効かせ、有害データや特定の個人に関連するデータなどを絞り込み、リスクを減らす手法を採用している。
24年は日本語LLMの分野で、国内外のITベンダー各社によるつば競り合いが本格化するとみられる。ビジネス利用で安全性や信頼をどう担保するのかが問われる。
インタビュー/統治・履歴管理に対応 常務執行役員・村田将輝氏
日本IBMのAIビジネス責任者を務める村田将輝常務執行役員に生成AI関連の取り組みなどを聞いた。(編集委員・斉藤実)
―LLMなどの基盤モデルの提供に当たり、技術文書を公開する意義は。
「生成AIは一般ユーザー向けの汎用モデルと、企業の中で追加学習をする特定用途向けモデルの二つがある。当社が提供するのはビジネス向け基盤モデルであり、ガバナンスやトレーサビリティー(履歴管理)が求められる。ビジネスでAIを使う上で技術文書を公表することは極めて重要だ」
―グラナイトの日本語版の特徴は。
「パラメーター数は80億と軽量で、画像処理半導体(GPU)一つでも動き、オンプレミス(自社所有)でも使える。発売後もデータの品質を上げることで、回答の正確性を高めていく」
―日本IBM社内では生成AIをどう使っていますか。
「各部門でいろいろと使っている。これまで諦めていたことが生成AIの活用で早期に解決できそうな手応えもある。例えば、米本社が使っている業務システムなどのローカライズ(現地化)。改善作業に手間がかかり、そのままになってしまうこともあったが、生成AIを使うことで作業が効率化でき、改善が進んでいる」
【関連記事】 AIソフトで生産コストの削減を支援する注目の企業