使命は「デジタル化で研究を桁違いに効率化」、情シス研機構長が担う重責
情報・システム研究機構は国立情報学研究所や国立遺伝学研究所など4機関を運営する。情シス機構を持ち株会社とすると情報学研や遺伝研は事業会社にあたる。喜連川優機構長は情報学研の所長から機構長に就いた。使命はデジタル化で研究自体を桁違いに効率化することだ。遺伝研などの専門分野に情報学研などのテクノロジーを導入する。
―統計数理研究所や国立極地研究所など、情報系2機関、専門研究2機関の不思議な組み合わせですね。
「文部科学省の若手にもそう言われる。4機関をまとめて相乗効果を出せるのかという意味だ。ただ大学の視点では違和感はない。大学は医学部や法学部、工学部などが一つの組織となり、多様性を競争力に変えている。情シス機構は遺伝研や極地研の複雑科学に、情報学研や統数研の情報や統計数理を掛け合わせられる。これは圧倒的な効率化が期待できる。データ駆動科学のモデルを作り展開していく」
―情シス機構の役割は。
「情報学研の所長時代に東京大学や理化学研究所などと連携協定を結んだ。そのときの悩みは、情報学研が法人格を持っていないことだった。法人格は情シス機構にあり、どんな契約を結ぶかを自分では決められなかった。情シス機構に移り、今度は各研究所をサポートする側に回る。研究所が動きやすい体制を整えていく。例えば待遇や人材配置は情シス機構の役割だ。AI人材は引く手数多だ。そこで情シス機構で人を雇用し生成系AIを大学でいかに使うか研究してもらっている。できることから始めている。情報学研では生成系AIの研究を立ち上げる予定だ。サポートしていきたい」
―データの研究を続けてこられました。生成系AIで改めてデータの重要性が指摘されています。
「産業界に限らず、アカデミアでも価値は論文からデータにシフトしている。情報学研はもともと大学図書館を束ねる機能を担ってきた。希少な学術書を大学間でやりとりできるように環境を整えてきた。科学論文が電子化しオンラインで読むようになり、ジャーナルの購読契約などをサポートしている。そして次の競争はデータだ。例えば論文のデータを解析して検証する場合、同じ実験を別の研究者が再現して何度も測定するよりも、論文にあるデータをそのまま解析できた方が効率的だ。解析にAIが使われるようになり、データへのニーズが増している。経済学などではデータの公開を義務づけるジャーナルもある」
―大学の機関リポジトリのように研究データが蓄積される仕組みは作れますか。
「問題は中規模大学がストレージの調達にさえ苦労している点だ。ストレージはどこの製品でも変わらないはずだと安い物を選びがちだ。結果として使い勝手が悪く、研究者たちが使いたがらないということが起きている。これではデータは集まっても使われない。システムの修正には費用がかかり、契約違反があっても裁判費用を考えて泣き寝入りしている。体力のない大学は厳しい状況にある」
―オープンデータを推進してきました。ストレージに求められる機能は。 「よく使われるデータとほぼ使われないデータが存在する。我々は欧州のオープンデータの引用関係を調べた。どのデータセットがどんな分野で何人の研究者に使われているかというネットワーク構造を可視化した。これでデータを提供した研究者の貢献を評価できる。こうした分析ができるデータ基盤が必要になる。またデータを提供する範囲の設定やセキュリティーも重要になる」
―調達コストを抑えるためにもナショナルストレージが必要だと思います。情報学研の学術情報ネットワーク「SINET」とも相性がいいはずです。
「極めて重要な視点だ。例えば地球環境データの統合解析システム『DIAS』は容量が100ペタバイト(ペタは1000兆)になっている。1万2000人の研究者が活用し、半数は海外からの利用になる。すでに大学が運営できる規模ではなくなった。放射光施設から得られる測定データも極めて大きい。問題はどんなデータがどの程度使われるか、事前にはわからない点だ。データを保存する量や期間、引用される頻度などは研究を進める中で見えてくる。そのためには、ある程度、余裕を持ってデータを蓄え、使われないデータに対応する管理者が必要になる。同時にデータ駆動型の研究手法を普及させるハブ機能が重要になる」
―大規模言語モデル(LLM)開発のようなビッグデータを前提とした研究が各分野で広がるとなると、各分野でビッグサイエンスが立ち上がるような状況になりませんか。
「だから我々共同利用機関の役割が増している。大きくないとできない研究がある。だが大きなシステムを動かす煩わしさを研究者が感じているようではダメだ。SINETのように動いていて当たり前。普段は意識さえしないシステムとしなければ基盤たりえないだろう。一方で海外と大きさを競うゲームに陥ってしまえば意味がない。ここは各専門分野で知恵を絞る必要がある。情シス機構は遺伝研と極地研というフィールドがある。学術基盤サービスと専門研究を掛け合わせてモデルを作り、学術全体に広げていきたい」