政策で加速するか、オープンデータの可能性
科学研究の成果は主に論文として流通するが、その背後には実験・観察で得られた膨大なデータがある。ともすればラボのハードディスクに眠るだけのこの研究データに、いま注目が集まる。オープン(・リサーチ・)データ、すなわち検索・アクセス・相互運用・再利用が可能という要件(頭文字をとってFAIR原則)を満たす形で公開・共有された研究データは、重複的な研究の回避、人工知能を駆使した知見の発掘、感染症への迅速な対応など、さまざまな価値につながることが期待されている。
地球科学や天文学など一部の分野では国際的なデータ共有が長年行われてきたが、過去10年ほどは、論文誌のオープンアクセス化なども包含する「オープンサイエンス」運動が世界的に盛り上がる中、研究の公正性や再現性の担保への問題意識も相まって、各国政府や官民の研究資金提供機関が積極的にデータ共有を推進してきた。国内でも科学技術・イノベーション基本計画のもと、大学や公的機関でのポリシー策定やデータ基盤の整備が進む。
直近では、米国政府が踏み込んだ動きを見せている。2022年8月、ホワイトハウス科学技術政策局(OSTP)は、政府機関に対し、公的助成を得た研究論文とその関連データの同時公開を原則とするポリシー策定を25年中に求める覚書を発出した。
米国立衛生研究所(NIH)は先駆けて23年1月にデータ管理・共有ポリシーを改訂。今後NIHで助成を受けた研究者は原則オープン化の方針に沿う計画の提出を義務づけられる。さらに同年1月、OSTPはNIHを含む10の連邦政府機関とともに23年を「オープンサイエンス年」とし、さまざまなアクションを行うことを宣言した。
データ公開をルールで義務づけることは、ただちにその有効活用を保証しない。NIHの新ポリシーに関しても、どこまでのデータを公開するのか、データキュレーションの手間やコストをどうするのかなど、現場の戸惑いも聞かれる。データベースやリポジトリーの整備状況も分野ごとのバラつきが大きい。
オープンデータのメリットはコストなしで享受できない。各国・各分野の好事例を丹念に見いだしながら、持続可能な仕組みを模索すべき段階に入っている。
科学技術振興機構(JST) 研究開発戦略センター フェロー 丸山隆一
東京工業大学総合理工学研究科修士課程修了(理論神経科学)。出版社勤務を経て20年より現職。科学技術イノベーション政策についての調査業務に従事。