ニュースイッチ

専門家も読み違え…データ流通のハードルは高い

不信感や不快感が払拭できていない
 データ流通へのハードルの高さをデータ分析の専門家であるデータサイエンティストも読み違える事態が生じている。データサイエンティスト協会(東京都港区)の市民意識調査では、匿名加工情報の認知度は3・8%。調査設計時の想定は半数程度だった。匿名加工情報の利用に賛成する人は18%。これも想定より少なかった。個人データ利用に対する不信感や不快感が払拭(ふっしょく)できていない。(文=小寺貴之)

議論できず


 「これではデータ活用の議論を始めることもできない」とデータサイエンティスト協会の草野隆史代表理事(ブレインパッド社長)は嘆く。意識調査では匿名加工情報の認知度は3・8%だった。匿名加工情報は特定の個人を識別できないように加工し、復元できなくした情報を指す。鉄道のICカードや小売りのポイントカードでは、顧客一人ひとりと契約して個人情報を取得する。このデータを束ねて氏名や住所などのデータを間引き、ノイズを加えると、データを解析しても個人を特定できなくなる。

 意識調査では匿名加工情報の名称だけ知っている人が12%で、84%は知らなかった。調査を主導した中林紀彦理事(SOMPOホールディングスチーフデータサイエンティスト)は「認知度は半数を想定していたが結果は3・8%。読み違えた」と明かす。データ活用は賛成が18%で、反対は24%、どちらでもないが57%だった。災害研究利用への賛同率は44%。33%は一般的な活用意義を認めつつも自分のデータは使ってほしくない。残りの23%は反対だ。公共性の高い活用事例も半数から支持されていない。

コスト想定以上


 問題は、アンケートを通して匿名加工情報について説明したものの、回答者に理解されているとは考えにくい点だ。匿名加工について市民が理解し、信頼を広げるためには想定以上のコストがかかる可能性がある。ひかり総合法律事務所(東京都港区)の板倉陽一郎弁護士は「調査であらためて聞かれると(データの流用は)嫌だという反応だ。自分で匿名加工を体験すれば自分のデータがほぼ残っていないことが分かるはず」と指摘する。

 現状では匿名加工情報は匿名化の手間がかかり、“価値は低いものの風評リスクのあるデータ”ということになる。匿名加工情報を他社から買うよりも、自社のサービスを通して許諾を得たデータを活用する方が安全だ。データ流通では暗号下で解析する秘密計算技術も注目されているが、中林理事は「技術によらず、二次利用すべてが反発されうる」と指摘する。

危機感伝える


 このままではデータを囲い込む方が合理的で、信頼性のある自由なデータ流通の実現は不透明になる。草野代表は「協会としてはネガティブな結果だが、危機感を伝える必要がある」と強調する。協会としては理解した人の受容性と理解してもらうためのコストを明らかにし、教材を作り普及コストを引き下げる必要がある。中林理事は「学校教育で教えるなど、国の力を借りないといけない規模の問題だ」と話す。

                    
日刊工業新聞2019年7月18日
小寺貴之
小寺貴之 Kodera Takayuki 編集局科学技術部 記者
〝安全〟と〝安心〟にわけると、匿名加工情報は社会を〝安心〟させるに至っていませんでした。草野代表は「中国などの政府による国民監視や、AIやGAFAの脅威論などが混ざり合い、不信感が増しているのではないか」と考察します。〝安全〟の視点からは匿名加工情報に個人を特定するための情報は残ってません。一方で、板倉弁護士は「匿名加工情報の半数は偽装匿名加工ではないか。証明できないが」と指摘します。匿名加工情報のせいで自分が損をしたことを一消費者の立場から証明できれば、その技術や手法はイノベーションを起こせるはずです。今回の調査結果は、データ流通促進の立場からは不都合な真実でしかありませんが、誠実に公表して、次の策を考える協会の姿勢は評価されるべきだと思います。そもそも論として、同協会の幹部は「日本企業は社内データすら解析しきれずに持て余している状況で、匿名加工でデータ流通を推しても使い切れない企業の方が多い」と指摘します。これらを含めてG20で提唱したDFFTは実現でき、日本はそれを享受できるのか、多くの人が知恵を絞らないといけないと思います。大学では文系理系問わずにデータ科学が浸透し始めているので、データ流通の〝安心〟を醸成し、データの価値を享受する基盤をつくれればと思います。

編集部のおすすめ