専門家も読み違え…データ流通のハードルは高い
不信感や不快感が払拭できていない
データ流通へのハードルの高さをデータ分析の専門家であるデータサイエンティストも読み違える事態が生じている。データサイエンティスト協会(東京都港区)の市民意識調査では、匿名加工情報の認知度は3・8%。調査設計時の想定は半数程度だった。匿名加工情報の利用に賛成する人は18%。これも想定より少なかった。個人データ利用に対する不信感や不快感が払拭(ふっしょく)できていない。(文=小寺貴之)
「これではデータ活用の議論を始めることもできない」とデータサイエンティスト協会の草野隆史代表理事(ブレインパッド社長)は嘆く。意識調査では匿名加工情報の認知度は3・8%だった。匿名加工情報は特定の個人を識別できないように加工し、復元できなくした情報を指す。鉄道のICカードや小売りのポイントカードでは、顧客一人ひとりと契約して個人情報を取得する。このデータを束ねて氏名や住所などのデータを間引き、ノイズを加えると、データを解析しても個人を特定できなくなる。
意識調査では匿名加工情報の名称だけ知っている人が12%で、84%は知らなかった。調査を主導した中林紀彦理事(SOMPOホールディングスチーフデータサイエンティスト)は「認知度は半数を想定していたが結果は3・8%。読み違えた」と明かす。データ活用は賛成が18%で、反対は24%、どちらでもないが57%だった。災害研究利用への賛同率は44%。33%は一般的な活用意義を認めつつも自分のデータは使ってほしくない。残りの23%は反対だ。公共性の高い活用事例も半数から支持されていない。
問題は、アンケートを通して匿名加工情報について説明したものの、回答者に理解されているとは考えにくい点だ。匿名加工について市民が理解し、信頼を広げるためには想定以上のコストがかかる可能性がある。ひかり総合法律事務所(東京都港区)の板倉陽一郎弁護士は「調査であらためて聞かれると(データの流用は)嫌だという反応だ。自分で匿名加工を体験すれば自分のデータがほぼ残っていないことが分かるはず」と指摘する。
現状では匿名加工情報は匿名化の手間がかかり、“価値は低いものの風評リスクのあるデータ”ということになる。匿名加工情報を他社から買うよりも、自社のサービスを通して許諾を得たデータを活用する方が安全だ。データ流通では暗号下で解析する秘密計算技術も注目されているが、中林理事は「技術によらず、二次利用すべてが反発されうる」と指摘する。
このままではデータを囲い込む方が合理的で、信頼性のある自由なデータ流通の実現は不透明になる。草野代表は「協会としてはネガティブな結果だが、危機感を伝える必要がある」と強調する。協会としては理解した人の受容性と理解してもらうためのコストを明らかにし、教材を作り普及コストを引き下げる必要がある。中林理事は「学校教育で教えるなど、国の力を借りないといけない規模の問題だ」と話す。
議論できず
「これではデータ活用の議論を始めることもできない」とデータサイエンティスト協会の草野隆史代表理事(ブレインパッド社長)は嘆く。意識調査では匿名加工情報の認知度は3・8%だった。匿名加工情報は特定の個人を識別できないように加工し、復元できなくした情報を指す。鉄道のICカードや小売りのポイントカードでは、顧客一人ひとりと契約して個人情報を取得する。このデータを束ねて氏名や住所などのデータを間引き、ノイズを加えると、データを解析しても個人を特定できなくなる。
意識調査では匿名加工情報の名称だけ知っている人が12%で、84%は知らなかった。調査を主導した中林紀彦理事(SOMPOホールディングスチーフデータサイエンティスト)は「認知度は半数を想定していたが結果は3・8%。読み違えた」と明かす。データ活用は賛成が18%で、反対は24%、どちらでもないが57%だった。災害研究利用への賛同率は44%。33%は一般的な活用意義を認めつつも自分のデータは使ってほしくない。残りの23%は反対だ。公共性の高い活用事例も半数から支持されていない。
コスト想定以上
問題は、アンケートを通して匿名加工情報について説明したものの、回答者に理解されているとは考えにくい点だ。匿名加工について市民が理解し、信頼を広げるためには想定以上のコストがかかる可能性がある。ひかり総合法律事務所(東京都港区)の板倉陽一郎弁護士は「調査であらためて聞かれると(データの流用は)嫌だという反応だ。自分で匿名加工を体験すれば自分のデータがほぼ残っていないことが分かるはず」と指摘する。
現状では匿名加工情報は匿名化の手間がかかり、“価値は低いものの風評リスクのあるデータ”ということになる。匿名加工情報を他社から買うよりも、自社のサービスを通して許諾を得たデータを活用する方が安全だ。データ流通では暗号下で解析する秘密計算技術も注目されているが、中林理事は「技術によらず、二次利用すべてが反発されうる」と指摘する。
危機感伝える
このままではデータを囲い込む方が合理的で、信頼性のある自由なデータ流通の実現は不透明になる。草野代表は「協会としてはネガティブな結果だが、危機感を伝える必要がある」と強調する。協会としては理解した人の受容性と理解してもらうためのコストを明らかにし、教材を作り普及コストを引き下げる必要がある。中林理事は「学校教育で教えるなど、国の力を借りないといけない規模の問題だ」と話す。
日刊工業新聞2019年7月18日