【ディープテックを追え】個人情報を保護しながら、データ活用。「差分プライバシー」とは?
LayerX(レイヤーX、東京都中央区)は個人情報の特定を防ぐ事業を始めた。データ流出を避けることで新たなサービスや需要の創出を狙う。中村龍矢執行役員は「個人情報保護の技術で社会課題を解決する」と意気込む。
活用の難しい個人情報
企業や組織の垣根を超えて、データをやりとりすることのメリットは大きい。JR東日本は2022年5月から、駅利用者の入出場情報を匿名化し、自治体や企業に販売するサービスを始めた。このデータを使い、観光施策や商業施設のマーケティングに活用することを想定する。ただ、この事業は13年に一度中止を余儀なくされた。
個人情報を利活用したビジネスの展開が難しい理由は、データオーナーの同意が必要な点に加え、プライバシー保護が難しいという側面がある。氏名やメールアドレスを消した情報であっても、複数の情報と組み合わせることで個人情報を復元できてしまうためだ。統計情報でも、複数の統計情報の差分から特定の情報をあぶり出すことができる。あぶり出した情報とその他のデータを組み合わせることで、匿名化された情報も再構築することができてしまう。
こうした「リンケージ攻撃」のリスクは、インターネット上の情報が増加するにつれて増している。そこで注目されるのが、データを保護しながら活用する技術「プライバシーテック」だ。同技術はデータを細かく分割して計算したり、加工することで特定を防ぐ。レイヤーXは「差分プライバシー」などの手法を組み合わせ、データを保護する。
差分プライバシーとは
差分プライバシーは年収など数値の部分に乱数を加えて、正しいデータを秘匿する。乱数を加えることでリンケージ攻撃などにより個人情報を推測・特定できなくする。また分析に支障がない範囲で、データを加工するため正規の利用者のデメリットは少ない。同様の手法は米国国勢調査局や米アップルの一部サービスなどにも導入されている。レイヤーXはそのほかにも架空のデータを作成する「合成データ」やデータを暗号化したまま計算する「秘密計算」などを組み合わせることで、高度なデータ保護サービスを実現する。
すでに同サービスを使って、あいおいニッセイ同和損害保険と共同で、同社の自動車保険で蓄積した走行データを自治体向けに提供する取り組みを始めた。急ブレーキなどの危険な運転をした場所や時間に加え、契約者の性別や年齢を分析に使う。レイヤーⅩの技術でリンケージ攻撃への耐性を強め、交通安全や都市計画に活用する。中村執行役員は「従来よりも詳細なデータを使うことで、交通安全施策の検証もできる」と利点を話す。
業界横断のシステムを目指す
海外では医療データのデータ保護に強みを持つ、イスラエルのMDクローンのように特定の領域に特化するプライバシーテックのプレイヤーも多い。領域によって分析したいデータの種類やデータ保護のパラメータが異なる。こういった応用研究の幅広さから、一定の領域で技術を活用するプレイヤーが多いのが実情だ。一方レイヤーXでは、特定の分野に特化しないサービス展開を目指す。応用研究やサービス普及のハードルは上がるが、「領域を横断してデータを活用してこそ、新しい価値を生み出せる」(中村執行役員)と想定する。
将来は企業間のデータのやり取りを裏側から支えるソフトウエアとして提供する。マーケティングや電子カルテなどの医療分野で活用する。25年までに顧客企業の売上高で累計100億円を目指す。中村執行役員は「プライバシー領域の新しいテクノロジーは、米国のIT大手が活用できる技術しかない」としたうえで、「我々は彼らがやらない部分を開発していきたい」と話す。今後は応用研究に注力するとしている。
【関連記事】グノシー創業者・福島氏「BtoB決済にペイペイの顧客体験を作る」 〈関連記事〉これまでの【ディープテックを追え】