IoT時代に大量流通する「データ」取り扱いの難しさに商機あり
ベンチャーが狙う
IoT(モノのインターネット)が実現すると大量のデータが流通する。人間や産業機械など、さまざまなモノがデータ源となるが、最もデータを吐き出すと期待されるモノが自動車だ。課題はデータの品質やコスト、データを学習した人工知能(AI)の判断寿命が明らかになっていない点だ。そして走行データには個人情報が含まれ、データの取り扱いを難しくしている。これを商機に変えるベンチャーを追った。
「“抜け”や“ずれ”でデータはいとも簡単に価値を失う」とアプトポッド(東京都新宿区)の坂元淳一社長は指摘する。インターネットでデータを収集すると通信が途切れてデータが抜け落ちる。欠損部分を回収して、直さないとデータが意味をなさなくなる。ただ垂れ流すだけでは通信料がかかり、お金を払って捨てるのと同じことになってしまう。
アプトポッドは複数の車載機器のデータを高精度に時刻同期し、欠損部を回収して再構成する技術を持つ。車載端末を有線でつないで同期し、車載ネットワーク(CAN)のデータをネット経由でクラウドに吸い上げる。
機器間通信用のプロトコル「MQTT」は欠損回収処理を加えると通信容量の増加につれて遅延も大きくなる。そこで独自に通信プロトコルを開発。通常のネット回線で時系列が整ったデータを回収する環境を構築した。
マイクロ秒オーダー(マイクロは100万分の1)で同期して時系列を正しく保てると、複数の部品が連動して動作する様子を追跡できる。例えばモーターからエンジンに推進力を切り替える際にノイズが生じる。切替時間は100分の1秒。この瞬間のノイズ波形や連鎖順から不具合の原因を究明できる。データとAIの寿命も問題だ。データをAIに学習させた後に環境が変化すると、AIの判断精度は劣化していく。定期的に環境変化を学習し直す必要がある。
対策として複数の車両からクラウドにデータを集め、車載AIとクラウドAIの判断結果を照合し続ける仕組みが要る。AIの性能を監視して更新する。
坂元社長は「AIはエッジとクラウドのハイブリッド型が有力。二つをつなぐデータの品質は重要になる」と強調する。
車両の運用効率化が目的であっても、走行データには個人情報が含まれる。走行ルートから自宅と職場がわかれば個人を特定できてしまう。
MaaS(乗り物のサービス化)で、コンテンツや電子商取引(EC)などと、データをひも付けるならプライバシーへの配慮は欠かせない。だが個人情報の取り扱いは事業者にとって負担になっていた。
アセンブローグ(東京都千代田区)は個人が自分で自分のデータを管理するPLR(個人生活録)システムを提供する。東京大学の橋田浩一教授の研究を基に事業化した。
まずは個人情報の取り扱いに悩む中小交通事業者への導入を目指す。ドライブレコーダーのカメラで運転手が誰か個人識別し、ウエアラブル端末などのバイタルデータと合わせて疲労度を推定する。
顔写真やバイタルデータはPLRで運転手が自分で管理する。個人識別や疲労度推定のAIはクラウドに置き、PLRから都度必要な情報を提供する。クラウドには個人情報を残さない。
アセンブローグの青井正三社長は「数人から数十人のタクシーやトラック会社には個人情報は負担。PLRで個人情報を管理する必要のない環境をつくる」と話す。
アセンブローグがPLR、東海クラリオン(名古屋市中区)がドラレコ、elpis(エルピス、名古屋市同)がAIを提供し、菱電商事が拡販する。
エルピスの小堀雄樹氏は「顔写真は個人の識別に使うAI用パラメーターのみを保管する。毎日、個人を識別しても顔写真はもたなくてすむ」と説明する。
自分で自分のデータを管理すると医療や見守りなどの他のサービスに使える。疲労推定用の睡眠データは健康管理に有用だ。
菱電商事などは車とヘルスケアを組み合わせたサービスの実証実験を始める。菱電商事の千原均常務執行役員は「MaaSなど新しいビジネスが生まれつつある。だがその多くが個人情報の壁にぶつかるだろう。PLRを解決策としてMaaSを実現したい」と力を込める。
●AIの寿命判断:人工知能(AI)にデータを学習させた後に、環境が変化してデータが実環境からずれると、AIの性能が徐々に落ちていく問題。例えばクールビズの前にビジネスマン識別AIを作成してネクタイが識別因子である場合、ビジネスマンがネクタイをしなくなると識別精度が落ちる。産業機械の異常検知では、交換部品の製造方法が変わり故障モードが変わると性能が下がる。シーンごとに環境変化の速度がまちまちで、性能を保証できる期間を一概に決められない。自動運転などの極稀なシーンでも安全性が求められる用途では補完する仕組みが必要だった。>
自動車が生成するデータには個人情報を多分に含んでいる。データの取り扱いを難しくし、データ活用の障壁になっている。パーソナルデータや位置情報など、6府省庁の情報系検討会で委員を務める佐藤一郎国立情報学研究所教授に聞いた。
―GPSで走行ルートから自宅と職場がわかれば個人を特定できます。個人情報保護がデータ活用の壁となるため、匿名化などのデータ加工技術で個人情報を回避する道が模索されてきました。
「データを活用するにはユーザーから同意を得るのが原則だ。事業者がユーザーに使用目的を説明し、信頼される努力を惜しんではいけない。2017年の個人情報保護法改正で導入された匿名加工は同意が得られない場合の例外的な措置として検討されて、導入されたデータ類型だ。しかし、匿名化すれば利活用の資する情報も減る。銀の弾丸(ソフトウエアエンジニアリングにおける魔法のつえ)はない。」
―匿名加工情報の認知度は16%で、匿名加工されていても自分の情報を使用してほしくないと考える人が6-7割います。
「2017年の法改正以前、旧法が技術進歩と合わなかったが、一部の法律家は匿名化が銀の弾丸に見えてしまった。この結果、匿名化をすれば個人情報保護とデータ活用が両立すると信じ、個人情報保護法の改正が遅れたところがある。昨今、注目されているのが秘密計算だが、四則演算ができるようになったのが、この10年とまだまだ学術研究の段階である。このため、相当チューニングしないと実用的な速度では計算できない。『新技術ですべて解決』と考えてしまうと、匿名化への過度な期待と同様の問題を引き起こす」
―データ活用の同意を顧客からとるのは企業にとってハードルが高くありませんか。
「日本では同意をとらずに個人情報の目的外利用を望む声が大きいが、海外では目的を変えたら同意を取り直すことが多い。実際、巨大IT企業はサービスのプライバシーポリシーを頻繁に更新している。サービスを改善するために必要なデータを、目的を説明して取得する。この努力をおろそかにしてはいけない。そもそもデータは利用目的に応じて集めるものであり、それ以外の目的に利用しても適切に利用できるとは限らない」
―それでは、技術やインフラを持つ企業よりも、サービスを提供して広く顧客接点を持っている企業にデータが集まります。巨大なIT産業を持つ国が競争優位になります。
「同意が得られるかは事業者が個人から信頼されているか、それも現時点だけでなく、将来にわたってその企業を信じて託せるかにかかっている。インフラであっても、サービスであっても信頼されていなければデータ活用の同意は得られない。データは一度流出すれば回収できないことから、電子決済の例を見るように一度信頼を失えば,顧客は個人情報を事業者に出さなくなり、サービスが存続し得なくなることになる。事業者は丁寧に個人情報の利用目的を説明して、その範囲で利用して、漏洩などを防ぐための安全管理措置をとるしかない」
―手詰まり感がありませんか。
「現在、個人情報やプライバシー情報は取得者と利用者が一致するとは限らない。つまり、個人情報にはその本人以外にも多様な利害関係者がおり、マルチステークホルダーとなりやすく、それをステークホルダー間の権利や利害関係を整理しないと、利活用できない。巨大IT企業などのプラットフォーマーは、できる限り1社でサービスを開発して提供することで、利害関係者を減らしてマルチステークホルダーによる問題を回避してきた。巨大IT企業が育たなかった日本の活路は、マルチステークホルダー間の権利や利害関係を丁寧に解くことだ。それは簡単なことではないが、ステークホルダーたちの関係を整理して、みなが納得した形で利益を再配分する状況を作れれば、巨大IT企業に対抗する下地が作れるはず。簡単にはいかないが、近江商人の三方よしの精神などの例がある」
―「売り手よし、買い手よし、世間よし」の精神は江戸時代の個人事業主の理想です。当時の世間は民主主義ですらありません。個人情報にかかわるステークホルダーは人口の数だけいます。縮小均衡の中でマルチステークホルダー問題が解けた例がありますか。
「無理だと考えるか、そこにチャンスを見いだすか。銀の弾丸を追い求めるよりも正面から向き合うべきだ。ステークホルダー間の権利や利害関係の調整は自動化する余地もあるだろう」
―現状の個人は、自分がどんなデータの源であるか理解する人は少なく、事業者が提供するサービスに相対でデータ提供を許しているにすぎません。サービスの内容に応じてデータの開示量を個人がその都度調整するとなると、データ処理が複雑で膨大になりませんか。開示するデータの種類や期間に応じて取り扱いを変えていかないといけません。
「いまは高度なデータ分析やAIを事業者が使っているが、今後は個人でも使われる時代になるだろう。そのデータ処理量はネット広告の高速かつ大量データ処理と比べて大きいとはいえないはず。それに合わせて事業者の情報処理の方法も商品やサービス単位から個人単位に移行することでサービスがパーソナライズされて内容が変わりうる。その結果、サービスや商品の値段が、タイミングや取引相手によって変わることもあるだろう」
―人によって価格が変動すると不公平感を招きます。
「一物一価の仕組みはスーパーなどの小売りの業態やレジスターを成立させるために生まれてきた。中東や東南アジアなどでは商品に値段がついておらず、都度交渉して買う。値引き交渉は当たり前で、一物一価がすべてではないのも現実だ。現在の小売事業者は、商品を単位に情報システムを構築しているが、それが顧客ごとに変わると、いいか悪かは別にして、価格付けの多様化は可能になってしまう」
―個人が自分でデータの開示量を選択できれば、マルチステークホルダー問題に参加しているともいえます。自分のデータを自分で管理するパーソナルデータストア(PDS)や情報銀行のビジネスとして解決できませんか。
「残念ながら、個人情報に限らず、データの経済的な価値が定まるほど、社会が成熟していない。貨幣や銀行の歴史を振り返ると、銀行に相当する経済活動が成立するのは貨幣制度が整ってからだ。現在は物々交換のレベルにある。個人情報を出す代わりに、データにかかわるサービスを受けるという前近代的な段階だ。情報銀行を含むPDSが成立するには時代が早すぎるだろう。また現状のPDSは、個人が複数のPDSを使い分けて、PDS間で情報をやりとりすることを想定していない。個人情報にかかわるステークホルダーを整理し、データ活用について説明して同意をとる中で社会が成熟していくだろう」(文=小寺貴之)
データの抜け・ずれ防ぐ
「“抜け”や“ずれ”でデータはいとも簡単に価値を失う」とアプトポッド(東京都新宿区)の坂元淳一社長は指摘する。インターネットでデータを収集すると通信が途切れてデータが抜け落ちる。欠損部分を回収して、直さないとデータが意味をなさなくなる。ただ垂れ流すだけでは通信料がかかり、お金を払って捨てるのと同じことになってしまう。
アプトポッドは複数の車載機器のデータを高精度に時刻同期し、欠損部を回収して再構成する技術を持つ。車載端末を有線でつないで同期し、車載ネットワーク(CAN)のデータをネット経由でクラウドに吸い上げる。
機器間通信用のプロトコル「MQTT」は欠損回収処理を加えると通信容量の増加につれて遅延も大きくなる。そこで独自に通信プロトコルを開発。通常のネット回線で時系列が整ったデータを回収する環境を構築した。
マイクロ秒オーダー(マイクロは100万分の1)で同期して時系列を正しく保てると、複数の部品が連動して動作する様子を追跡できる。例えばモーターからエンジンに推進力を切り替える際にノイズが生じる。切替時間は100分の1秒。この瞬間のノイズ波形や連鎖順から不具合の原因を究明できる。データとAIの寿命も問題だ。データをAIに学習させた後に環境が変化すると、AIの判断精度は劣化していく。定期的に環境変化を学習し直す必要がある。
対策として複数の車両からクラウドにデータを集め、車載AIとクラウドAIの判断結果を照合し続ける仕組みが要る。AIの性能を監視して更新する。
坂元社長は「AIはエッジとクラウドのハイブリッド型が有力。二つをつなぐデータの品質は重要になる」と強調する。
自分のデータ、自分で管理
車両の運用効率化が目的であっても、走行データには個人情報が含まれる。走行ルートから自宅と職場がわかれば個人を特定できてしまう。
MaaS(乗り物のサービス化)で、コンテンツや電子商取引(EC)などと、データをひも付けるならプライバシーへの配慮は欠かせない。だが個人情報の取り扱いは事業者にとって負担になっていた。
アセンブローグ(東京都千代田区)は個人が自分で自分のデータを管理するPLR(個人生活録)システムを提供する。東京大学の橋田浩一教授の研究を基に事業化した。
まずは個人情報の取り扱いに悩む中小交通事業者への導入を目指す。ドライブレコーダーのカメラで運転手が誰か個人識別し、ウエアラブル端末などのバイタルデータと合わせて疲労度を推定する。
顔写真やバイタルデータはPLRで運転手が自分で管理する。個人識別や疲労度推定のAIはクラウドに置き、PLRから都度必要な情報を提供する。クラウドには個人情報を残さない。
アセンブローグの青井正三社長は「数人から数十人のタクシーやトラック会社には個人情報は負担。PLRで個人情報を管理する必要のない環境をつくる」と話す。
アセンブローグがPLR、東海クラリオン(名古屋市中区)がドラレコ、elpis(エルピス、名古屋市同)がAIを提供し、菱電商事が拡販する。
エルピスの小堀雄樹氏は「顔写真は個人の識別に使うAI用パラメーターのみを保管する。毎日、個人を識別しても顔写真はもたなくてすむ」と説明する。
自分で自分のデータを管理すると医療や見守りなどの他のサービスに使える。疲労推定用の睡眠データは健康管理に有用だ。
菱電商事などは車とヘルスケアを組み合わせたサービスの実証実験を始める。菱電商事の千原均常務執行役員は「MaaSなど新しいビジネスが生まれつつある。だがその多くが個人情報の壁にぶつかるだろう。PLRを解決策としてMaaSを実現したい」と力を込める。
インタビュー/国立情報学研究所教授・佐藤一郎氏
自動車が生成するデータには個人情報を多分に含んでいる。データの取り扱いを難しくし、データ活用の障壁になっている。パーソナルデータや位置情報など、6府省庁の情報系検討会で委員を務める佐藤一郎国立情報学研究所教授に聞いた。
―GPSで走行ルートから自宅と職場がわかれば個人を特定できます。個人情報保護がデータ活用の壁となるため、匿名化などのデータ加工技術で個人情報を回避する道が模索されてきました。
「データを活用するにはユーザーから同意を得るのが原則だ。事業者がユーザーに使用目的を説明し、信頼される努力を惜しんではいけない。2017年の個人情報保護法改正で導入された匿名加工は同意が得られない場合の例外的な措置として検討されて、導入されたデータ類型だ。しかし、匿名化すれば利活用の資する情報も減る。銀の弾丸(ソフトウエアエンジニアリングにおける魔法のつえ)はない。」
―匿名加工情報の認知度は16%で、匿名加工されていても自分の情報を使用してほしくないと考える人が6-7割います。
「2017年の法改正以前、旧法が技術進歩と合わなかったが、一部の法律家は匿名化が銀の弾丸に見えてしまった。この結果、匿名化をすれば個人情報保護とデータ活用が両立すると信じ、個人情報保護法の改正が遅れたところがある。昨今、注目されているのが秘密計算だが、四則演算ができるようになったのが、この10年とまだまだ学術研究の段階である。このため、相当チューニングしないと実用的な速度では計算できない。『新技術ですべて解決』と考えてしまうと、匿名化への過度な期待と同様の問題を引き起こす」
―データ活用の同意を顧客からとるのは企業にとってハードルが高くありませんか。
「日本では同意をとらずに個人情報の目的外利用を望む声が大きいが、海外では目的を変えたら同意を取り直すことが多い。実際、巨大IT企業はサービスのプライバシーポリシーを頻繁に更新している。サービスを改善するために必要なデータを、目的を説明して取得する。この努力をおろそかにしてはいけない。そもそもデータは利用目的に応じて集めるものであり、それ以外の目的に利用しても適切に利用できるとは限らない」
―それでは、技術やインフラを持つ企業よりも、サービスを提供して広く顧客接点を持っている企業にデータが集まります。巨大なIT産業を持つ国が競争優位になります。
「同意が得られるかは事業者が個人から信頼されているか、それも現時点だけでなく、将来にわたってその企業を信じて託せるかにかかっている。インフラであっても、サービスであっても信頼されていなければデータ活用の同意は得られない。データは一度流出すれば回収できないことから、電子決済の例を見るように一度信頼を失えば,顧客は個人情報を事業者に出さなくなり、サービスが存続し得なくなることになる。事業者は丁寧に個人情報の利用目的を説明して、その範囲で利用して、漏洩などを防ぐための安全管理措置をとるしかない」
―手詰まり感がありませんか。
「現在、個人情報やプライバシー情報は取得者と利用者が一致するとは限らない。つまり、個人情報にはその本人以外にも多様な利害関係者がおり、マルチステークホルダーとなりやすく、それをステークホルダー間の権利や利害関係を整理しないと、利活用できない。巨大IT企業などのプラットフォーマーは、できる限り1社でサービスを開発して提供することで、利害関係者を減らしてマルチステークホルダーによる問題を回避してきた。巨大IT企業が育たなかった日本の活路は、マルチステークホルダー間の権利や利害関係を丁寧に解くことだ。それは簡単なことではないが、ステークホルダーたちの関係を整理して、みなが納得した形で利益を再配分する状況を作れれば、巨大IT企業に対抗する下地が作れるはず。簡単にはいかないが、近江商人の三方よしの精神などの例がある」
―「売り手よし、買い手よし、世間よし」の精神は江戸時代の個人事業主の理想です。当時の世間は民主主義ですらありません。個人情報にかかわるステークホルダーは人口の数だけいます。縮小均衡の中でマルチステークホルダー問題が解けた例がありますか。
「無理だと考えるか、そこにチャンスを見いだすか。銀の弾丸を追い求めるよりも正面から向き合うべきだ。ステークホルダー間の権利や利害関係の調整は自動化する余地もあるだろう」
―現状の個人は、自分がどんなデータの源であるか理解する人は少なく、事業者が提供するサービスに相対でデータ提供を許しているにすぎません。サービスの内容に応じてデータの開示量を個人がその都度調整するとなると、データ処理が複雑で膨大になりませんか。開示するデータの種類や期間に応じて取り扱いを変えていかないといけません。
「いまは高度なデータ分析やAIを事業者が使っているが、今後は個人でも使われる時代になるだろう。そのデータ処理量はネット広告の高速かつ大量データ処理と比べて大きいとはいえないはず。それに合わせて事業者の情報処理の方法も商品やサービス単位から個人単位に移行することでサービスがパーソナライズされて内容が変わりうる。その結果、サービスや商品の値段が、タイミングや取引相手によって変わることもあるだろう」
―人によって価格が変動すると不公平感を招きます。
「一物一価の仕組みはスーパーなどの小売りの業態やレジスターを成立させるために生まれてきた。中東や東南アジアなどでは商品に値段がついておらず、都度交渉して買う。値引き交渉は当たり前で、一物一価がすべてではないのも現実だ。現在の小売事業者は、商品を単位に情報システムを構築しているが、それが顧客ごとに変わると、いいか悪かは別にして、価格付けの多様化は可能になってしまう」
―個人が自分でデータの開示量を選択できれば、マルチステークホルダー問題に参加しているともいえます。自分のデータを自分で管理するパーソナルデータストア(PDS)や情報銀行のビジネスとして解決できませんか。
「残念ながら、個人情報に限らず、データの経済的な価値が定まるほど、社会が成熟していない。貨幣や銀行の歴史を振り返ると、銀行に相当する経済活動が成立するのは貨幣制度が整ってからだ。現在は物々交換のレベルにある。個人情報を出す代わりに、データにかかわるサービスを受けるという前近代的な段階だ。情報銀行を含むPDSが成立するには時代が早すぎるだろう。また現状のPDSは、個人が複数のPDSを使い分けて、PDS間で情報をやりとりすることを想定していない。個人情報にかかわるステークホルダーを整理し、データ活用について説明して同意をとる中で社会が成熟していくだろう」(文=小寺貴之)
日刊工業新聞2019年8月15日