AIを活用したサービスやシステムが高いパフォーマンスを発揮するには、大量の学習用データを集めることが必要になります。そのため、学習用データの内容によっては、単一の企業や組織では十分なデータを集められず、高い精度を持った学習モデルを作成することが難しい傾向があります。
その一方で、複数の組織が共同でデータを集めて学習モデルを作成する場合には、個人情報や企業の非公開情報などの機密性の高いデータの扱いが課題になり、データの適切な保護や、個人情報保護法等の法令やガイドラインの遵守に対応する必要があります。
このような複数組織で連携するデータ解析における課題を解決するのがプライバシー保護連合学習技術『DeepProtect』です。DeepProtectは、複数の組織が持つデータセットを互いに秘匿し、プライバシーや機密性を保ったままに共同でディープラーニングを行うことが可能です。
- movie
- プライバシー保護連合学習システム DeepProtect
structureDeepProtectのしくみ
⾦融機関の不正取引検知の例
DeepProtectは、連合学習(Federated Learning)という機械学習の手法に暗号技術を融合して実現した国立研究開発法人情報通信研究機構(NICT)の独自のプライバシー保護技術です。
まず、各組織は各自のデータをディープラーニングによって学習し、それぞれ学習モデルを作成していきます。
次に、各組織内で更新された学習モデルの差分パラメータ(勾配情報)を暗号化した上でそれぞれアップロードし、中央サーバに集約します。中央サーバに送られるのは差分のパラメータのみであり、各組織内のデータはアップロードされず、それぞれの組織内に留まります。
さらに、各組織から中央サーバにアップロードされたそれぞれの差分のパラメータは、秘密計算技術(準同型暗号技術等)によって復号されずに暗号化されたまま統合、中央サーバは学習モデルを更新します。各組織はこの学習モデルをダウンロードし、各自の学習モデルを更新していきます。このサイクルを繰り返すことで、精度の高い学習モデルを共同で構築し、各組織内のデータ解析に適用することができます。
一連の流れの中で唯一外部に送信される差分パラメータは暗号化されたまま処理されるため、データの機密性やプライバシーを保ちつつ、複数機関が共同して学習モデルを構築することが可能となります。
- movie
- DeepProtectを使った⾦融機関の不正取引検知
- interview
- DeepProtectインタビュー:個人情報など機密性の高いデータを開示せずに、複数組織で共同のデータ解析が可能に