フェイク動画はユーモアとして作られることがほとんどだが、有名人、あるいは一般人の名誉を傷つけたり、本人のものでない発言が広がったりといった実害の及ぶケースもある。
ディープフェイクが社会や個人に与える実害を危惧したGoogleは、これに対抗するための取り組みの一環としてデータセットを公開した。
・リアルな撮影からディープフェイクバージョンを制作
Googleは同社の社会課題解決部門「Jigsaw」と共同で、リアル/フェイクの動画を制作。この1年間で、俳優に出演してもらってたくさんのビデオを録画した。こうした録画素材からネット上にある技術を用いて、何千本ものディープフェイクバージョンを制作したようだ。記事では、俳優の顔をランダムに入れ替えたGIF画像が確認できるが、どれも自然そのもの。また、上下に配置されたリアル/フェイクのGIF画像を見ると、俳優によってリアルとフェイクのギャップの大きさに差があるのがわかる。
このデータセットは、ミュンヘン工科大学とフェデリコ2世ナポリ大学によるフェイク動画の評価「FaceForensicsベンチマーク」に組み込まれた。
・音声や動画のデータセットは無料で活用できる
Googleは昨年発表したAI原則のなかで、AI悪用による被害を軽減すべく、ベストプラクティスの開発にコミットしており、すでに合成音声のデータセットを公開している。合成音声のデータセットや今回公開された合成ビデオのデータセットは、音声や動画がAIによるものか判定する検出器の開発に活用できる。
ディープフェイク技術は急速に進化していることから、Googleはデータセットを順次追加していくとのことだ。
参照元:Contributing Data to Deepfake Detection Research/Google AI Blog