DALL-Eは、AIによって生成されたストーリーを使用して、仲間を戦いに導くナイフを振り回すピカチュウのような不安なイラストを作成することができます。
GPT-3やDALL-Eなどの高度なAIモデルは最近大流行しており、後者はテキストプロンプトからAI生成画像を作成することに最近の関心の高まりを引き起こしています。
しかし、これらの画像と高度なテキスト予測を組み合わせることで、不吉な暗い空の下で仲間を戦いに導くナイフを振り回すピカチュウについてのイラスト入り児童書など、非常に精巧で不穏な物語をもたらすことが判明しました。
これは、OpenAIのDALL-EツールとGPT-3自然言語ツールを組み合わせて、幼稚園児のためにポケモンをテーマにしたストーリーを生成したサージAIのエンジニア、エドウィン・チェンによって達成された結果の1つにすぎません。GPT-3は、短いテキストプロンプトのみが与えられたときに空白を埋める忘れられないほど正確な能力で知られており、OpenAIのDavinciは、意図と文脈を理解するのに特に優れているようにモデルを構築しています。アッシュとピカチュウがロケット団と戦争に行くという話を簡単に説明すると、モデルはその後の戦いについての詳細な物語を生み出しました。その後、生成された各行がDALL-Eのプロンプトとして使用され、かなり不安なイラストがいくつか生まれました。
DALL-Eはまだテスト段階にあり、アーティストや研究者の厳選されたリストでのみ利用可能です。しかし、OpenAIのテキストベースの生成ツールは、ウェブサイトで無料アカウントを登録する人なら誰でも利用できます。
チェンのイラスト入りポケモンの物語がソーシャルメディアで巡回し始めた後、他の人は自分の物語を生み出すことに触発されました。これは、マザーボード自身のエドワード・オングウェソによる、ドナルド・トランプのアニメシリーズ「進撃の巨人」への愛についてです。
— Edward Ongweso Jr (@bigblackjacobin) 2022年6月29日
多くのAI研究者や倫理学者にとって、機械学習を使って子供のためのコンテンツを生成するという考えは特に驚くべきことです。GPT-3は性差別的で人種差別的なステレオタイプを強化することが示されており、DALL-Eの背後にある研究者は、ビジネススーツを着た白人男性の画像のみを返すプロンプト「CEO」など、画像生成システムも頻繁に偏った結果を生み出すことを実証しました。
これに対応して、OpenAIのような企業や組織は、生成AIシステムの乱用を防止する主張する緩和策を開発しました。これには、トレーニングデータセットを再重み付けして、システムが通常表示しない画像タイプの頻度を増やすなど、さまざまな方法が含まれます。
結果がどんなに魅力的でかわいくても、AI研究者は、これらのシステムが常に既存の社会的不平等を反映した歪んだ有害なコンテンツを生成するという事実と戦わなければならないでしょう。