いいえ、Apple IntelligenceはYouTube動画の文字起こしや字幕で訓練されていません

Apple が人工知能 (AI) モデルをトレーニングするために YouTube の動画と字幕を収集したという推測は誤りです。その理由は次のとおりです。

カラフルなグラデーションの背景に、2台のMacラップトップとApple Studio DisplayでiPhoneミラーリング、Safariビューア、ゲームモードを展示 — Apple Intelligenceは盗まれたデータについて訓練されていなかった |画像: Christian Zibreg/iDB/Apple

Appleは、AppleやNvidiaなどの企業がAIの学習のために何千ものYouTube動画を許可なく収集しているというWired の懸念に対処した。iPhoneメーカーであるAppleは、 9to5Macに対し、今後開発予定の生成AI機能の基盤となるモデルの学習にYouTubeコンテンツを使用していないことを認めた。

4月に、Appleは、開発者がAIコードを共有するHugging Face HubコミュニティとMachine Learning Researchブログで、Open-source Efficient Language Models（OpenELM）と呼ばれる大規模なデバイス内言語モデルをオープンソース化しました。

そして現在、同社は9to5Macに対し、OpenELM は研究目的でのみ使用しており、これらのモデルを Apple Intelligence に組み込んでいないことを明らかにしている。

「Appleは、研究コミュニティに貢献し、オープンソースの大規模言語モデル開発を推進する手段としてOpenELMモデルを作成したと述べている」と同誌は書いている。

Appleのコメントは、 Wired誌の最近の記事に対する反応です。同誌は調査を行い、「48,000以上のチャンネルから抜き出された173,536本のYouTube動画の字幕が、Anthropic、Nvidia、Apple、Salesforceといったシリコンバレーの有力企業によって使用されていた」ことを明らかにしました。

YouTube 字幕データセットには、人気の教育チャンネル、BBC や NPR などのニュースメディア、MKBHD、MR. Beast、PewDiePie などの YouTube パーソナリティ、Last Week Tonight With John Oliver、Jimmy Kimmel Live、The Late Show With Stephen Colbert などのテレビ番組の動画の文字起こしが含まれています。

それで、ここでは一体何が起こっているのでしょうか?

端的に言うと、問題の企業は自らこのコンテンツをスクレイピングしたわけではありません。代わりに、これらの業界関係者はEleutherAIという別の企業にYouTube字幕データセットの作成を委託しました。

Apple はこのデータセットを OpenELM の開発中にのみ使用しましたが、それでも EleutherAI が YouTube コンテンツを許可なく使用したという事実は変わりません。

これは、Appleが許可なくオンラインデータを収集したことを意味するものではありません。同社が以前明らかにしたように、Apple Intelligenceモデルはライセンス供与されたデータを用いてトレーニングされました。

同社は、これには「特定の機能を強化するために選択されたデータと、当社のウェブクローラーであるAppleBotによって収集された公開データ」が含まれると明言し、Appleのサポートページで説明されているように、パブリッシャーはサイトのrobots.txtファイルに適切なものを追加することで簡単にこれをオプトアウトできると付け加えた。