
Proof Newsの調査により、YouTubeがプラットフォームから許可なく素材を収集することを禁止しているにもかかわらず、Apple、Nvidia、Anthropicなどが何千本ものYouTube動画の素材を使用してAIをトレーニングしていたことが判明した。
WiredのAnnie GilbertsonとAlex Reisner
:
ハイテク企業は、大量のデータを必要とする人工知能モデルに情報を与えるために、作成者に知られずに書籍、ウェブサイト、写真、ソーシャルメディアの投稿を吸い上げるという物議を醸す戦術を採用している。
私たちの調査により、48,000以上のチャンネルから抜き出された173,536本のYouTube動画の字幕が、Anthropic、Nvidia、Apple、Salesforceなどシリコンバレーの大手企業によって使用されていたことが判明しました。
「YouTube字幕」と呼ばれるこのデータセットには、カーンアカデミー、MIT、ハーバード大学などの教育・オンライン学習チャンネルの動画トランスクリプトが含まれています。ウォール・ストリート・ジャーナル、NPR、BBCの動画もAIの学習に使用されました。また、「レイト・ショー・ウィズ・スティーヴン・コルベア」、「ラスト・ウィーク・トゥナイト・ウィズ・ジョン・オリバー」、「ジミー・キンメル・ライブ」も同様です。
Proof Newsは、YouTube界の大物スターによるコンテンツも発見しました。その中には、MrBeast(登録者数2億8,900万人、トレーニング用に2本の動画を撮影)、Marques Brownlee(登録者数1,900万人、7本の動画を撮影)、Jacksepticeye(登録者数約3,100万人、377本の動画を撮影)、PewDiePie(登録者数1億1,100万人、337本の動画を撮影)などがいます。AIのトレーニングに使用されたコンテンツの中には、「地球平面説」などの陰謀論を助長するものもありました。
データセットの作成者であるEleutherAIの代表者は、ビデオが許可なく使用されたという主張を含むProofの調査結果についてのコメント要請に応じなかった…EleutherAIが発表した研究論文によると、データセットは、非営利団体が公開したPileと呼ばれる編集物の一部である…Pileのデータセットのほとんどは、十分なスペースとコンピューティングパワーを持つインターネット上の誰でもアクセスでき、公開されている。
このリンクからAmazonで買い物をすることで、MacDailyNewsを無料でサポートできます。
MacDailyNewsの
見解: YouTubeの字幕データをダウンロードしたのはAppleではなくEleutherAIのようです。Appleは記事掲載時点でWiredのコメント要請に回答していなかったため、Apple、Anthropic、Nvidiaなどは、YouTubeの字幕がデータセットに含まれていることを知らなかった可能性があります。生成AIには大量のデータが必要であり、明らかに「ワイルド・ウェスト」段階にあります。
Proof Newsは、YouTube動画を検索して生成AIのトレーニングに使用された動画を特定できるツールを提供しています。MacDailyNewsへのご支援を
お願いいたしますこちらをクリックまたはタップして、私たちの独立したテクノロジーブログを応援してください。ありがとうございます!
このリンクを使用して Amazon で買い物をすると、追加費用なしで MacDailyNews をサポートできます。
iOS 26.1 の 2 番目のベータ版では、Apple は iPhone のアラームを再設計し、以前のバージョンと比べてアラームを解除しにくくなりました…
トロフィーを追い求め、王朝を築き、チャンピオンを決める難しい決断を下す Football Manager 26 Touch が、Apple Arcade に帰ってきます…
アップルは火曜日、「ブルースクリーン・オブ・デス」と題した新しい広告を公開した。これは昨年発生したWindowsコンピュータの重大なクラッシュを揶揄したもので…
ロンドン警察は、盗難iPhone4万台を中国に密輸した疑いのある犯罪組織を壊滅させた。これは同組織による過去最大のiPhone窃盗事件となった。
Appleは本日、iOS 26.1、iPadOS 26.1、macOS Tahoe 26.1、tvOS 26.1、watchOS 26.1、visionOS 26.1の2番目のベータ版を開発者向けにリリースしました…