Googleが発表したばかり これにより、ウェブサイト発行者は、自社のデータが Google 検索を通じてアクセスできる一方で、自社の AI モデルのトレーニングに使用されることをオプトアウトする方法が提供されます。 新しいツールの名前は、 Google拡張、次のようなクローラーによってサイトが引き続きスクレイピングされ、インデックス付けされるようになります。 Googleボット 一方で、自社の現在および将来の AI モデルのトレーニングにデータを使用することは避けています。
同社は、Google-Extending によりパブリッシャーは「自社のサイトが改善に役立つかどうかを管理できる」と述べている。 寒い そして 頂点人工知能 「生成API」と同氏は述べ、ウェブパブリッシャーはこのスイッチを「サイト上のコンテンツへのアクセスを制御する」ために使用できると付け加えた。Googleは7月、同社のチャットボット「Bard」をウェブから収集した公開データに基づいてトレーニングしていることを認めた。
Google-Extending は、robots.txt ファイルを通じて利用できます。このファイルは、Web クローラーに特定のサイトにアクセスできるかどうかを伝えるテキスト ファイルとしても知られています。 Googleは、「AIアプリケーションの拡大に伴い」「ウェブパブリッシャー向けの選択と制御のための追加の機械読み取り可能な方法」を引き続き模索し、近いうちにさらに多くの情報を共有する予定であると述べている。
すでに、いくつかのサイトが OpenAI がデータ抽出と ChatGPT のトレーニングに使用する Web クローラーをブロックするよう移行しています。 ニューヨーク・タイムズ、 CNN、 ロイター、 そして 調停。 しかし、Googleをどのように禁止するかについては懸念がありました。 結局のところ、ウェブサイトは Google のクローラーを完全にシャットダウンすることはできません。そうしないと、検索でインデックスに登録されなくなります。 これにより、次のようないくつかのサイトが誕生しました。 の ニューヨークタイムズ、l 法的に 企業が AI のトレーニングに Google のコンテンツを使用できないように、サービス利用規約を更新して Google をブロックします。
“Analyst. Television trailblazer. Bacon fanatic. Internet fanatic. Lifetime beer expert. Web enthusiast. Twitter fanatic.”
More Stories
PS5 Proは数週間以内に発表されるのは確かのようだ
リークにより、疑惑のPS5 Proデバイスの名前とデザインが明らかに
Apple、最新の iOS アップデートで写真内の AI オブジェクト除去を導入