Google は 1 年以上にわたり、サンフランシスコの AI スタートアップ OpenAI が提供する目を見張るようなチャットボットである ChatGPT に匹敵するテクノロジーの構築を競い続けてきました。
水曜日、ハイテク巨人は進行中の競争で新たな一歩を踏み出し、チャットボットの新バージョンである Google Bard を発表した。 更新されたボットは、米国を含む 170 以上の地域と国の英語話者に直ちに利用可能となり、同社が年初から開発してきた Gemini と呼ばれる新しい AI テクノロジーを搭載しています。
「これは双子座時代の始まりだ」とグーグルのサンダー・ピチャイ最高経営責任者(CEO)はインタビューで語った。 「これは、当社の人工知能研究所であるGoogle DeepMindを設立したときに私たちが抱いていたビジョンの実現です。Googleは今後数カ月以内に、この技術の3つの異なるバージョンを幅広い製品やサービスに展開する予定です」と同氏は述べた。
Google DeepMindを率いるピチャイ氏とデミス・ハサビス氏によると、GeminiはGoogleのこれまでのチャットボット技術よりも強力で、より正確な応答を生成でき、状況によっては人間の推論の模倣に近づくことができるという。
「私たちはジェミニのパフォーマンスに非常に満足しています」とハサビス博士は語った。
昨年末、OpenAI が AI を活用した ChatGPT チャットボットで世界を驚かせたとき、Google は唖然としました。 テクノロジー大手は同様のテクノロジーの開発に何年も費やしてきたが、他のテクノロジー大手(特にメタ社)と同様に、偏った情報、虚偽の情報、有害な情報を生成する可能性のあるテクノロジーのリリースには消極的だった。
Googleは3月、レビューを平均化するためのチャットボット「Bard」をローンチした。 1か月後、同社は2つの人工知能研究所、Google BrainとDeepMindを統合し、2,000人以上の研究者とエンジニアを結集したと発表した。 そして 5 月には、画期的な Google I/O カンファレンスで、Google の新しい DeepMind ラボが Gemini の開発を開始したと発表しました。
2011年にBrain Labを設立した後、Googleは2014年にロンドンのAIスタートアップに6億5000万ドルを支払ってDeepMindを買収した。 DeepMind は 10 年間、Brain Lab やその他の Google からほぼ独立して運営されており、2017 年には同社から撤退しようとさえしました。しかし、Google が OpenAI に追いつくのに苦戦する中、ピチャイ氏はハサビス博士の下で 2 つの研究所を統合しました。 DeepMind の共同設立者。
Googleは、Geminiの最も強力なバージョンがいくつかの主要な領域で最新のOpenAIテクノロジーであるGPT-4を上回ったと主張するベンチマーク結果を発表した。 ピチャイ氏は、これまでのGoogleの技術よりもコンピューターコードの生成が優れており、ニュース記事やその他のテキスト文書をより正確に要約できると述べた。
Gemini は画像や音声を分析するようにも設計されていますが、これらのスキルが Bard チャットボットに組み込まれるのは後ほどになります。
Google は、3 つの異なるスキルセットを備えた 3 つのバージョンの Gemini を構築しました。 最大の Ultra は複雑なタスクを処理できるように設計されており、来年デビューする予定です。 中間層の製品である Pro は、Bard チャットボットを使用して、水曜日からいくつかの Google サービスに展開されます。 小型バージョンのNanoは、水曜日から音声録音の要約やWhatsAppでのテキスト返信の提案など、Pixel 8 Proスマートフォンの一部の機能を強化します。
Gemini は科学者が大規模言語モデル (LLM) と呼ぶもので、電子書籍、ウィキペディアの記事、オンライン掲示板などの大量のデータを分析することでスキルを学習できる複雑な数学システムです。 このすべてのテキストのパターンを識別することで、LLM は独自にテキストを作成することを学習します。 これは、彼が研究論文を書いたり、コンピューター コードを作成したり、会話を続けることさえできることを意味します。
Google は Gemini を通じて、デジタル画像と音声に関するテクノロジーも訓練してきました。 これは研究者が「マルチモーダル」システムと呼ぶもので、画像や音声を分析して応答できることを意味します。 たとえば、線、図形、その他の画像を含む数学の問題を与えると、高校生と同じように答えるかもしれません。
ただし、この技術が消費者に提供されるのは来年のいつかになる。 Google はまた、Gemini も同様のシステムと同様にエラーに対して脆弱であることを認めました。 事実を誤解したり、「幻覚」を起こしたりして、でっち上げることもあります。
他社に AI およびコンピューティング サービスを提供する Google Cloud は、OpenAI や Microsoft との取引を争う中、顧客に Gemini を提供することに熱心でした。 OpenAIが先月、同社CEOのサム・アルトマン氏を短期間辞任に追い込み、同社を途方に暮れた後、Google Cloudはライバルの顧客を引き抜くために移行計画を作成した。
顧客は現在の OpenAI 価格と同じ価格を Google に支払い、クラウド クレジットや割引を受けることができます。
Googleは、クラウド顧客は12月13日に中間層製品であるGemini Proにアクセスできるようになるだろうと述べた。 ピチャイ氏は、何人かの見知らぬ人が現在、テクノロジーの最も強力なバージョンであるジェミニ・ウルトラをテストしていると述べた。
Googleは過去1年間、AIの主導権をOpenAIから取り戻すべく競い合ってきたが、市場にはすべてのAIプロバイダーにとって十分な余地があるとピチャイ氏は語った。
「これはゼロサムゲームとは程遠い」とピチャイ氏は語った。 「私たちは、これから立ち上げようとしているものに興奮を感じています。また、フォローアップで進捗が確認できるため、まだ初期段階にあることも認識しています。
“Analyst. Television trailblazer. Bacon fanatic. Internet fanatic. Lifetime beer expert. Web enthusiast. Twitter fanatic.”
More Stories
PS5 Proは数週間以内に発表されるのは確かのようだ
リークにより、疑惑のPS5 Proデバイスの名前とデザインが明らかに
Apple、最新の iOS アップデートで写真内の AI オブジェクト除去を導入