Google の教科書的な AI 反撃

Google の教科書的な AI 反撃

この記事では、OpenAI との競争に直面して Google が採用した一連の反撃戦略について主に説明します。

Google の巨大な商業領域を考えると、GPT-4o を 1 日前にリリースするだけでは、OpenAI に十分な利点はもたらさないようです。

2024 年の Google I/O カンファレンスで、Google は AI 生成ビデオ、AI 駆動型ワークスペース自動化ツール、製品パフォーマンスが GPT-4o に近い音声アシスタントなど、一連の AI テクノロジーのブレークスルーを実演しました。数多くの AI 製品の発売により、ある意味で「ウルフパック効果」が生まれ、Google が受動的な追い上げの状況を逆転させるのに役立っています。

さらに、Gemini のマルチモーダル機能と Android 15 の AI 強化により、ユーザー エクスペリエンスが向上するだけでなく、Google エコシステムの粘着性も大幅に強化されます。比較すると、OpenAI は技術的には一歩先を進んでいるかもしれませんが、その適用範囲は比較的単一です。

現在、Googleの「巨人流」の反撃はますます鋭くなり、GPT-5のリリース時期について依然として慎重なサム・アルトマン氏にとって、プレッシャーはますます大きくなっている。

1. 巨人の逆襲の教科書第1章:優位性を拡大する

巨大企業の戦略的なレイアウトは、多くの場合、自社の有利な事業を継続的に強化するという前提に基づいています。 Google は検索からスタートし、2024 年の Google I/O カンファレンスの焦点となっている Workspace などの一連のオフィス スイート サービスで優れています。

完璧な AI 検索機能こそ、業界が待ち望んでいるものです。今回Googleが公開したAI概要では、マルチモーダルの問題について多くの取り組みがなされています。

たとえば、「Ask with video」では、Gemini のマルチモーダル機能と Google Lens を組み合わせてビデオ検索を実現します。ビデオを録画するだけで、ユーザーがレコードプレーヤーをどのように使用しているか、カメラをどのように修理しているかを知ることができます。 Google フォトも、簡単な質問を通じて大量の写真から「子どもの長年の水泳学習過程」を見つけ出せる新しい AI 機能「Ask Photos」をリリースしました。

OpenAI はまた、デバイスのカメラを通して見たものを観察して理解し、ユーザーの持ち物がどこにあるかを記憶し、ユーザーが現実世界でアイテムを「検索」するのを手伝ったり、その他のタスクを完了したりできる Project Astra と呼ばれるマルチモーダル AI アシスタントも実演しました。

Google の AI 検索の出力結果は、UR​​L のリストではなく、新しい統合ページになりました。これは、ユーザーの質問に応じて生成されたレポートのようなもので、質問自体の回答だけでなく、ユーザーが見落としている可能性のある質問に対する推測や補足も含まれています。商品形態的にも写真や文章が豊富です。

国内大手企業もAI検索機能の提供を開始しているが、従来の検索ページに生成AIの出力結果を埋め込むだけであり、Webページのスペースは5分の1程度しか使用しておらず、特定の質問に対してしか起動できない。全体的な完成度が低いため、大々的に公開したり宣伝したりはしませんでした。

両者を比較すると、AI 検索における Google の革新性が明らかになります。限られた検索エンジン市場において、これは新たな基準を打ち立てます。長年にわたってモデルが確立されてきた検索広告に関しては、想像の余地がまだあります。

Google は大きなモデル機能をリリースするのではなく、ユーザーの心を再びつかもうとしている。現在、Google の検索は「検索ではなく質問」であり、ユーザー レベルで「質問」を中心に構築された製品コンセプトをさらに改善するマルチモーダル インタラクション メソッドです。

検索の変革はまだ始まりに過ぎません。 Google は、検索がユーザーの AI ニーズを刺激するスーパーポータルになることを期待しています。ユーザーが具体的に何を質問すればよいかわからない場合でも、Google は推奨事項を提示し、ユーザーのブレインストーミングを支援します。このとき、検索インターフェースはさらに変化し、情報フローとなり、各カードをさらに操作できるようになります。

検索に加えて、Google が優位に立っているもう 1 つの領域は Workspace です。 Google は、中国で人気の「デジタル従業員」である AI Teammate に非常によく似た Workspace 向け製品をリリースしました。

まず、Gemini 1.5 Pro は、Workspace のドキュメント、スプレッドシート、スライド、ドライブ、Gmail のサイドバーにすぐに埋め込まれ、日常のビジネス業務のあらゆる側面をカバーします。 Gemini は、ユーザーが一般的な情報ではなく特定のビジネス情報を見つけるのに役立ちます。関連する PDF ファイルを電子メールから直接取得します。領収書を電子メールで整理、管理してアーカイブしたり、領収書から情報を抽出してフォームに追加したりできます。

Gmail アプリに Gemini を追加すると、より詳細で状況に応じた返信の提案も提供されるようになり、ユーザーにメールの要約も提供できるようになります。

同時に、Google は Gemini を Google エコシステムのカレンダー、タスク、Keep と統合し、AI 製品を包括的なデジタル アシスタントにしました。 Google は、情報の正確性を確保するために、Gemini がタスクを実行する前にチェック メカニズムも設定します。 Google アシスタントが他のスマート アシスタントよりも優れている最大の利点は、Gemini と Google のネイティブ製品がシームレスに統合されていることです。

企業では、デジタル従業員の最も初期の製品は、RPA (ロボティック プロセス オートメーション) を使用して、反復的で非常に定量的でルールベースのタスクを自動化します。過去 1 年間の大規模言語モデルの爆発的な増加により、多くのオフィス ソフトウェアおよびオフィス コラボレーション製品企業がチャンスを見出しました。国内大手企業をはじめ、会議、メール、コラボレーション、ドキュメント管理などの分野でビッグモデルを活用したデジタル従業員向け製品を発売しています。

Google がこのタイプの製品に参入したことで、業界内の競争が激化したのは間違いないが、この分野に注力する企業にとって「巨大な」ベンチマークも確立された。 Google のフルセットのツールのサポートにより、AI チームメイトの AI はもはや散在したツールではなくなりました。その機能は、単純なスケジュール設定、会議の設定、議事録の作成だけではありません。

Google のバケット ファミリー全体の協力により、AI チームメイトはビジネス フローを真に理解し、ビジネス コンテキストを理解し、結論を導き出すことができます。リスクの高いビジネスを評価し、プロジェクトが予定通りに完了できるかどうかの答えを見つけるのにも役立ちます。これは「会長補佐」の仕事にさえ近い。

Gemini を搭載した Workspace は、2024 年 6 月に「ユニバーサル アシスタント」として有料加入者に提供される予定です。

AI Search と AI Workspace を組み合わせることで、Google バージョンの AI エージェントが初めて登場します。より強力なマルチモーダル機能、複数のシナリオにおける包括的かつ詳細な情報処理、企業のワークフローの真の理解が実現します。対照的に、OpenAI の GPT-4o は生成 AI 技術に利点があるものの、オフィス アプリケーション シナリオではまだ包括的かつ効率的なソリューションを形成していません。

2. ジャイアンツの反撃の教科書第2章:コンビネーションパンチを使う

Google は、中核的なビジネス上の優位性に加えて、2024 年の Google I/O カンファレンスでエコシステム全体を包括的にアップグレードしました。

1つ目はYouTubeを中心とした動画空間です。 Google は、Sora の競合製品として、長さ約 1 分の 1080p ビデオを安定して出力できる Veo をリリースしました。 Google は、YouTube 動画制作のために一部のクリエイターに Veo を提供し、ハリウッドの映画制作にも売り込んでおり、Veo の機能の一部はまもなく YouTube Shorts で利用できるようになる予定だと述べた。

Google はまた、GPT-4o と競合し、Android 上でスムーズな双方向 AI 会話体験を可能にする「割り込み可能な」音声アシスタントである Gemini Live もリリースしました。 OpenAI の GPT Store や Character.AI に似たキャラクター チャットボット Gems もあります。 Gems は、アインシュタインやマスクと話したり、自分専用の「偽の」心理学者を作ったりするなど、特定のタスクを完了し、特定の特性を保持するカスタマイズされた ChatGPT チャットボットを作成できます。

さらに、Google は OpenAI と同様に、教育シナリオに重点を置いています。

Google は、家庭教育のシナリオに適用できる Android 向け Circle to Search をリリースしました。マルチモーダル モデルを通じて、パーソナライズされたインタラクティブな教育体験を提供します。この製品は、生徒の質問を理解して応答できるだけでなく、学習の進捗に応じて指導内容を調整し、教育プロセスのインタラクティブ性と有効性を向上させます。

感染症の流行によりオンライン教育の価値が高まり、親たちは家庭教育にますます注目し始めました。調査会社MarketsandMarketsの分析によると、世界のデジタル教育市場規模は2023年の194億ドルから2028年には667億ドルに拡大し、年平均成長率は28.0%になると予想されています。

Gems、Circle to Search、Gemini Liveなどの製品は、オンライン教育のインタラクティブな体験を大幅に向上させ、AIに基づいてさまざまな子供にパーソナライズされた教育プランを提供し、従来の教育モデルではすべての学生のニーズを満たすのが難しいという問題を補うことができます。

Google は、ビジネス エコシステムとシナリオに加えて、主に大規模 ToB ビジネスのコスト問題を対象とした AI インフラストラクチャもアップグレードしました。

今回の Google I/O カンファレンスで、Google は自社開発の AI チップを第 6 世代 TPU (Tensor Processing Unit) Trillium にアップグレードしました。第5世代と比較すると、各TPUの計算性能は4.7倍向上しました。 Google はまた、Nvidia の次世代 Blackwell プロセッサへのアクセスを提供する最初のクラウド プロバイダーの 1 つになることも発表しました。

グーグルのサンダー・ピチャイCEOは「我々は人工知能の進歩を推進するためにインフラへの投資を継続する」と述べた。

OpenAIとMicrosoftの協力モデルと比較すると、Googleは自社のビジネスエコシステム内での緊密な連携を通じてGoogle CloudとAI関連サービスの互換性と相互運用性を向上させ、開発者により強力なツールとサポートを提供し、全体的な技術面と商業面の競争上の優位性をより明確にしました。

今回の Google I/O カンファレンスで、Google は AI について合計 124 回言及しました。ビジネスエコロジーからアプリケーションシナリオ、インフラストラクチャに至るまで、Google は AI 関連のほぼすべての製品と機能をアップグレードしました。

OpenAIと比較すると、Googleのビジネスフロントは長く、それは欠点でもあり利点でもある。これらの対策を組み合わせることで、前日のOpenAIのリリースはすべてGoogleがリリースした章の内容となった。これにより、Google は単純な製品性能比較のレベルから抜け出し、2024 年初頭に生成 AI 市場の競争に参入できるようになります。

3. 巨大企業の逆襲の教科書第3章:新興企業にはできないことをする

Google にとって、すべてのソフトウェア機能は最終的にはハードウェアに反映されることになります。なぜそうしないのでしょうか? Google には、製品ラインと関連する市場経験の両方があります。ソフトウェアサービスと比較すると、ハードウェア事業は資産重視の性質がより顕著であり、新興企業にとってそれを負担することは困難だが、Google はそこで成功している。

このカンファレンスで、Google は Pixel スマートフォンにネイティブの Gemini 機能が搭載され、デバイスのマルチタスク機能が大幅に向上することを明らかにしただけでなく、Android 15 で導入される多くの AI 機能も発表しました。

実際、Gemini はすでに Android 上で独立したアプリとしてリリースされています。今回、Gemini 会話中に、ユーザーは生成された画像を他のアプリケーションに直接ドラッグ アンド ドロップして使用できるようになりました。 Android 15 では、Gemini は YouTube 動画コンテンツ認識機能をサポートしています。 Gemini は、ビデオ再生インターフェースで関連情報を直接抽出し、ビデオに関するユーザーのさまざまな質問に答え、さらにはビデオ コンテンツの要約を生成することもできます。

さらに、ユーザーはパフォーマンスに影響を与えることなく複数のアプリケーションを同時に実行できますが、これは以前の携帯電話では実現が困難でした。さらに、Gemini AI はユーザーの習慣に基づいてパーソナライズされた推奨事項を提供し、携帯電話の使用をより親密で便利なものにします。このインテリジェントなサービスにより、ユーザー満足度が向上し、スマートフォン市場における Google の競争力が強化されます。

Pixel および Android システムにリアルタイム音声アシスタント機能が実装されると、エコシステムはさらに閉鎖的になります。

Gemini のリリース時に言及された軽量版 Nano が Chrome の改善に使用されることが確認されました。軽量モデルとしては、Google が新しい Gemini Flash を発売しました。これら 2 つの Gemini モデルとオープンソースの Gemma モデルは、将来のエッジ AI デバイスにおける Google のモデルパワーを蓄積することになります。

チップの性能やセキュリティに関する過去の議論と比較すると、Google の AI フォンはよりセクシーで実用的です。 Pixel スマートフォンのハードウェア レベルは携帯電話業界で常に遅れをとっていますが、その唯一の競争上の優位性はネイティブの Android システムです。ネイティブ Android + AI デバイスとして、Pixel は新たな春の到来を告げるかもしれません。

Android の Gemini アップデートは「今後数か月以内に数億台のデバイスに展開」され、より多くのコンテキスト機能が追加される予定です。

Android のエコ機能の優位性が初めて顕著になり、Gemini はこれに大きく貢献しました。 Appleにとって、WWDC 以前にはすべてが未知数です。新しく誕生した華為鴻蒙にとって、課題はさらに厳しい。

興味深いことに、AIはGoogleの主要ハードウェア製品に豊富な応用シナリオを見つけただけでなく、GoogleはGoogle Glassの最新応用も実演し、まるで外部に次のように伝えているようでした。「AIのサポートにより、過去には失敗したと考えられていたプロジェクトでも、新たなイノベーションの基盤とインスピレーションを提供できるようになったのです。」

これから推測し続けると、Gemini のサポートとハードウェア機能があれば、Google が最もホットな AI PC 市場に参入したいとしても、それは極めて「スムーズ」なものとなるでしょう。

IV.結論

Google のリリースをどのように評価しますか?まず、Google がどの企業に脅威を与えているかを見てみましょう。

まずはAI検索。有名な AI 検索企業 PerplexityAI や伝説的な OpenAI 検索に加えて、Google の最も直接的な脅威は、もちろん従来の検索エンジンです。 Google は、検索結果に AI による要約を追加したり、自然言語による会話で検索を実行したりするだけではありません。 Google のマルチモーダル AI 検索は、検索インテリジェンスを向上させると同時にユーザー エクスペリエンスを大幅に向上させ、検索のパラダイムを変えたと言っても過言ではありません。

Googleのアップグレードに基づいて、GPT-4を搭載したBingであれ、Wenxin Yiyanを使用してAI検索を探求するBaiduであれ、この分野で競争力を維持するためには、AI +検索の製品力の革新のペースを加速する必要があります。

オフィスソフトウェアと共同オフィスに関して。 Workspace のアップグレードにより、Google は「本物の」デジタル従業員を提供できるようになります。 Google は長年のライバルである Microsoft をターゲットにしているだけでなく、デジタル従業員、AI オフィス ソフトウェア、AI コラボレーション オフィス ソフトウェアを開発するすべてのサプライヤーに挑戦しています。 DingTalk、Feishu、WPS に代表される企業は、ドキュメント処理、オフィス、コラボレーションなどの面で自社製品の強みを再評価する必要があるかもしれません。

携帯電話業界で、AIの影響を最も受けているメーカーはAppleでしょう。ビッグAIモデルの時代に遅れをとる唯一の巨大企業として、AppleがiOSエコシステムにさらなる革新を導入しなければ、Android陣営のAI攻勢に対処するのは困難になるだろう。他の携帯電話メーカーは、AI携帯電話のコンセプトをどれだけ推進しても、Android + Geminiの影響で、システムベースのAIアップグレードの余地はますます狭まるでしょう。競争力を維持するためには、ハードウェア、生産コスト、サプライチェーンでいくらかのコストを節約するしかありません。

AI業界全体にとって、OpenAIは最初にその矢面に立たされる存在だ。過去1年間、OpenAIはビッグデータ、膨大な計算能力、強力なアルゴリズム、強力なエンジニアリングにおける優位性を活用して、AI業界で主導的な優位性を維持してきました。しかし、テクノロジーの普及と他のテクノロジー産業の発展に伴い、OpenAI のいわゆる技術的優位性は支持されなくなってきています。 OpenAIの先端技術は、従来の模倣から同時公開へと変化しつつあります。

AI企業間の技術競争は、静かに商業競争、製品競争へと移行しつつあります。 Google は、広範な製品エコシステムを統合することで、携帯電話、オフィス ソフトウェア、スマート ホーム、オンライン教育など、より実用的なシナリオに AI テクノロジーを導入しました。私たちは、一歩一歩、巨大なビジネス エコシステムと確固たる市場リーダーとしての地位を築いてきました。

将来の競争は、アプリケーション シナリオの多様性と市場支配をめぐる争いにさらに反映される可能性があります。 GPT-5 やその他のより強力な AI モデルが登場するまで、OpenAI などの AI 企業のアプリケーション シナリオにおける不利な点は、Google によって拡大され続けるでしょう。

今日、Google は、テクノロジーとビジネス戦略の 2 つのアプローチを通じて、激しい市場競争に対抗する方法を教科書的な方法で実証しています。これは単なるテクノロジーのゲームではなく、ビジネスモデルとエコシステム構築における競争でもあります。

<<:  ヒットドラマで長編動画を観る:時代の空気を逆手に取った業界の「復活」は?

>>:  中年のアリババ、価値は努力にある

推薦する

アディダスのスポーツシューズは破れやシワがあり、アフターサービスも面倒

慧想網は4月15日、江西省九江市の消費者、李耀成氏が同サイトに、2009年2月21日にアディダスのス...

小紅書に関する7つの真実

可能性に満ちたプラットフォームである小紅書で、ブランドやマーチャントはどうすれば効果的に運営し、成長...

AIオフィスアシスタントは労働者の負担を軽減するのか、それとも負担を増やすのか?

AIの発展に伴い、感情的に安定したアシスタントを見つけるなど、AIを生産の重要な部分と考える人もい...

再生回数27億5千万回、「焚き火を囲んでお茶を飲む」がなぜこの冬のトップトレンドになったのか?

本稿では主に、「火を囲んでお茶を淹れる」現象の歴史的起源、その台頭理由、将来の投資展望を分析します。...

突然の工場検査への対処方法

1. 工場のスタッフが、顧客を装った監査員の疑いのある人物からの電話を受けた場合、直ちにその電話を特...

Dunhuang.com 新規販売者保護期間免除ポリシー

敦煌プラットフォームは、新規販売者が取引ルールを理解できるようにガイドするとともに、プラットフォーム...

越境ECストアの開設にはいくらかかるのか(AliExpress、Wish、eBay、Shopeeの開設費用まとめ)

越境電子商取引といえば、AliExpress、eBay、Shopee、Wish などのプラットフォー...

フォロワー数が最も急速に増加した500のアカウントから、2025年に小紅書が離陸するための秘密のコードがわかります

小紅書の巨大なコンテンツエコシステムの中で、どのクリエイターやコンテンツトラックが人気上昇中でしょう...

バラエティ番組のプロモーションには短編動画が欠かせない

この記事では、バラエティ番組のプロモーションにおけるショートビデオの役割を深く分析し、バラエティ番組...

Douyin、小紅書、ビデオアカウントで違法な言葉を避ける

プラットフォームのルールは絶えず調整、改善されており、多くのオペレーターがトラフィック制限や降格に遭...

アリババ国際ステーションの年会費はいくらですか?最低料金はいくらですか?

現在、アリババのほとんどの人はアリババ国際ステーションの年会費を解放しており、コスト効率が向上してい...

SHEIN越境電子商取引を運営するには?ビジネス戦略は何ですか?

Shein は越境電子商取引プラットフォームとして、消費者にファッショナブルで高品質な製品の選択肢を...

冗談を言おう。小紅樹が何を植えているのかようやく理解できたような気がします。

Xiaohongshuアカウントの操作方法をご存知ですか?本稿では、小紅樹の「草植え」データから始...

Shopee ストアをもう開店したくなくなった場合、閉鎖できますか?解約にはどのような資料が必要ですか?

現在、Shopee で店舗を開設する人がますます増えています。Shopee ストアは依然として非常に...

独立したウェブサイトを構築するにはどのような準備をすればよいでしょうか?何を準備する必要がありますか?

商人が越境独立ウェブサイトを構築する場合、まずは国内外の潜在的ユーザーの審美的嗜好やオンラインショッ...