AI ネイティブアプリケーションの開発はなぜ難しいのでしょうか?

AI ネイティブアプリケーションの開発はなぜ難しいのでしょうか?

AIネイティブアプリケーションの開発はますます困難になっています。 AI アプリケーションの実装が困難になっているのはなぜですか?著者の意見を見てみましょう〜

AIネイティブアプリは「産みにくい」。百機種戦争の後、疲れ果てた起業家グループは、中国の本当のチャンスはアプリケーション層にあり、AIネイティブアプリケーションが次のラウンドの最も肥沃な土壌であることを徐々に認識しました。

Li Yanhong氏、Wang Xiaochuan氏、Zhou Hongyi氏、Fu Sheng氏は、過去数か月間の大物たちのスピーチを振り返り、全員がアプリケーション層における巨大なチャンスを強調した。

インターネット大手は常に AI ネイティブについて語っています。Baidu は一度に 20 を超える AI ネイティブ アプリケーションをリリースしました。 ByteDance はアプリケーション層に重点を置く新しいチームを立ち上げました。テンセントは大規模なモデルをミニプログラムに組み込みました。アリババはまた、Tongyi Qianwen を使用してすべてのアプリケーションをやり直したいと考えています。 Wps は AI 経験カードを狂ったように配布しています...

スタートアップ企業はさらに熱心だ。 1 回のハッカソンの後には、約 200 の AI ネイティブ プロジェクトが生まれます。今年に入ってから、七曜創壇、百度、創始者公園など大小さまざまなイベントが数十件、プロジェクトが数千件行われたが、結局、成功したものは一つもなかった。

アプリケーション層に大きなチャンスがあることは認識しているものの、ビッグモデルがすべてのアプリケーションを覆したわけではなく、すべての製品が痛みを伴わずに変革を遂げているという事実に直面しなければなりません。中国には最高のプロダクトマネージャーがいるにもかかわらず、今回も「失敗」した。

4月にMidjourneyが人気になってから現在まで9ヶ月が経ちました。 「村全体の希望」を集めた国産AIネイティブアプリはなぜ誕生が難航しているのか?

選択は努力よりも重要です。今こそ、冷静に過去を振り返り、AIネイティブアプリケーションをオープンするための正しい「姿勢」を見つける必要があるのか​​もしれません。

1. AIネイティブだがエンドツーエンドではない

ネイティブアプリケーションの作成が難しいのはなぜですか?ネイティブアプリケーションの「制作」プロセスから、何らかの答えが見つかるかもしれません。

「通常は 4 つまたは 5 つのモデルを同時に実行し、パフォーマンスが優れているモデルを選択します。」シリコンバレーのビッグモデル起業家は、「Self-Quadrant」のインタビューで、基本的なビッグモデルをベースにAIアプリケーションを開発しているが、初期段階では特定のビッグモデルに縛られることはないと語っている。代わりに、各モデルを実行し、最終的に最も適切なモデルを選択します。

簡単に言えば、競馬の仕組みも大きなモデルに関わってくるようになったのです。

ただし、このアプローチにはまだいくつかの欠点があります。試行のためにさまざまな大規模モデルを選択しますが、最終的には大規模モデルの 1 つと深く結合されます。これは依然として「エンドツーエンド」の研究開発アプローチであり、つまり 1 つのアプリケーションが 1 つの大きなモデルに対応します。

しかし、アプリケーションとは異なり、大規模な基盤モデルとして、複数のアプリケーションに同時に対応するため、同じシナリオ内の異なるアプリケーション間の違いは非常に限られます。さらに大きな問題は、現在市場に出回っている基本的な大型モデルには、それぞれ長所と短所があるということです。すべての領域でリードする六角形の戦士となったビッグモデルは存在しないため、ビッグモデルに基づいて開発されたアプリケーションがすべての機能のバランスを実現することは困難です。

このような状況では、大規模なモデルをアプリケーションから分離することが新しいアイデアになりました。

いわゆる「デカップリング」は、実際には 2 つのリンクに分割されます。

1 つ目は、大規模なモデルをアプリケーションから分離することです。 AI ネイティブ アプリケーションの根本的な原動力として、ビッグ モデルとネイティブ アプリケーションの関係は、実際には自動車業界に例えることができます。

AI ネイティブ アプリケーションの場合、大規模なモデルは自動車のエンジンのようなものです。同じエンジンを異なる車種に適合させることができ、また同じ車種を異なるエンジンに適合させることもできます。異なるチューニングにより、マイクロカーから高級車まで、さまざまなポジショニングを実現できます。

したがって、車両全体にとって、エンジンは全体的な構成の一部にすぎず、車両全体を定義する中核となることはできません。

AI ネイティブ アプリケーションに例えると、基本的な大規模モデルはアプリケーションを駆動するための鍵となりますが、基本的な大規模モデルはアプリケーションの実装に完全にバインドされるべきではありません。大きなモデルはさまざまなアプリケーションを駆動することができ、同じアプリケーションもさまざまな大きなモデルによって駆動される必要があります。

こうした例は、実際に現在の事例にも反映されています。例えば、国内のFeishuやDingTalk、海外のSlackなどは、それぞれ異なる基本的な大型モデルに適応でき、ユーザーは自分のニーズに応じて選択できます。

第二に、特定のアプリケーションでは、大きなモデルとさまざまなアプリケーション リンクをレイヤーごとに分離する必要があります。

代表的な例としては、海外で人気となっているAI動画企業HeyGenが挙げられる。同社の年間経常収益は今年3月に100万米ドルに達し、今年11月には1,800万米ドルに達した。

HeyGen には現在 25 人の従業員がいますが、独自のビデオ AI モデルを構築し、OpenAI と Anthropic の大規模言語モデルと Eleven Labs のオーディオ製品を統合しています。 HeyGen は、さまざまなビッグモデルに基づいて、ビデオを作成するときに、作成、スクリプト生成 (テキスト)、サウンドなどのさまざまなリンクでさまざまなモデルを使用します。

もう 1 つのより直接的な例は、ChatGPT のプラグイン エコシステムです。最近、国内の編集アプリケーションJianyingがChatGPTエコシステムに加わりました。その後、ユーザーがChatGPTでビデオを作成するためにJianyingのプラグインを呼び出すことを要求すると、JianyingはChatGPTの駆動下で自動的にビデオを生成できます。

言い換えれば、ビッグモデルとアプリケーション間の多対多のマッチングを洗練させ、各リンクでのサポートに最も適したビッグモデルを選択できるようになります。つまり、アプリケーションは 1 つの大きなモデルによって駆動されるのではなく、複数の大きなモデル、あるいは大きなモデルのグループによって駆動されます。

複数の大規模モデルが 1 つのアプリケーションに対応し、数百の学校の強みを統合します。このようなモデルの下では、AI産業チェーンにおける分業も再定義されることになるだろう。

現在の自動車産業チェーンと同様に、エンジン、バッテリー、アクセサリー、機体の各リンクには、それぞれの責任を持つ専属メーカーがあり、OEM は選択と組み立てだけで差別化された製品を形成し、同時に市場に投入する必要があります。

仕事を再分割し、分解して再編成します。破壊がなければ建設はありません。

2. 新しいエコロジーの原型

マルチモデル、マルチアプリケーションモデルは新たなエコシステムを生み出します。

私たちはその先導に従い、インターネットの経験に基づいて新しいエコシステムのアーキテクチャを構想しようとしました。

ミニプログラムが初めて導入されたとき、その機能、アーキテクチャ、およびアプリケーション シナリオについて誰もが混乱していました。初期段階では、各企業はミニプログラムの機能と手法を一から学ばなければなりませんでした。ミニプログラムの開発は非常に遅く、その数を急速に増やすことができませんでした。

WeChat サービス プロバイダーが登場するまで、サービス プロバイダーは一方では WeChat エコシステムに接続してミニプログラムの基盤となるアーキテクチャと構造に精通し、他方では企業顧客と接続して顧客がニーズに基づいて独自のミニプログラムを作成できるように支援することができました。同時に、WeChatエコシステム全体のゲームプレイに協力し、ミニプログラムを通じて顧客を獲得・維持します。サービスプロバイダーグループには、WeMall と Youzan も含まれます。

言い換えれば、市場には大規模な垂直モデルは必要ないかもしれませんが、大規模なモデル サービス プロバイダーは必要です。

同様に、各大型モデルも、その関連機能や使用方法を本当に理解する前に、実際に使用して操作する必要があります。サービスプロバイダーは中間層に位置し、複数の大規模モデルとの下位互換性が確保されるだけでなく、企業と連携して健全なエコシステムを構築することもできます。

過去の経験に基づいて、サービス プロバイダーは大まかに次の 3 つのカテゴリに分類できます。

1 つ目のタイプは、各大型モデルの特性と適用シナリオを理解して習得し、業界の細分化されたシナリオに協力し、サービス チームを通じて市場を開拓する経験豊富なサービス プロバイダーです。

2 番目のタイプのリソースベースのサービス プロバイダーは、WeChat で低価格の広告スペースを取得し、それをアウトソーシングすることができた Weimob のようなものです。将来的には、大規模モデルのオープン権限は普遍的ではなくなります。十分な許可を取得できるサービスプロバイダーは、早い段階で障壁を構築します。

3 番目のタイプはテクノロジー サービス プロバイダーです。アプリケーションの基盤レイヤーにさまざまな大規模モデルが組み込まれている場合、安定性とセキュリティを確保しながら複数のモデルを呼び出して接続する方法など、さまざまな技術的な問題を解決する必要があります。

「自己象限」の観察によると、過去6か月間で大型モデルサービスプロバイダーのプロトタイプが登場し始めましたが、エンタープライズサービスの形で、企業にさまざまな大型モデルを適用する方法を教えています。アプリケーションの開発方法も徐々にワークフローを形成しつつあります。

「今、ビデオを作っています。まず、Claud にスクリプトのアイデアを提案し、ストーリーの作成を手伝ってもらいます。次に、それをコピーして ChatGPT に貼り付け、その論理機能を使用してスクリプトに分解します。Jianying プラグインを接続してテキストをビデオに変換し、直接ビデオを生成します。途中の画像の一部が正確でない場合は、Midjourney を使用して再生成し、最終的にビデオを完成させます。アプリケーションがこれらの機能を同時に呼び出すことができる場合、それは真のネイティブ アプリケーションです。」ある起業家が私たちに語った。

もちろん、マルチモデル、マルチアプリケーションのエコシステムを真に実装するには、複数のモデルを相互に通信させる方法など、解決しなければならない問題が数多くあります。アルゴリズムを通じてモデル呼び出しを最大化するにはどうすればよいですか?どのように協力して最善の解決策を見つけるかは、課題であると同時にチャンスでもあります。

過去の経験から判断すると、AI アプリケーションの開発傾向は、最初は点在して現れ、その後徐々に統一され統合されるものになると考えられます。

たとえば、質問したり、写真を撮ったり、PPT を作成したりする必要がある場合、現段階ではこれらは多数の個別のアプリケーションになる可能性がありますが、将来的には 1 つの総合的な製品に統合される可能性があります。プラットフォーム化に近づきます。たとえば、タクシー配車、食品配達、チケット予約などの複数の業界が、スーパーアプリに徐々に集中しつつあります。さまざまな要求により、モデル機能に対する課題もさらに多様化します。

さらに、ネイティブ AI は現在のビジネス モデルを覆すでしょう。産業チェーンにおけるホットマネーは再分配されるでしょう。 Baidu は知識の棚となり、Alibaba は商品の棚となるでしょう。すべてのビジネスモデルは、消費者の真のニーズを満たすために最も重要な部分に戻り、冗長なプロセスは置き換えられます。

その上で、価値創造が一つの側面となり、ビジネスモデルをいかに再構築していくかが、投資家や起業家が考えるべきより重要な課題となってきています。

現時点では、AI ネイティブ アプリケーションの爆発的増加はまだ目の前です。最下層は基本となる大規模モデル、中層は大規模モデルのサービスプロバイダー、そして上層はさまざまなスタートアップです。このような明確な分業とあらゆるレベルでの健全なコラボレーションがあって初めて、AI ネイティブ アプリケーションが大量に登場できるようになります。

著者:羅吉 WeChat公開アカウント:自己象限

<<:  「有料会員」4000万人超、インタイム百貨店の会員運営システムを徹底分析

>>:  短編ドラマが熾烈、ブランドが続々参入、数十億の市場で儲けているのは誰か?

推薦する

バワンチャジのバッジマーケティングが話題に

最近、Ba Wang Cha Ji のバッジが大量に届きましたか?このマーケティング成功の鍵は何でし...

Xiaohongshu のプロモーションがコンバージョンにつながらないのはなぜでしょうか?どうすれば解決できるでしょうか?

Xiaohongshu で商品を宣伝しているのに、コンバージョン率がまだ理想的でないのはなぜでしょ...

ただ!公式アカウントで写真の修正が可能になりました!

パブリックアカウント記事は画像の変更をサポートしており、これはオペレーターにとって追加の保険となりま...

B局が再生音量表示を廃止したら、愛のために活動しているUPホスト達はお金の心配をしなくなるのでしょうか?

Bilibiliは、今後数週間以内にUPのメイン動画を評価する際に、再生時間ではなく再生分数を使用...

Amazon メンバーシップの自動更新をキャンセルするにはどうすればいいですか?手順

現在、多くの友人がAmazonプラットフォームを利用して、自分で海外製品を購入し始めています。同時に...

意図的に摂取しないとどうなるでしょうか?

「悪意ある不消費」って聞いたことありますか?簡単に言えば、それは消費主義と戦うことです。この記事で...

インフルエンサーに投資せずに、ブランドが小紅書でどうやってコールドスタートできるのでしょうか?

ブランドはどのようにして小紅書でコールドスタートを行うことができるでしょうか?タレントに投票しなかっ...

ネットセレブが「焚き火を囲んでお茶を淹れる」:1人500元、この中流階級のライフスタイルはいつまで人気が続くのか?

シンプルな石炭ストーブ、普通のやかん、そしてストーブの周りにはオレンジ、ピーナッツ、栗が輪になって並...

Black Myth: Wukong の背後にある経済学

『Black Myth: Wukong』は、国内で待望の3Aゲームの傑作として、発売以来、その優れた...

越境電子商取引ERPシステムランキング

越境電子商取引 ERP システムは、電子商取引販売者のためのバックエンド管理システムです。多くの越境...

Facebook アカウントをキャンセルした後もコンテンツは残りますか? Facebookアカウントを削除するにはどうすればいいですか?

プライバシー上の懸念、個人的な理由、その他の要因など、さまざまな理由から Facebook アカウン...

ブランド配当

本稿では、主に今日の時代の状況下でブランド配当の11の要素を分析し、今こそ新しい消費者ブランドが成長...

少ない言葉で多くの意味を持つ! WeChatビジネス発表:「フック」行為に対する厳しい取り締まり

WeChat Enterprise が「プラグイン」行為を取り締まる必要があるのはなぜですか?この記...

Amazon ローカルアカウントとは何ですか?種類は何ですか?

一般的に、Amazonにアカウントを登録することができます。Amazonの越境EC事業も、ローカルア...

携帯電話でShopeeストアを開設するにはどうすればいいですか?どのような問題に遭遇するでしょうか?

Shopee への参加は無料です。プラットフォーム使用料、年会費、デポジットはかかりません。ただし、...