ソラは国内メーカーにとってチャンスか、それとも課題か?

ソラは国内メーカーにとってチャンスか、それとも課題か?

今年初め、OpenAI は文化ビデオの分野で新しい AI テクノロジー「Sora」を開発しました。これは国内大企業にとってチャンスなのか、それとも課題なのか?著者の分析を見てみましょう。

技術的なルートはさておき、導入効果だけで言えば、国内の大手模型会社は、動画制作において同様の「飛躍のチャンス」を持っているのだろうか?

ドラゴン年の最初の月に、昨年の ChatGPT と同様に、OpenAI は年初に文学ビデオの分野でもう一つの大ヒット作である Sora を発表しました。

このような AI 生成機能に直面して、ほぼすべてのタイプの実務家はかなりの衝撃を受けました。 IT分野の経験を持つ映画プロデューサーは、ソラ氏の素晴らしいパフォーマンスが周囲の専門家に大きな危機感を抱かせたとLujiu Business Reviewに語った。映画制作コストが大幅に下がったことで、新しい映画製作者が出現することがこれまで以上に容易になるだろう。

しかし、Lujiu Business Reviewが提起した「Soraは商業化の条件を備えているか?」という疑問に直面すると、 「Vincent Video ではコンピューティング能力に対する要件がさらに高くなっていますか。また、それをどのように解決しますか」という質問に対して、プロデューサーは「開発上の問題、開発上の解決策」と答えました。

これは明らかに楽観的すぎる。結局のところ、多くの実務家は、Sora でさえ、コンセプトから成熟した産業商業段階まで、未熟な側面がたくさんあると考えています。

したがって、技術的なルートはさておき、実装効果だけで言えば、ヴィンセントやグリーなど、一般モデルに関連レイアウトを持つ国内大手モデルメーカーも同様に「飛び立つチャンス」があるのでしょうか?以前のヴィンセントのテキストと比べて、ヴィンセントのビデオはどのような大きな進歩を遂げましたか?これは非常に興味深いトピックです。

1. ソラ、革命かバブルか?

Sora の出現により、汎用人工知能 (AGI) の実現が一歩近づいたことは認めざるを得ません。その理由は、物体の動きや相互作用など、現実の物理世界の動きをシミュレートしているからです。しかし、このレベルの改善だけでは「驚くべき」とは言えません。 OpenAIの公式レポートによると、Soraの「革命的」性質は主に以下の点に反映されているとのこと。

まず、持続時間です。一般的なテキストベースのビデオ モデルとして、ユーザーが提供したテキストの説明に基づいて 60 秒のビデオを生成できます。高品質であるだけでなく、ユーザーが入力したプロンプトをより完全かつ正確に復元することもできます。

第二に、シーンの複雑さとキャラクター生成のレベルにおいて飛躍的な進歩がありました。これまでのところ、Sora は複数のキャラクター、特定の種類の動き、正確なテーマ、複雑な背景の詳細​​を含むシーンを生成することができました。カメラの言語もより複雑になり、ビデオ自体が特定の物語機能を持つようになり、それがまさに現在の短編ビデオ分野で求められているものです。

また、テキストからビデオを生成することに加えて、Sora は静止画像から画像をアニメーション化したり、既存のビデオから新しいビデオを生成したりして、欠落しているフレームを埋めたり、ビデオ コンテンツを拡張したりすることもできます。

上級テクノロジーメディア関係者は、SoraのようなAI製品の出現は「平等な思考」の機会である、とLujiu Business Reviewに語った。なぜなら、この業界を長年追いかけてきたテクノロジージャーナリストの中には、「脳を刺激する」アイデアを持っているが、それを実行するための適切なツールが不足していることが多いからだ。しかし、GPTやSoraのようなAIツールがあれば、ジャーナリストが機会やアイデアを見つけると、AIが製品の実現を手助けしてくれるので、あとは製品の実現可能性を検証するだけです。

しかし、多くの業界関係者とコミュニケーションをとった結果、現在絶頂期にあるSoraでさえ過大評価される可能性があることがLujiu Business Reviewによって判明した。

星星AIの李明順会長は、この点についてより合理的な考えを持っている。彼の意見では、Sora の出現は、主にテキスト生成の普遍的なモデルであり、ビデオ分野における段階的な技術の反復にまで拡張されています。 Sora の現在の質的変化は、コンピューティング能力と資金への無制限の投資と、膨大なトレーニング セットの継続的な反復トレーニングによるところが大きいです。これが「大いなる力は奇跡をもたらす」という結果です。

技術的な実装における優位性と比較すると、Sora の「リソースの賦存」における優位性は、明らかに「計算能力が不足している」多くの国内メーカーから大きな差をつけています。これは、国内の大型模型メーカーにとって長らく克服することが困難なギャップでした。

投資の観点から見ると、Sora のような垂直分野の「ユニバーサル モデル」は人気のターゲットではありません。

プライマリーマーケットの専門家は、純粋なプライマリーマーケット投資は通常、大きなコンセプトと価値の高いターゲットにのみ投資するとLujiu Business Reviewに語った。主な理由は、プライマリー市場におけるファンドのライフサイクルが7年、投資期間が2年であり、5年でエグジットする可能性が高いイベントであるためです。しかし、ヴィンセント・ビデオの垂直型モデルが5年以内に産業化され、商品化できるかどうかは誰にもわかりません。

なお、現在のSoraについては、2月15日に公開された技術レポートのみが判明しているが、資金調達のニュースが出たのはその3日後だ。 OpenAIの評価額は一般には公開されておらず、その実際のレベルは外部には知られていないが、ベンチャーキャピタル企業Thrive Capitalが主導した資金調達ラウンドで800億ドルに近づいた。この主要な市場関係者は、この技術リリースはおそらくOpenAIの「評価管理」の一環であるとLujiu Business Reviewに認めた。

崑崙万為の周亜輝会長は自身のWeChatモーメンツで「ここ(シリコンバレー)の科学者やエンジニアは、OpenAI以外のスタートアップ株の価値を認識しておらず、すべて紙の富だと思っている。彼らはスタートアップからの300万株(株式の80%)のオファーよりも、OpenAI、Google、FB、Microsoftからの100万株(株式の半分)のオファーを受け入れるだろう」と述べた。

Sora以降、OpenAIは他の大手AI企業との差をさらに広げたことがわかります。

2. 国産大型モデル、メーカーにとっての危険とチャンス

Meta、Google、Microsoftはいずれも動き出す準備ができているが、資本市場のSORAに対する熱狂に比べると、国内の大型模型メーカーははるかに冷静に見える。国内大手企業の多くは、いわゆるネイティブAI大規模モデルのアップグレードを追求するのではなく、依然として自社アプリケーションに基づいて大規模モデルを開発することを選択しています。 ByteDanceもその1つです。生成 AI に対する保守的な姿勢は、文勝文の段階からすでに反映されていました。参入時期から判断すると、ByteDance は遅れていない。 LatePostによると、OpenAIが2020年6月にGPT-3をリリースした後、ByteDanceは数十億のパラメータを持つ大規模な生成言語モデルをトレーニングした。

開発が段階的に進めば、2023年までにByteDanceはOpenAIのGPTに大きく遅れをとることはないだろう。しかし、ROIが最優先されるビジネスシステムにおいて、ByteDanceはこの投資を慎重に考慮していなかったことは明らかだ。そのため、同社の生成 AI の探求は常に競合他社よりも遅れています。

リリース時期に関して言えば、Baidu Wenxin Yiyanは2023年3月にリリースされ、同年10月にバージョン4.0にアップグレードされました。これに続いてアリババの同義千文とテンセントの渾源助手が続き、バイトダンスは2023年8月に雲霆モデルをリリースした。

後発であることの結果の1つは、ユーザー数の不足です。文心易言の月間アクティブユーザー数は昨年1億人を超えましたが、バイトダンスの豆宝はまだ1000万人未満です。しかし、バイトダンスが張楠氏を江洋の責任者に任命したことで、生成AIの進歩が加速すると期待されている。

ByteDance がライブ ビデオの分野ですぐに使える製品をまだ見ていないとすれば、Baidu と Alibaba では同じ状況ではありません。昨年の百度世界大会で、百度は文心易眼のビデオ機能を実演していたが、これは主に「易経流影」プラグインに統合されていた。

もちろん、世界会議で公開された生成されたビデオは、Yijingliuying の無数のカード ドローの成功例にすぎません。テストの結果、Lujiu Business Review は、Yijing Liuying にはまだいくつかの制限があることを発見しました。

1つはマテリアルライブラリです。現在、Yijingliuying は著作権フリーの素材ライブラリを使用しているため、特定ブランドの産業商業段階で使用することはできません。

第二に、肖像権に関する懸念があるため、現在は肖像画付きの動画を生成することはできませんが、商標のない商品動画を生成することは可能です。

3 つ目は、現在生成されている動画はすべて約 30 秒の長さであることです。ソラと同様の効果を実現したい場合は、2 つのビデオ クリップを結合する必要があります。明らかに、コンテンツとスタイルの一貫性を保つことが難しくなります。

現在、同義千文が使用している最も一般的で最も人気のある関連技術は、舞踏王に代表される画像ベースのビデオ技術です。全身写真だけで、人気のさまざまなダンスの動きを踊らせることができます。ビリビリでは、西太后が三学年を飛び級するなど歴史上の人物を題材にした二次創作動画の総再生回数は数千万回に上る。

まだ工業化のレベルには達しておらず、外国のソラとの差を縮めていないが、外国のソラも工業化を達成していない。これは、少なくとも商業化のプロセスにおいては、両者の間にまだ大きな隔たりがないことを意味します。残っているのは、追いつき続けることだけです。

星星AIの李明順会長も同様の見解を示している。同氏はLujiu Business Reviewに対し、OpenAIは依然としてこの業界で主導的な地位を占めているが、これは主に同社のこれまでの計算能力の蓄積と技術の蓄積に基づいていると語った。 BATやByteDanceなど国内の総合大型機種メーカーも追い上げを続けるだろう。理由は簡単です。ある程度、一般的なビッグモデルはインターネット企業の基本能力の象徴となっています。

競争はまだ始まったばかりのようだ。

3. ヴィンセントビデオ、本当の勝利の要因はどこにあるのでしょうか?

もちろん、OpenAI の Sora であれ、国内の大手模型メーカー数社であれ、最終的な目標は、高品質のビデオ コンテンツを工業化し、ライン生産することです。しかし、現時点では、Sora のような強力なプログラムであっても、産業分野での応用を妨げる未熟な要素が数多くあります。 AIダイナミックビデオソリューション製品であるZhixingyuan(www.creatlyai.cn)の製品設計者は、Lujiu Business Reviewに対して、Soraは現時点では非常に便利に思えるが、テキストを通じて高品質のビデオを直接生成でき、制御にはいくつかのプロンプトのみが必要であり、ユーザーに対する精神的および操作上の負担はほとんどないようだと語った。

しかし、ソラの現実の物理世界に対する理解は現時点ではまだ限られているため、いくつかのシナリオでは依然として問題が発生します。ろうそくの明かりの方向の乱れ、正確な量の乱れ、空間に出入りする物体の歪みなどの細部は、ポストプロダクション編集で変更することが困難です。

解決策がないわけではありません。 Sora には現在、ビデオ拡張機能とビデオステッチ機能があるため、ユーザーは数秒のビデオを生成して後で編集することができます。プロンプトワードエンジニアリングに関する十分な知識を持たない人にとっては、複数世代+手動ポストプロダクションは避けられません。

さらに、工業製品のプロモーションビデオでは、顧客が新しいダウンジャケット、新しい車、新しい携帯電話などの新製品をリリースするのが一般的です。しかし、ユーザーの素材はビデオモデルのトレーニングセットに存在しないため、類似製品を生成して二次処理、つまり映画やテレビのポストプロダクションを実行するしか方法がありません。

ここでも、プロフェッショナルユーザーと非プロフェッショナルユーザーのニーズには違いがあります。例えば、一般のカジュアルユーザーにとって、商業的な需要がなければ、そのモデルは試作品であり、新しく生み出された作品は彼らにとって驚きとなります。しかし、プロのユーザー(ディレクターなど)の場合、一度生成された結果が満足のいくものでない場合、複数回の生成と複数回のポストプロダクションが必要になり、計算能力と人的資源にかなりの負担がかかります。

前述の映画プロデューサーは、映画やテレビ番組の制作過程において、後期段階で最も大きなコストがかかるのは、二次加工である編集や特殊効果にかかる人件費だと陸久商報に語った。ワークフローが十分に進んでいないと、ポストプロダクション中にコストが増加し、プロジェクトの ROI に影響を与える可能性があります。

現在の文生ビデオでは依然として多くの手動調整が必要であり、レンズと物理世界の復元が 1:1 で実現できない場合、AI を使用してビデオ素材を生成することの費用対効果は実際には高くありません。

これを踏まえて、映画やテレビのポストプロダクションに携わる専門家は、Lujiu Business Reviewに対し、AIが直接的に置き換えることができるのは、実際には建設や撮影などの中期的な作業だと考えていると語った。 AI による物理世界のシミュレーションは、継続的なトレーニングを通じて現実のレベルに近づけることができるからです。

上記は、ソラが映画・テレビ業界にもたらした変化のほんの一部です。ゲーム、広告、短編動画制作などのサブセクターに関しては、変化は問題よりもはるかに大きいことは間違いありません。 AIの応用は、必ず革命的な変化をもたらすでしょう。国内の大企業は、AIアプリケーションの商業的探求において、明らかにより積極的に努力し、新しいことに挑戦しています。

同様に、周亜輝氏の友人によると、「Open AI はまもなく GPT4.5 をリリースする予定であり、Anthropic が Claude 3 をリリースするときに意図的にリリースすることを選択するものと推定されます。」 Sora の生成ビデオに加えて、Open AI の最新バージョンには他にどのような驚くべき革新的機能がありますか?これは、大型モデル戦略や事業部門を担う国内大手企業にとって最も懸念される課題であるはずだ。

最後に、Wensheng Video にとっての選択肢は、+AI に依存して大規模モデルを適用するか、AI+ に依存して独自の大規模モデルをトレーニングおよびアップグレードするかです。明らかに、アメリカと中国の大企業は独自の選択をしてきました。

著者: 胡家明 WeChat パブリックアカウント: Lujiu Business Review

<<:  新たなプレーヤー、新たな変化、2024 年の地元の生活はどうなるのでしょうか?

>>:  電子商取引の二極化:タオバオ、京東、抖音は価格で競争し、動画アカウントはブランドで競争

推薦する

Shopee Chat に必要な最小応答率はどれくらいですか?要件は何ですか?

Shopee セラーチャットは、購入者と販売者間のコミュニケーションツールです。Taobao の A...

どうやって?ヨーグルトアサシンも登場!

ヨーグルトのマーケティング価格が高いのは、ブランドが製品の品質と味に多大な力を入れているためか、高級...

Amazonプライムデーのプロモーションを設定するにはどうすればいいですか?手順は何ですか?

越境ECプラットフォームとして、Amazonは非常に発展してきました。このプラットフォームで欲しい商...

オンライン教育の変換ボトルネックを運用を通じて突破する方法、この方法を理解する必要があります

コンバージョン率は、あらゆるオンライン教育会社の頭上にぶら下がっている厳しい輪のようなものです。この...

Amazonの自然なランキングを向上させるにはどうすればいいですか?ランキングを安定させるには?

販売者にとって、Amazon でのトラフィックと売上を増やしたい場合は、検索結果における商品の自然な...

LazadaとShopeeのどちらが良いでしょうか?越境電子商取引を運営するには?

淘宝網、JD.com、拼多多などの国内電子商取引プラットフォームに加えて、我が国では多くの越境電子商...

新年の品祭りを総括すると、今年、電子商取引プラットフォームはユーザーにどんな驚きをもたらしたのでしょうか?

毎年恒例のお正月グッズ祭りがやって来ます。ユーザーの心を掴み、消費者を引き付け続けるために、大手電子...

Fordeal 加盟店はどのようにログインするのですか?ログインプラットフォームはどこですか?

Fordeal は、消費者にさまざまな高品質のファッション製品を提供するグローバルなファッション e...

越境電子商取引企業は返品を避けるためにどのように商品を選択すればよいのでしょうか?どのように充電しますか?

越境ECプラットフォームで店舗を開設した後、誰もが商品の選び方を学ぶ必要があると考えます。商品の選択...

毎年恒例の春節マーケティングコンテストで、私とウサギはどうやって何千ものトリックを思いつくのでしょうか?

ブランドマーケティングにとって、旧正月はマーケティングの結節点として、消費者の感情的な支持、循環的な...

Bサイドオペレーションの3つのレベル(第1部):主なBサイドオペレーションの内容と欠点

B サイドの操作フィールドでは、異なる領域は異なる能力とレベルを表します。この記事では、B サイド業...

Amazon で間違ったカテゴリーを報告するにはどうすればよいですか?適切なカテゴリーを選択するにはどうすればいいですか?

Amazon 製品の広大な世界では、各製品には独自の特定のカテゴリがあります。しかし、販売者が過失や...

Lazada のローカルストアはどのように商品を配送しますか?配送プロセスの紹介

Lazada でストアを開設する場合、越境ストアまたはローカルストアの開設を選択できます。越境ストア...

Shopee で最適化できる領域はどこですか?最適化の方法は何ですか?

Shopeeは越境ECプラットフォームとして、比較的順調に発展しています。ますます多くの商人がこのプ...