口頭ビデオ、中国メーカーが戦いに加わる

口頭ビデオ、中国メーカーが戦いに加わる

過去6か月間、AI生成ビデオが断続的に宣伝され、口頭ビデオも中国メーカーが継続的に参入している主要な分野になりました。

動画にナレーションを付けることはできますか?これは今起こっていることだ。

OpenAIの大規模人間動画モデルSoraのリリース後、国内企業が相次いで市場に参入し、国内の大規模人間動画モデルは加速段階に入った。

過去6か月間、AI生成ビデオは断続的に進歩してきました。

中国初の自社開発大型動画プラットフォームを標榜するViduと、その後ByteDance、Tencentなど多くの国内メーカーが発表した動画プラットフォームは、たびたび外界から注目を集めてきた。

最近、もう一つの国産ビデオ大モデルが参戦し、快手「克玲」ビデオ世代大モデルの公式サイトが正式にオープンした。

21日、快手克玲は大型アップデートをリリースし、画像から動画への機能が正式にオープンし、静止画像を5秒間の動画に変換できるようになりました。ユーザーはプロンプトテキストを通じて画像内のオブジェクトの移動を制御できます。同時に、動画継続機能も開始され、ワンクリック継続や生成された動画の複数連続継続をサポートし、最大約3分の動画を生成できるようになりました。

これまで各社が発表した大型動画モデルは主に動画表示用だったが、今回発表されたKeling大型モデルはSoraと同様の効果を持つだけでなく、KuaishouのKuaiyingアプリで招待テスト体験も開始された。

Kuaishouによると、Keling大型モデルはKuaishou AIチームによって開発されたという。これは、Sora と同様の技術的ルートを採用し、独自に開発した数々の技術革新を組み合わせています。生成するビデオ解像度は 1080p に達し、最大長は 2 分 (フレーム レート 30fps) に達し、自由なアスペクト比をサポートします。

さらに、当局者は、ケリング大型モデルは大規模で合理的な動きを生成し、それを客観的な運動法則に適合させることができると主張した。

公式ビデオの例では、宇宙飛行士が月面を走っています。カメラがゆっくりと上昇するにつれて、宇宙飛行士の歩き方と影は合理的かつ適切に保たれます。

ほぼ同時に、Meituは7月末に新製品MOKIを発売すると発表した。この製品は、Meitu の大規模モデルのビデオ生成機能に基づいており、ユーザーが AI 短編映画を生成するのに役立ちます。

しかし、多数登場した大規模言語モデルに比べ、大規模動画モデルは盛り上がりが遅く、巨人の存在感に欠けるという見方もある。

なぜそうなるのでしょうか?

大企業は興味がないのでしょうか?

同時に、大規模言語モデル競争の最終ラウンドでは、Kuaishou と Meitu の存在感は低かった。

そして、大型ビデオモデルの分野において、この 2 社の最大の優位性は何でしょうか?

この点について、北京ビジネスデイリーの記者ウェイウェイ氏とシュ・レ氏が議論した。私は思う:

まだ「大学入試」の準備段階にある大企業は、「ポスドク」レベルを直接攻撃することはないだろう。

ビデオを作るということは、単に PPT を構成する写真の集まりを作るということではありません。大企業はこの分野への取り組みを急いでおらず、あまり現実的ではありません。それは単なる筋肉ショーです。

結局のところ、ビデオ生成は、AI の描画をまとめて漫画にするだけではありません。

イメージの一貫性、描写との整合性、光と影の分け方、絵コンテの演出など、より細かい部分まで考慮するほか、プロットを理解して再現する力もあります。

これらすべてには、ビデオ構造、コンテンツ分析、撮影技術、物語の作り方など、複数の垂直分野における詳細な学習が必要です。

その難しさは、チャットや絵を描くこと、チェスに特化することなどとは程遠く、データの蓄積とユーザーのエラー修正によって達成できます。

映画やテレビの分野の巨匠でさえ、間違いを犯すことがよくあります。まだ「大学入試段階」にある人工知能で映画を作ることが、いかに難しいことか想像がつきます。

しかし、快手と美図は、たとえそれが単なる見せかけであっても、筋肉を披露する必要がある。

KuaishouにしろMeituにしろ、大規模ビデオモデルの分野における最大の優位性は、人工知能のディープラーニングのための豊富な「学習教材」を持っていることだ。

これらの「学習教材」に頼ることで、特定の著作権の問題を回避できます。さらに、ビデオ分野での長年のコンテンツの蓄積、垂直セグメンテーション、ラベリングを通じて、大規模モデルは知識をより良く「取得」できるようになり、アルゴリズム設計においても一定のビデオ専門性を備えています。

しかし、それだけです。技術的には、人工知能アルゴリズムの独自の蓄積がまだ不足しています。

また、ビデオビッグモデルが成熟したとしても、映画・テレビ業界で大きな躍進を遂げることは難しい。

短編ドラマでも、広告でも、長編ビデオでも、映画でも、すべて「超大作特殊効果」が使われます。

しかし、最終的に観客を惹きつけるのは、その内容(脚本からカメラの動き、俳優の演技力まで)です。

これらが大規模な商業収益化の鍵となります。

大規模なビデオモデルであれば、アニメーション分野でビジネスチャンスを見つけやすくなるのではないかと思います。

<<:  マナーの現在の主な矛盾は、ブティックとしての位置づけとコスト効率の高いルートの不一致です。

>>:  ビデオ1本の価格は35万元近くになる。短編ドラマ会社は投資ではなく数で競争している。

推薦する

WeChatの「ギフトを送る」機能は現在グレーテスト中、ネットユーザー:赤い封筒はもう人気がない

WeChatは「ギフトを送る」という新機能を開始しましたが、現在はグレースケールテスト中です。ユーザ...

FSC認証:「森林包装トレンド」が全国に広がる

何千もの牛乳や飲料の紙パックが廃棄され、大量の森林資源が消費されていることになります。森林保護と人々...

3980元の観光カードは1元以下です。どうやって収益を得るのですか?

この記事は、観光カードプロジェクトの起源から始まり、観光カードの開発の歴史、運用モデルなどの側面を詳...

「は」ビールも二酸化炭素を排出するんですか?負担なく「はっ」とさせるために、ビールメーカーも全力を尽くしています

「ビールを飲むときは二酸化炭素の排出に気を付けないといけないのか?将来は楽しい会話ができるのか?」暑...

「最低価格」はeコマースプラットフォームを救うことができるか?

本稿では、快手が「新モール」に向けて準備を進め、「価格力」を改めて強調したことや、他の電子商取引プラ...

アリババ国際ステーションはどのように運営されていますか?手順は何ですか?

誰もがアリババ国際ステーションに店舗を開設したいと思っています。結局のところ、越境電子商取引は現在か...

小紅書の推薦をどう理解すればいいのでしょうか?シード設定で最もよくある3つの間違い

小紅書における「草を植える」ことは、コンテンツを共有するだけでなく、ユーザーの購買意欲を刺激すること...

Amazon ABA の使い方は?使用方法

Amazon でストアを開設するときは、ストアをより適切に管理および運営できるように、いくつかの販売...

編集でお金を稼ぐにはどうすればいいですか?ヒット商品を生み出すには?

電子商取引分野では、Wish プラットフォームは独自のアルゴリズムと大規模なユーザーベースにより多く...

個人が国境を越えた支払いを受け取る方法は何ですか?お支払い方法

個人でも法人でも越境ECビジネスを行うことができます。独自のブランド会社をお持ちでない場合は、個人の...

サムは不安がないわけではない

世界の小売業界で大きな進歩を遂げてきたサムズクラブは、最近、中国市場での拡大において課題に直面してい...

5月の私のお気に入りの8つの文章!

この記事では、5月に注目すべき優れたコピーライティングの実例に焦点を当てます。著者は、美団の子供の日...

データがビジネスを牽引する、標準化のプロセス全体をまとめました

「ビジネスを推進する」という言葉はデータ担当者を怖がらせるものだと言えますが、リーダーたちはそれを好...

起業家が100万ドルを節約するための6つのヒント

この記事の主な内容は、初心者起業家にとっての6つの利点について書くことです。それは、新しい機器を購入...

コンピューターを使用してShopeeをライブ放送できますか?有効化の条件は何ですか?

現在、ライブストリーミングは国内の電子商取引プラットフォームだけでなく、越境電子商取引プラットフォー...