Tongyi Qianwen: 3 番目のテーマを飛ばしますが、AI 電子商取引とどのような関係があるのでしょうか?

Tongyi Qianwen: 3 番目のテーマを飛ばしますが、AI 電子商取引とどのような関係があるのでしょうか?

2023年には、AIビッグモデルが私たちの生活をほぼ覆すでしょう。動かずに3回目の運転試験に合格し、写真からビデオを生成することができます。電子商取引とどのように組み合わせるのでしょうか?一緒に見てみましょう!

海底澳の男たちは、3番目の科目のせいで何度も足首を捻挫した。

しかし、どんなに計画しても、同義千文がひっそりと立ち上げた「全国舞踊王」の力を借りて、写真一枚だけで誰もが第3科目に合格できるとは思っていなかった。

大規模モデルの現在の「姿勢レベル」では、テキストからテキストを生成したり、テキストから画像を生成することは「子供の遊び」になっています。ランキングでどれほど熾烈に競争しようとも、本当の競争はクロスモーダル生成の分野に到達している。これは「King of Dance」の画像生成ビデオの場合であり、マスクやザッカーバーグなどの有名な外国人にビデオで中国語を話させる場合も同様である。

さらに、「King of Dance」が頼りにしている「Animate Anyone」モデルは、もはや単なる「おもちゃ」ではありません。 Alibaba Cloud の最新の Outfit Anyone「ワンクリックフィッティング」モデルと組み合わせると、Taobao で服を購入し、写真をアップロードして、それが自分に似合うかどうかのダイナミックなビデオを見ることができる未来もそう遠くないでしょう。

アリババの「AI電子商取引」の夢は、今やパズルの新たなピースを手に入れた。

1. 海外では3ヶ月前から人気

サブジェクト・スリーが「驚異的な」ダンスとなった理由は、国内のショートビデオプラットフォームで人気が高まったからではなく、5、6年前の社交ダンスがすでにその人気を獲得していたからではなく、文化的成果の象徴となり、主流に入るための切符を獲得できるかどうかだ。

結果だけから判断すると、Subject 3 は短編動画プラットフォームの枠を超え、ゲームに組み込まれ、国際的な舞台に進出していると言えます。

例えば、昨年12月9日に開催された世界スポーツダンス大会では、世界チャンピオンのクリスティーナと数人のダンサーが「Subject Three」の国家標準バージョンを披露しました。テンセントが1か月前にリリースした「本物の家族向けパーティーゲーム」『Mean Dream Star』では、老虎はキャラクター限定の「被験者3」の表情や動きも発見した。

今日、「万能ダンス王」になるには、Tongyi Qianwen アプリに全身写真をアップロードし、約 10 分間待つだけで、10 秒間の短いダンス ビデオが生成されます。

「国民舞踊王」のテンプレートエリアに入ると、DJスローロック、ただ「愛してる」と言いたい、鬼のステップダンス、モンゴルダンス、主題3、パドリングステップなど、12の人気ダンスモジュールから選択できます。選択できるオプションはたくさんありますが、トラフィックと注目度の観点から、主題3は間違いなくCの位置にあります。

時系列を辿ってみると、海外のショートビデオ専門家が主題3について「話題」になり始めたのは、昨年の10月から11月頃だったことがわかります。ほぼ同じ時期に、Alibaba Cloudチームは「Almighty Dancer」に関連する大型モデルの技術文書を公開しました。

科目 3 のダンスの種類は、一般的なジェスチャーダンスとは異なることに注意してください。ある程度のダンスの基礎と手足の協調性が必要です。つまり、海外では誰もが簡単に対処できるわけではないのです。

しかし、アリババクラウドが発表した論文では、「Animate Anyone」モデルを使用して、固定されたキャラクター画像を特定の姿勢シーケンスによって制御されるアニメーション動画に変換しています。つまり、これまでダンスのスキルがなかった人でも、このモデルを使えばたった一枚の写真から始めることができ、すべてのダンス初心者にショートビデオの分野で「舞台に立つ」可能性がもたらされるのです。

そのため、「Animate Anyone」を紹介するこのツイートが、1か月足らずで5000万回以上のヒットを記録したのも不思議ではありません。

2. 画像を「主題3」にジャンプさせます

「Animate Anyone」が登場する前は、静止画像を動的な動画に合成するには、乗り越えるべき「ハードル」がまだ多くありました。

1 つ目は、細部の一貫性です。たとえば、市販の AI 画像やテキスト生成ビデオでは、主題以外の画像に局所的な変形、細部のぼやけ、フレームレートの制御不能などの問題が発生することが多く、ビデオ生成の品質に影響を与えます。

もう 1 つの例は、モーション制御と継続性です。ビデオを商業的に使用する場合は、ビデオ内のキャラクターの動きを制御できる必要があります。 AI 生成の場合、キャラクターのアクションは主に事前入力されたアクション シーケンスによって制御されます。しかし、現在の AI 動画のキャラクターの動きはプロンプトで正確に制御することはできません。

画像からテキストを生成するプロセスでは、画像からビデオへの変換プロセスも処理する必要があり、このプロセスで画像の空間的および時間的な一貫性を確保する必要があります。

これまで、Stable DiffusionやMidjourneyなどのAIGC製品は、テキスト生成画像、画像生成画像、画像生成動画などのクロスモーダル生成機能を当初から持っていたが、AI生成動画の分野では前述の問題はまだ解決されていなかった。

「Animate Anyone」では、前述の問題が大幅に改善されました。まず、チームは「ReferenceNet」と呼ばれる補助モデルを使用して参照画像の空間詳細をキャプチャし、各フレームのキャラクターの外観の詳細の一貫性を確保しました。

次に、チームは効率的なポーズ ガイダーを使用して、キャラクターの動きの姿勢を効果的に制御しました。動画では、キャラクターは設定された姿勢に従って安定した遷移で動き、連続性と滑らかさを確保しています。

これまで AI によって生成された動画の詳細が制御不能だった主な理由は、各フレーム間の時間関係が十分に近くなく、多くの詳細を次のフレームに保持できなかったためです。 「Animate Anyone」モデルでは、タイミング生成モジュールを使用して複数のビデオ フレーム間の関係を確保し、プロセス全体を通じて多くの高解像度の詳細が保持されます。

多くの技術的問題が解決されたにもかかわらず、「万能ダンス王」の現世代効果は、カメラに映った実際の人物の効果とは依然として多少異なります。たとえば、生成されたダンスのリズムは均一ですが、実際の音楽のほとんどは速いリズムと遅いリズムの間で分散されています。これにより、必然的に「Subject Three」テストの有効性が低下します。

しかし、前作と比較すると、「Animate Anyone」は、画像の一貫性、姿勢の安定性、マルチフレーム関係の制御など、最も重要なキー問題を解決し、画像生成ビデオトラックで10〜60ポイント以上のブレークスルーを達成しました。

3. AI 電子商取引のパズルのもう 1 つのピース?

写真ビデオが 10 ポイントから 60 ポイントに上がるということはどういう意味ですか?

つまり、顔、体の比率、衣服の詳細、背景情報を完全に保存できるだけでなく、生成された動きを正確に制御でき、生成されたビデオの長さは技術的に制限されません。 Gen2 や Pika などのテキスト生成ビデオ製品と比較すると、AnimateAnyone は人物自身に重点を置いています。

つまり、「Animate Anyone」は、少なくとも画像生成動画の分野においては、AI動画を「おもちゃ」から「商用利用の初期段階」へと進化させたのだ。アリババが最近立ち上げた「Outfit Anyone」と組み合わせると、ユーザーは衣服の平面画像を見るだけで、上下の衣服を試着することができる。

2つを組み合わせると。ユーザーは、写真をアップロードすることでお気に入りの服のほとんどを試着できるだけでなく、ダイナミックなアニメーションを通じて、自分に似合うかどうかを直接プレビューすることもできます。 AIのせいでタオバオのモデルたちが職を失ったと言うよりは、AIによって誰もが自分自身のモデルになれるようになったと言う方が良いでしょう。

もちろん、「Animate Anyone」はこれ以外にもさまざまな場面で応用できます。多くのゲーム開発者は、このアルゴリズムを使用して、静的なゲーム キャラクター画像をさまざまな動きや姿勢を持つアニメーション キャラクターに変換し、同じ素材を何度も再利用して、対応するキャラクターの没入感と信頼性を高めることができます。

人々がタオバオで物を買うときに最も恐れることは何でしょうか?それは、「売り手のショー」と「買い手のショー」の違いによってもたらされる信頼性の低さです。しかし、AI アバターが Taobao モデルになると、この懸念はほぼ解消され、取引における最も重要な信頼コストもなくなります。

Pinduoduoの時価総額がちょうどアリババを超えたとき、馬雲氏はPinduoduoに祝意を表しただけでなく、「AI電子商取引」の概念についても具体的に言及したことを今でも覚えています。「AI電子商取引の時代は始まったばかりであり、これは誰にとってもチャンスであり、挑戦でもある。」

価格と取引の面では、消費者が好みの製品を購入するのに役立つ AI 駆動のリアルタイム価格比較が考えられます。サービスと体験の面では、デジタルアフターセールスが向上し、より没入感のあるショッピング体験が実現する可能性があります。

ユーザーが服を試着できる「AIモデル」は、衣料品カテゴリーの体験におけるほんの小さな一歩に過ぎませんが、アリババのAI Eコマース戦略全体から見ると、無数の基本パズルのピースの1つに過ぎないかもしれませんが、非常に重要なピースでもあります。

著者:Lao Hu、監修:Daman、レイアウト:Yuqi

ソース公開アカウント:IQ税務研究センター(ID:gh_c55b3561ece1)、世の中は罠でいっぱいです、私はあなたのために罠にかかります!

<<:  ハルビンは今や富の街

>>:  DingTalk個人版が本格始動、「真歓伝説」とコラボしたAI写真テンプレートも登場

推薦する

婦人服返品率の決戦、フルリンク最適化で返品率を20%削減する方法、1万字の実践体験(第2部)

本稿では、婦人服電子商取引における高返品率の問題点を深く分析し、フルリンク最適化の実践的な経験を提供...

Lazadaの取引手数料はいくらですか? Lazada はどのように手数料を請求しますか?

Lazada でストアを開設したい場合、まず Lazada プラットフォームのストア開設手数料と L...

法人なしでAmazonにストアを開設することは可能ですか?店舗運営方法は?

Amazonプラットフォームが成長を続けるにつれて、ますます多くの人がAmazonでストアを開設し始...

オリンピックは終わった。オリンピックの創造性の価値を考えてみよう

オリンピックが成功裏に終了し、イベント全体を振り返ると、創造的な要素が輝かしいハイライトとなった。会...

缶詰食品製造におけるHACCP認証の適用

缶詰は中国の食品輸出産業の重要な製品であり、年間輸出量は約100万トンで、主に米国とヨーロッパ、そ...

Amazonは旧正月期間中どのように休暇を取るのでしょうか?休暇中はどのように対処すればよいでしょうか?

基本的に、電子商取引プラットフォームが休日を取るかどうかは、販売者自身によって決まります。販売者が旧...

Jumia プラットフォームはどうですか? KilimallとJumiaのどちらが良いでしょうか?

越境電子商取引の分野には多くのプラットフォームがあり、プラットフォームによってターゲットとする市場が...

トップインフルエンサーの月間売上高は5000万です。電子商取引よりも共同購入で販売する方が良いのでしょうか?

デジタル時代の到来により、ライブストリーミングはもはや電子商取引が収益を得る唯一の方法ではなくなりま...

越境ECストアの開設にはいくらかかるのか(AliExpress、Wish、eBay、Shopeeの開設費用まとめ)

越境電子商取引といえば、AliExpress、eBay、Shopee、Wish などのプラットフォー...

32,000人のファン、30万件の注文

スナック食品の販売競争は熾烈であり、成功するには勤勉さ、誠実な共有、徹底的なテスト、ライブストリーミ...

平大雪は「消費内消費」ですべての若者を治した

代替消費はコストパフォーマンスの高さを追求する若者の間で人気があるが、その持続性は購入者の体験によっ...

5日間でファン数が300万人以上増加、「三匹の小老人」生放送室に若者が殺到

9月10日の李佳奇事件を受けて、国内ブランドはマーケティングを展開し、共同で商品の宣伝に全力を尽くし...

専門家の3番目のデータ分析方法:トレンド分析

データ分析の世界では、トレンド分析はそのシンプルさと直感性から人気があります。しかし、その本質を本当...

18億回の再生回数を誇るこの「ドラマ王」から、ひっそりと金を稼いでいるのは誰なのか?

「人生の喜び2」は、18億回再生という驚異的なドラマとなっただけでなく、商業分野でもIP派生作品の...

アリババ国際ステーションのアカウントマネージャーの成長見通しは良いですか?

アリババは誰もが知っています。タオバオとTmallはどちらもアリババに属しています。アリババはソフト...