新しいRunwayモデルを試した後、OpenAIのSoraは本当に危険だと思う

新しいRunwayモデルを試した後、OpenAIのSoraは本当に危険だと思う

ランウェイの新モデルを試乗した観客からは歓声や笑い声が上がり、さまざまなショットがバーチャルなのかリアルなのか判別しづらかった。 Runway の画像、テキスト、ビデオ生成機能を見てみましょう。

今日の記事を始める前に、知微編集部はソラに厳粛にメッセージを送りたいと思います。兄さん、テストを開かないと、このファンは台無しになります。なぜなら、今日、待望のRunwayがついにGen3バージョンを完全にオープンしたからです。この新世代バージョンで生成されたビデオの長さは、元の 4 秒から 10 秒に伸びました。

コメントをざっとめくってみると、みんな歓声をあげて興奮しているのがわかります。傍観者の中には、「これが現在最高のビデオ AI だ」と厳しい声さえ上がった。

Runway の公式ツイートに示されている例から判断すると、Gen3 バージョンの効果は確かに目を引くものです。多彩なカメラ配置、高精細な肌の質感、自然なキャラクターの動き。これで仮想と現実の区別がつくでしょうか?

こうなると、まだ心を開く気配のない隣のソラが心配で仕方がない。なぜなら、文化ビデオの分野では、誰もが最高の作品をリリースしようと競い合っているからです。 PikaからLuma、そして少し前に海外で流行ったKuaishou Keling AIまで。

以前は、外国人が快手科霊AIの試験資格を取得するために中国語で「お願いします」と入力することもありました。今回の第3滑走路の全面オープンにより、ケリングから人々の注目が逸れてしまいました。

Soraはまだテストできないため、今回Zhiwei編集部は国内外で広く認知されている文化ビデオモデルであるKuaishou Keling AIとRunway Gen3を比較し、Runway Gen3の効​​果を皆さんに見てもらえるようにしました。

テストの前に、Keling AI は Kuaishou から来たものなので、食事関連のシーンに特に優れていることを説明しておきます。一方、Runway3 は、リアリズム、想像力、優れたレンズの美学を促進することに重点を置いています。両家の特徴を踏まえながら観ていただけます。

まず、新規プレイヤーの得意技である「Runway Gen3」から始め、映画のような雰囲気を醸し出せるキーセンテンス「孤独な男がバーで酒を飲む」を与えました。

(ヒント: 静止した、固定されたショット、厳しい、ネオンの光、バーに座っている孤独な人物、飲み物をすすりながら空を見つめている、混雑した、薄暗いバー、孤独で憂鬱) 結果が出る前に、Runway は生成時間に関してすでにわずかな差で勝利していました。 5 秒間のコンテンツを生成するには数分かかるからです。

しかし、Runway では 1 分以内に 2 倍の長さのビデオを作成できます。さらに、時間はかかりますが、素早い作業の方が実際にはより良い結果を生み出すことができます。カメラがズームインすると、男は横を向いて目を開けた。一連のショットの配置により、この作品は間違いなく数百万ドルの価値のある作品となった。口を開けた部分のやや不自然なクローズアップがなければ、ハリウッド映画のクリップだと言われても間違いなく多くの人が騙されるだろう。

滑走路 Gen3↓

しかし、外征したキャラクターとして、柯玲のAI生成効果はまったく劣っていません。また、主人公がカップを見つめる表情は、「孤独」という設定にぴったり合っています。

ケリングAI↓

勝者がいないので、もう一回やりましょう。今回のキーセンテンスは「消防士が火を消すドラマ感」です。

(ヒント: シルエット ショット、燃える建物の燃え盛る炎、火災と戦う消防士、放水、人々の救助、夜に燃える建物、ドラマチック、英雄的)

この時点で、Runway Gen3 の利点は特に明らかでした。キャラクターのシルエットのレンズ加工とオレンジカラーが、写真全体を荘厳かつ情熱的に演出します。

滑走路 Gen3 ↓

生成されたコンテンツにはまだ問題はありませんが、キャラクターの動きも非常にリアルです。しかし、画像の処理は、まるで偶然火災現場を通りかかった熱心な市民が携帯電話で録画したかのような、少々無造作なものだ。非常にリアルですが、ショットの美しさは間違いなく『Runway』ほど良くありません。

ケリングAI↓

柯玲は第1ラウンドでやや劣勢だったので、今度は立場を変えて柯玲のホームグラウンドである食事中継に移りましょう。しかし、ここで計測しているときに、ちょっとした事件が起きました。知微編集部は、Runway が強力になった一方で、検閲も厳しくなっていることを発見しました。

もともと私は、古典的な古い映画を試して、ウィル・スミス氏を招待し、もう一度麺をすすってもらうつもりでした。残念ながら、[このコンテンツはマークされています]と言われました。有名人だけでなく、ピクサーのアニメーションも禁止リストに載りました。

仕方がないので、話題を「麺類を食べる男性」に変更するしかありません。

(ヒント:温かみのある居心地の良い照明、集中した表情の人、箸やフォークを使って上手に麺をすする、カジュアルな食事環境、楽しくて満足できる)

ホームコートになると、Keling AI は安定したパフォーマンスを発揮し、無敵でした。効果は最初のテストよりもさらにリアルでした。麺の熱さが顔に伝わってくるのを感じました。

ケリングAI↓

ラムウェイに到着すると、麺のテレポートや口のずれなど、古い AI の問題が見つかりました。しかし、実際には、結果は大幅に改善されました。少なくとも彼は箸の使い方を知っている。大食い放送の王様、柯玲に会ってしまったのは残念だ。滑走路 Gen3 ↓

食べるショーを試した後、知微編集部は他の多くの体の動きの質問にも挑戦しました。羊に自転車に乗らせるなど、現実には存在しないものを描かせてみましょう。

(ヒント: 遊び心のある POV ショット、乗る羊を追う、暖かく晴れた日、ビンテージ自転車の上にとまったふわふわの白い羊、熱心にペダルをこぎながら田園地帯を進む、野生の花が咲き乱れる曲がりくねった田舎道、気まぐれで楽しい)

実際、両側の効果は非常に良好で、両方の羊が非常に一生懸命ペダルをこいでいます。

滑走路 Gen3 ↓

ケリングAI↓

しかし、知微編集部がテストを重ねるうちに、あることがわかった。つまり、ビデオ AI がどれだけ強力であっても、実際の物理エンジンに勝つことはできません。たとえば、私は彼らにバスケットボールをやるように頼みました。

(ヒント: 男性の動きを追うダイナミックなトラッキング ショット、バスケットボールにスポットライトを当てた高コントラストの照明、被写体: スタイリッシュな黒いオーバーオールを着た若い男性、華麗かつ正確にバスケットボールをドリブル、鮮やかなグラフィティ アートが施された屋外バスケットボール コート、エネルギッシュ) ランウェイでは、ボールを空中でバウンドさせ、足でバスケットボールをドリブルするシーンが映し出されます。バスケットボールなのかフットボールなのかは分かりません。

(バスケットボールをプレイすることが意味理解の理由かもしれません。なぜなら、「ドリブル」という言葉はサッカーとバスケットボールの両方に使用できるため、AIはそれを区別して理解できない可能性があるからです)

滑走路 Gen3 ↓

Keling AI に関しては、状況はさらに奇妙になります。投げられたバスケットボールは二つに分かれ、その人には第三の手も生えた。

ケリングAI↓

バスケットボールは、少なくとも基本的な動きが正しいことを保証できますが、衝突や転倒などに関しては、誰も壊すことのできないこの卵のように、両者とも高度に抽象化され、一貫性があります。 (ヒント: 卵がテーブルから落ちて地面に割れる、スローモーション、クローズアップショット、窓からの自然光、サスペンス、期待が高まる)

滑走路 Gen3 ↓

ケリングAI↓

いずれも欠点はあるものの、全体的な経験からすると、Ruwnay3 は人気のある KeLing AI よりも基本的に優れていることがわかります。ほとんどの場合、公式の宣伝どおりです。信頼性が高く、高速で、十分に安定しており、さらに長さという追加のボーナスがあるため、想像力がどれだけ大胆であっても、高品質の結果が得られます。視聴者は、現実と仮想の境界が少し曖昧になったように感じます。

(ヒント: 密林を進んでいくと、古代の光り輝く異次元ポータルに偶然出会う、SF、視点。空気は謎に満ち、エキゾチックな野生動物の鳴き声が響いています。近づくと、ポータルが不気味な光を放ち、異世界のエネルギーに引き寄せられます。)

滑走路 Gen3 ↓

ただし、試合はまだ終わっていないので、急いでランウェイを応援しないでください。 AI分野では、その効果に加え、商業化という避けられない課題がもう一つあります。知微編集部は以前、国内メーカーの試算によると、約2分のビデオの価格は少なくとも180元になると紹介した。 。

底なしの穴の消費量が多いため、ビデオ生成のほとんどが 5 秒程度で止まってしまいます。多くの企業の世代効果もまだ非常に抽象的であり、大規模な言語モデルの出現後に繁栄する壮大なシーンがまったく欠けています。今回、Runway Gen3は10秒の壁を突破しましたが、それに伴い消費者のコストは増加しました。

前の世代と比べると、私たちはほぼ2倍のお金を費やしています。月額パッケージに基づいて計算すると、基本メンバーシップは月額 15 ドルで、購入者は 625 ポイントしか獲得できません。 Runway3 の 1 秒を生成するには 10 ポイントかかります。つまり、10秒のビデオの価値は2.4ドル、つまり約17人民元になります。

この記事で紹介したケースだけでも、どれくらいの費用がかかるか計算することができます。これは一般的な傾向であり、収益性はすべての大規模 AI モデルが直面している問題であるため、誰もこれを止めることはできません。

つまり、Runway3 は非常に強かったにもかかわらず、ゲームに勝利したのです。それでも、完全に無料の KeLing の方が魅力的であることを認めざるを得ません。ソラに関しては、すでに幻滅感を感じています。彼が役に立たなくなるまで、彼はただの美しいファンタジーの泡、0 ポイントです。

<<:  インターネット全体で話題になっている「都市か都市でないか」はなぜそんなに人気があるのでしょうか?

>>:  公式アカウントがなぜこのようにユニークなデザインになっているのでしょうか?

推薦する

月間売上5億円、返品率90%以上を誇る同社は、Douyinでトップのストリーマーとなった。

Douyinの月間売上ランキングでは、上位10位のうち5位をジュエリー商が占めており、Douyin...

「第二世代アンカー」の幸運と恥ずかしさ

ライブストリーミング電子商取引業界の急速な発展に伴い、「第2世代キャスター」という現象が徐々に表面化...

Shopeeの払い戻しはどのように処理しますか?販売者は何に注意すべきでしょうか?

電子商取引を行っている限り、どのプラットフォームでストアを開設したとしても、返金された商品に遭遇する...

中国ブランドはどうすれば日本市場に根付くことができるのか? Xidao Consulting、Romas、Heshengとの対話

日本の消費者の中国ブランドに対する認知度が高まるにつれ、ブランドの日本市場におけるチャンスは徐々に拡...

Amazon バックエンドにバリエーションを追加するにはどうすればいいですか?バックエンドにはどのような機能がありますか?

世界最大の電子商取引プラットフォームである Amazon は、販売者に強力なバックエンド管理ツールを...

越境電子商取引プラットフォームの代表者は誰ですか?どうやって選ぶ?

越境ECは確かに非常に人気があり、大きな発展の見込みがあるため、越境ECプラットフォームに店舗を開設...

Amazonで購入した商品は国内保証の対象になりますか?

アマゾンの幅広い商品ラインナップと競争力のある価格は、国内の多くの消費者の注目を集めています。しかし...

Sheinの靴はいかがですか?それは高価ですか?

越境電子商取引の台頭により、SHEINブランドは徐々に人々の注目を集めるようになりました。 Shei...

Lazada スーパーアフィリエイトとは何ですか?手数料はどのように請求されますか?

電子商取引業界には、店舗や商品を宣伝するためのツールが数多くあります。国内でよく知られているツールと...

海上運賃はどのように計算されますか?越境電子商取引の物流モデルとは何ですか?

越境ECプラットフォームで店舗を開設したい場合、物流の問題を解決する必要があります。通関が絡むため、...

Amazon の支払いは法人に縛られる必要がありますか?受取口座は何ですか?

Amazon の販売業者は、Amazon の支払いサイクルが通常約 14 日間であることを知っておく...

半年でプライベートドメインの収益が1億元を超えた「国産品の誇り」ウィノナは、プライベートドメインをどのように活用して業績の成長を実現するのでしょうか。

ウィノナを知っていますか?どのようにして急速な発展を遂げたのでしょうか?本記事では、ウィノナの開発か...

「一流」ミルクティーブランドから「時代遅れのネットセレブ」に転落した1DianDianはなぜ衰退したのか?

1DianDian は、トップミルクティーブランドから時代遅れのネットセレブになるまでに何を経験し...

FSC森林認証監査にはいくらかかりますか?

FSC 森林認証監査にはどれくらいの費用がかかりますか? これは、FSC 森林認証を受けようとして...

Shopee での無料戸別集荷の基準は何ですか?標準の紹介

Shopee で店舗を開設すると、販売者は注文を受けてから商品を梱包して発送することができます。商品...