中国、テキストから動画を作成するAIモデルを発表 - OpenAIのライバル

中国、テキストから動画を作成するAIモデルを発表 - OpenAIのライバル
Vidu アプリによって生成された、テキスト入力付きのデモ クリップからの画像。写真: SCMP

中国は、OpenAIのバイラルアプリSoraに似たテキストを動画に変換する人工知能(AI)ツールを導入したばかりだが、この新しいモデルでは、米国企業の60秒と比べて、16秒を超える動画しか作成できない。

サウス・チャイナ・モーニング・ポスト(SCMP)によると、ソラに追いつくための中国の最大の希望であるViduは、北京の名門大学である清華大学と提携して新興企業のShengshu Technologyによって週末に立ち上げられた。

同社によれば、このモデルは簡単なテキストプロンプトに基づいて1080p解像度のビデオを作成できるという。

「Viduは多くの分野で画期的な進歩を遂げた、自立型イノベーションの最新の成果だ」と、盛樹の主任科学者で清華大学人工知能研究所副所長の朱軍氏は述べた。

Vidu は、主に現実世界のシミュレーション、マルチレンズ言語、高い空間的・時間的一貫性、中国語要素の理解に反映され、ビデオ効果の大幅な改善を実現しています。 Zhu Jun 氏によると、Vidu は「想像力があり」、「物理的な世界をシミュレートでき」、「一貫したキャラクター、シーン、タイムラインを備えた 16 秒のビデオを制作できる」とのことです。同氏は、この人工知能モデルは「中国の要素」も理解できると付け加えた。

このモデルの発売時に、盛書はいくつかのデモ動画を公開した。その中には、草の上に座ってギターを弾くパンダや、湖で泳ぐ子犬などがあり、どちらも鮮明なディテールが映し出されている。

Viduの立ち上げは、マイクロソフトが支援するOpenAIなど、世界有数のAI企業に追いつこうと競争している国で期待を高めている。

2022年11月のリリース後、中国を拠点とする多数の競合他社に刺激を与えたOpenAIのChatGPTとは異なり、Soraが作成し今年2月に公開された印象的なビデオは、中国の大手テクノロジー系スタートアップから同じレベルの熱狂を引き出すことができなかった。

業界の専門家は、この分野での中国企業の成長を阻む要因の一つは計算能力の不足だと指摘する。

北京でスマートコンピューティングの分野で働く技術コンサルタントのリー・ヤンウェイ氏によると、Soraが1分間のクリップを作成するには、8個のNvidia A100グラフィック処理装置(GPU)を3時間以上稼働させる必要があるという。 「ソラが推論するには膨大な計算能力が必要だ」と彼は語った。

米国政府は、AIシステムのトレーニング用として最も需要の高いコンポーネントとなっているA100やH100 GPUなど、NVIDIA製の先進的なチップに対する輸出規制を強化したが、中国への出荷は禁止されている。

テキストプロンプトから Vidu モデルが作成したビデオからの画像。写真: SCMP

北京を拠点とする盛刚は2023年3月に設立され、コアチームは主に清華大学AI研究所のメンバーで構成されており、その他にもアリババグループホールディング、テンセントホールディングス、バイトダンスのメンバーも参加している。サウス・チャイナ・モーニング・ポストを所有するアリババ・グループも、独自のビデオ生成AIモデルの開発に取り組んでいる。

先月、盛樹はQiming Ventures、Zhipu AI、Baidu Venturesなどの投資家から数億元を調達した。

中国初のAIテキスト動画変換モデルは、米国拠点のOpenAIがリリースした同様のモデル「Sora」が世界中で大きな話題となってから約2カ月後、Shengshuによって導入された。

米国と中国という2つの超大国は現在、AIハードウェアとソフトウェアを設計する技術から、AIシステムを動かす原材料に至るまで、人工知能に関連する多くの側面で競争を繰り広げている。

AIは2023年に最も話題になるキーワードの一つですが、7年前、中国は2030年までに世界的な「AIイノベーションセンター」になることを目標とした野心的な開発計画を提案しました。その中で、中国は2025年までに「世界をリードするレベル」を達成し、2030年までに「世界の主要なAIイノベーションセンター」になることを目指しており、AIを産業のアップグレードと経済変革の主な原動力として優先しています。

<<:  AppleのiPadOSはEUの規制強化に直面

推薦する

公共投資支出における前向きな変化

2024年第1四半期およびその後の四半期に公共投資資本の実施と支出を促進することは、戦略的であると同...

Galaxy S23 FEはGalaxy Z Fold5とZ Flip5より先に発売される

現在、ソーシャルネットワーキングプラットフォーム上では、Galaxy S23 FE 128GBがGa...

ソニーのテレビをWifiネットワークに接続する最も簡単で効果的な方法を共有します

テレビを購入したばかりですが、ソニーのテレビを Wi-Fi に接続してエキサイティングなエンターテイ...

日本の企業は従業員に80歳まで働くことを認める

ブルームバーグは7月26日発行の日経新聞の記事を引用し、この決定の理由の一つは、日本のこの有名な小売...

4月12日の朝、米ドル価格は上昇を続けている

現在+/-5%のマージンが適用されているため、銀行が適用する上限為替レートは25,286 VND/U...

洗濯機の回転速度に影響を与えるものは何ですか?

回転速度は、洗濯ドラムが 1 分間に回転する総回数です。東芝インバーター7.5kg洗濯機TW-BK8...

LG TV の YouTube エラーを非常に効果的に修正する 5 つの方法

LG TV の使用中に、アプリケーション エラー、システム エラーなどの小さな問題が発生する場合があ...

良い耕作コンテストが仕事への愛を広げる

耕作者は耕作する水牛を制御します。良耕コンテストは、文化的価値、労働、そして「水牛は農民のキャリアの...

東芝インバータ冷蔵庫の点滅ライトエラーを修正する方法の説明

東芝インバータ冷蔵庫の点滅ライトの現象は迷惑なだけでなく、デバイスのパフォーマンスにも影響します。 ...

ボッシュの衣類乾燥機の使い方はシンプルでわかりやすい

Bosch の衣類乾燥機をお持ちで、安定して効果的に動作させるための使い方がわからない場合は、次の記...

米国は2025年にシカゴで初の空飛ぶタクシーサービスを開始する予定

スプートニクによると、米国の航空会社ユナイテッド航空はアーチャー・アビエーションと提携し、2025年...

パナソニック電子レンジ購入体験談

電子レンジは、主婦が食べ物をより簡単に調理したり温め直したりするのに役立つ強力なツールです。したがっ...

2018年に買う価値のあるパナソニックのテレビ5機種の提案

日本のブランドのテレビモデルは、常に多くの消費者に信頼され、選ばれる製品ラインの 1 つです。その中...

ディエンメイチョロンで2018年上半期に最も売れた曲面スクリーンテレビトップ3

曲面スクリーンテレビは、豪華で魅力的なデザインと、家族のエンターテイメント空間を飾るモダンなスタイル...

シャープの冷蔵庫は良いですか?買う価値はあるでしょうか?

シャープの冷蔵庫は、比較的価格が安いため、多くの家庭に選ばれている電化製品の一つです。しかし、こんな...