中華IT最新事情

中国を中心にしたアジアのテック最新事情

Soraを超えたビデオ生成AI「Kling」(クリング)。その6つの優れた特長

まぐまぐ!」でメルマガ「知らなかった!中国ITを深く理解するためのキーワード」を発行しています。

明日、vol. 237が発行になります。

登録はこちらから。

https://www.mag2.com/m/0001690218.html

 

今回は、OpenAIのSoraを超えたのではないかと言われるビデオ生成AI「クリング」についてご紹介します。

 

すごいものが登場してきました。ビデオ系生成AIの「可霊」(カーリン、Kling)です。読み方は一定していませんが、英語圏では「クリン」「クリング」などと呼ばれることが多いようです。

このクリングは、OpenAI社が発表して大きな話題となった「Sora」(ソラ)に対抗するもので、テキストプロンプトを入力するとビデオを生成してくれるというものです。

何で大きな話題になっているかと言うと、Soraよりも生成される映像の出来栄えがいいからなのです。例えば、公式サイト(https://kling.kuaishou.com/)に掲載されている例では、プロンプトが「眼鏡をかけた中国の男の子がファストフード店で、チーズバーガーを目を閉じて味わっている」という5秒のビデオがあります。これのどこがすごいかと言うと、Soraではものを食べるビデオ生成は簡単ではなく、口が歪んでしまったり、くちびるではなく口のあたりから食べ物が中に消えていったり、人間の口と食べ物が融合してしまうようなことがありました。

ところが、クリングでは子どもがちゃんとハンバーガーを食べているのです。そして、驚くことに口の周りにバンズなどのカスがつきます。さらには肉汁でしょうか、口の周りが油でテカテカ光るのです。

もはや生成AIでつくったビデオなのか、ほんとうに実写で撮影した映像なのか判別がつきません。サンプル映像なので、うまくいったものを選んで掲載していることはあると思いますが、驚くべき精度なのです。

今後、Soraとクリングが競い合って、ビデオ生成AIを進化させていくことは間違いありません。

 

SNS「小紅書」に投稿されたクリングで生成されたビデオを見てください。

 

http://xhslink.com/ro2s9O

▲小紅書の亮亮さんがクリングで生成した映像。テキストプロンプトだけで生成されている。動きも実に自然。

 

水着の女性が微笑んでいるだけのビデオですが、言われなければ生成AIによるものだとは思えません。途中で水着が入れ替わったり、髪の毛の末端の動きが不自然というところで違和感を感じますが、ぼーっと見てしまうと実写だとしか思えないほどです。これが元画像なしに、テキストによるプロンプトだけで生成できるのです。

 

もうひとつ驚きなのが、このクリングを開発したのが「快手」(クワイショウ)であるということです。快手は中国版TikTok「抖音」(ドウイン)と同様のショートムービーサービスですが、抖音を運営するバイトダンスの陰に隠れてしまい、国際的な知名度はあまりありません。しかも、抖音が都市部、若い世代が中心であるのに対し、快手は地方都市、中高年世代が多いということから、日本で注目されることはあまり多くないように思います。

ユーザー層を反映して、ショートムービーの内容も「土味」の多いものが中心になります。抖音では若いユーザーによる自撮りダンス映像やペットの可愛い映像などが多いですが、快手では土味としか言いようのない映像が多いのです。

例えば、小さな町の広場で屋外で手品ショーをやっています。美女が箱の中に入って、人体切断のマジックが行われています。美女の入った箱が2つに切断され、2つの台車に分かれます。すると、観客の中の悪い連中が、その下半身の台車だけを持って逃げてしまうのです。手品師は追いかけますし、残された美女は箱から顔を出して「返して!」と叫んでいます。本当のリアルな映像なのか、コントとしてつくった映像なのかはわかりませんが、洗練されていない面白さがあります。土味とは、決して悪い意味だけではありませんが、田舎的ということです。

抖音は、国際版としてTikTokを新たに開発し海外展開をしました。現地法人もつくり、各国でインフルエンサーを発掘して、世界中にTikTokが急速に浸透していったのはご存知のとおりです。一方、快手も2017年から海外展開を始めていますが、アプリを各国で配信しただけで、起動すると中国の映像がそのまま流れてきます。そのため、多くの人がピンとこず、ブラジルとインドネシアである程度のシェアを取っただけで、海外展開はうまくいっているとは言えません。日本のアプリストアでも「快手」でダウンロードすることができますが、使っている方は多くはないと思われます。

 

ライブコマースでも抖音に大きく差をつけられています。抖音の2023年のライブコマース流通総額(GMV)は2.7兆元(約60兆円)ですが、快手は1.18兆元と半分以下です。

抖音はさまざまなブランドがライブコマースを行い、華やかさがありますが、快手はCEOライブを売りにしています。CEOと言っても、地方の小さなメーカーや販売店の社長が登場して、自ら商品を売り込むというものです。責任者自らが登場するために、ライブコマース番組的には華やかさはありませんが、信頼をしやすいために好んで快手のライブコマースで買い物をする人もいます。快手のライブコマースは単価の安いものも多く、抖音のライブコマースがジャパネットたかたのテレビ通販だとしたら、快手のライブコマースは夢グループ(https://yume-gr.jp/)のテレビ通販の趣きがあります。

 

そんな、失礼かもしれませんが、ちょっとダサいと見られていた快手からこのような世界最先端の生成AIが登場してきたことに中国人も驚いています。

そこで、今回は、このクリングがどのような生成AIなのかをご紹介します。6月6日に快手の視覚生成インタラクションセンターの責任者である万鵬飛(ワン・パンフェイ)氏が、北京で開催されたBAAIコンファレンス(https://2024.baai.ac.cn/)に登壇をし、クリングに関する講演を行いました。この内容に基づいてご紹介します。

今回は、クリングとはどのような生成AIなのか、どのような優れた点があるのかをご紹介します。

 

続きはメルマガでお読みいただけます。

毎週月曜日発行で、月額は税込み550円となりますが、最初の月は無料です。月の途中で購読登録をしても、その月のメルマガすべてが届きます。無料期間だけでもお試しください。

 

今月、発行したのは、以下のメルマガです。

vol.235:中国で人気爆発のサイゼリヤ。「安さ」だけではない、サイゼリヤの飲食版SPA

vol.236:BYDは日本市場で地位を確保できるのか。BYDの本当の黒船「DM-i」技術とは