「まぐまぐ!」でメルマガ「知らなかった!中国ITを深く理解するためのキーワード」を発行しています。
明日、vol. 171が発行になります。
登録はこちらから。
https://www.mag2.com/m/0001690218.html
今回は、中国のAIGCの現状についてご紹介します。
AIGCとはAI Generated Contentsの略で、AIが生成するコンテンツのことです。また、このようなAIはGenerative AI(生成AI)と呼ばれます。今、大きな話題になっているChatGPT(テキストを生成)やMidJourney(画像を生成)などが代表的なものです。
日本でもChatGPTのことは毎日のようにニュースになっていますが、中国でもまったく同じで、連日AIGC関連のニュースが飛び交い、投資家たちは中国の生成AI企業を探しまくっています。ある投資家は、「今、生成AIに投資をしない投資家は投資家とは言えない」とまで言っているほどです。
今、中国のAIGCがどのような状況になっているか、みなさんも知りたいことでしょうし、私も知りたいところです。
いつも励ましのメールとともにご質問をいただいている読者の方から、次のようなご質問をいただきました。いつもいつもありがとうございます。
―――――――――
Chat-GPT4が話題ですが、百度でも文心一言を発表し、今後もAI関連の開発は激化しそうな様相です。一部の中国人から「文心一言」は他AIサービスを流用してるとの批判もあるようですが(以下リンクは一例です)、米中それぞれのAIの実力および開発状況について、概況を解説していただけますでしょうか。どうぞよろしくお願いいたします。
―――――――――
今回は、趣向を変えて、このご質問に答えながら、中国の生成AIの現状についてご紹介していきたいと思います。
ただ、次のことにご注意ください。ChatGPTもそうですが、中国の生成AIも目まぐるしく状況が変わっていっている最中です。そのため、なかなか体系的に俯瞰をするようなことができません。また、今回書いたことが明日には誤りになってしまう可能性もあります。
例えば、ご質問に関連することなのですが、「文心一言」に付属している画像生成機能には大きな問題があり、ここしばらくはネット民のおもちゃになっていました。「こんなアホな画像が生成された」という楽しみ方をされています。しかし、この画像生成の欠点が、実は文心一言のモデルを推測する大きな手掛かりになってるため、後ほどご紹介します。
しかし、このメルマガを書き始めてからなのですが、ある人が「画像生成機能が格段によくなった」ということを教えてくれました。実際、MidJounery並みとまではいきませんが、十分に実用に耐えるレベルになりました。大幅なアップデートがあったようです。
このように刻々と状況は変わっていきます。
また、後ほど今わかっている状況の整理はしますが、それも刻々と状況が変わっていきます。あくまでも現時点での状況という前提でお読みください。
まず、アリババのスマートスピーカー「天猫精霊」(ティエンマオジンリン)のニュースからご紹介をします。
天猫精霊は、アマゾンエコーと同じようなスマートスピーカーで、音声で家電の制御を命令したり、簡単な質問に音声で答えてくれるというものです。この天猫精霊に新しい機能が載せられることが発表されました。それは実際の人間の分身を中に入れてしまうというものです。今回協力をしたのは、スタンドアップコメディアンとして若者に人気のある「鳥鳥」(ニャオニャオ)さんで、その分身データである「鳥鳥分鳥」をインストールすると、天猫精霊の応答の声と喋り方が鳥鳥そのままになり、それだけでなく、質問に対する答え、ものの見方なども鳥鳥そのものになるというものです。
▲鳥鳥分鳥を紹介した抖音のショートムービー。音声や話し方だけでなく、話す内容も鳥鳥そっくりのものになる。
この背後にあるのはアリババが2021年3月に発表した大規模言語モデル(LLM)「通義」(トンイー)です。テキストはこの通義が生成し、鳥鳥らしい文章に修正され、それを鳥鳥の音声と話し方で返すというものです。
この鳥鳥という人は、社恐(社交恐怖症)を芸風としていて、ボソボソと後ろ向きの発言をすることが受けている人です。現在のデモ映像を見る限り、まさにこの鳥鳥の話し方と内容になっています。
この鳥鳥分鳥の注目点は、この鳥鳥分鳥を制作するのに、鳥鳥さんは約1時間ほどスマートフォンを使って音声の録音をし、LLMの学習は1週間ほどの時間で完成したということです。つまり、他の人のAIモデルも容易に制作をすることができ、ネットではアイドルや人気俳優のAIモデルを販売してほしいとか、数時間の音声録音から亡くなった人の人格を天猫精霊で再現するなどが可能になると話題になっています。
また、LLMの性能にもよりますが、対話型であるため電話の受け答えなども可能であり、コールセンターや受付カウンターなどへの応用も話題になっています。
4月11日にアリクラウドサミットが開催されるため、ここで正式にLLMの発表が行われ、この鳥鳥分鳥についてもデモが行われるのではないかと期待されています。
中国の主要テック企業は、当然ながら以前からLLMの開発は行なっていて、百度の「文心」も、2019年には最初のバージョンが公開されています。公開といっても、私たちが自由に使える状態ではなく、あくまでも企業としての発表と論文発表です。
中国のテック企業にとってChatGPTの手法はまったく盲点になっていたのではないかと思います。それまでの中国の発想は、アリババの天猫精霊のように、応用先がしっかりとイメージできていて、それを裏から支えるLLMという考え方でした。そのため、開発は進めていますが、あくまでも裏方、プラットフォームであり、それが前面に出て商品になるとは考えていなかったと思います。
OpenAIは、ChatGPTそのものに商品価値があると考え、無料で多くの人に体験させ、最新のGPT-4を使うには有料、さらにAPIを商用利用するには契約が必要というやり方をしました。
アリババは、LLMの開発も消費者向け製品の開発もすべてできてしまうために、自然に消費者との接点は天猫精霊のような製品であり、LLMは裏方という発想でした。百度も小度(シャオドゥ)というスマートスピーカー製品があり、カーナビアプリ「百度地図」があり、検索ポータルがあります。消費者との接点はこのようなアプリやプロダクトであり、文心を前面に出す考えはなかったと思います。
そのため、ChatGPTが大きな話題になり、3月16日に、LLM「文心」にチャットインタフェースを持たせた「文心一言」を発表した時に、李彦宏(リ・イエンホン、ロビン・リー)CEOが「本来はこういう形で発表するつもりはなかった」と消極的な発言をし、株価を下げたのはこのような背景があるからです。OpenAIは、LLMの開発のみで応用面に関しては他の企業と提携するしかありません。そのため、プロダクトを広く知ってもらう必要があるため、無償での公開を行いました。これがうまく功を奏したことになります。
では、文心一言のできばえ、成熟度はどの程度なのでしょうか。多くの人が気になるようで、中国でも専門家、評論家が文心一言とChatGPTの比較をたくさん行なっています。その中から出てきたのが、冒頭のご質問者が指摘する問題です。
今回は、このご質問にお答えをし、文心一言がどのようなLLMであるのかをご紹介し、そして中国企業の生成AIの現状をまとめます。
続きはメルマガでお読みいただけます。
毎週月曜日発行で、月額は税込み550円となりますが、最初の月は無料です。月の途中で購読登録をしても、その月のメルマガすべてが届きます。無料期間だけでもお試しください。
今月、発行したのは、以下のメルマガです。
vol.170:米国議会はTikTokの何を問題視したのか。張一鳴の発想とUGCの衝突