中華IT最新事情

中国を中心にしたアジアのテック最新事情

機械学習によるリコメンドがトレンド。EC「京東」、音楽サービス、TikTokのリコメンドシステム(下)

まぐまぐ!」でメルマガ「知らなかった!中国ITを深く理解するためのキーワード」を発行しています。

明日、vol. 094が発行になります。

 

今回は、リコメンドシステムについてご紹介します。

前回の続きになります。前回は、EC「京東」(ジンドン)のリコメンド、音楽ストリーミングサービスのリコメンドについてご紹介しました。

ECでは利用者の行動履歴に注目した協調フィルタリングやランキング学習が使われ、音楽ストリーミングではコンテンツ側の類似度に注目した分析が使われることをご紹介しました。今回は、中国版TikTok「抖音」のリコメンドシステムについてご紹介します。

 

前回ご紹介した利用者の履歴に注目した学習、コンテンツの類似度に注目した学習のいずれも抖音では使うことができません。

抖音では、ショートムービーを検索したり、気に入った配信主をフォロー(注目、ファン登録)して見ることもできますが、基本は流れてくるムービーを見るという使い方です。これはすべて運営側が利用者個人に合わせてリコメンドされたムービーです。

このリコメンドを行うには、利用者の視聴傾向を分析するだけでは不十分です。どのジャンルのムービーが好みかという分析をすることは可能です。しかし、例えば、同じダンス映像であっても、好みは人によりさまざまです。素人が一生懸命踊ったほのぼのとした映像が好きな人もいれば、プロフェッショナルが踊ったレベルの高い映像が好きな人もいます。

また、抖音は誰でも自由に投稿ができますから、仲間内でしか価値がわからない映像も山ほどあります。例えば、少女がダンスを踊って、恥ずかしくなって途中でやめてしまうというような映像は、知り合いの間では楽しめる映像になりますが、知らない人にとっては面白くもなんとない映像になってしまいます。そのようなものはリコメンドしないようにしなければなりません。

 

また、前回紹介した協調フィルタリングも利用できません。協調フィルタリングでリコメンドするコンテンツを炙り出すには、多くのコンテンツの視聴履歴のデータが必要になります。NetflixAmazon Primeのような映像サービスであれば、膨大なアーカイブがあって、その視聴履歴も溜まっているため、協調フィルタリングの手法が使えます。

しかし、抖音の場合、その日に投稿されたばかりのムービーを、その日のうちにリコメンドしなければなりません。つまり、視聴履歴データがない状態で、協調フィルタリングをしなければならないのです。これは不可能で、協調フィルタリングのコールドスタート問題と呼ばれています。

音楽ストリーミングサービスのように、コンテンツ側に注目した分析することもできません。Super Sonicのようなコンテンツの類似度分析は計算量が多く時間がかかります。音楽ストリーミングサービスは多くの楽曲アーカイブを持っているので、その計算をあらかじめしておくことができます。しかし、抖音の場合は、その日に投稿されたばかりのムービーを、その日のうちにリコメンドしなければならないのです。どうしたらいいでしょうか。

 

さらに、抖音の人気の秘密は、「普通の人が、面白いコンテンツさえつくれば、一夜にして人気者になる」という爆発力です。これが「私も有名な存在になれるかもしれない」と若い人を惹きつけています。見る側の人も「いつも新しい流行が起こる。新しい人気者がどんどん登場してくる」という高速で流行が回転していく感覚に惹きつけられるのです。

これはリコメンドを人力に頼る従来のSNSでは起こせないことです。一般的なSNSでは、人が転載をすることで拡散をしていきます。この拡散が爆発する時というのは必ず大量のフォロワーを抱えるインフルエンサーが介在をしています。2016年に「PPAP」(ピコ太郎)のムービーが全世界に拡散をしましたが、そのきっかけになったのはジャスティン・ビーバーリツイートをしたことでした。つまり、既存のSNSの流行は、メガインフルエンサーが決めているのです。

この構造は、流行をビジネスにしたい人には理解しやすく、収益モデルも作り出しやすいため人気になっていますが、流行を楽しみたい、文化面だけに興味があり、ビジネス面にはあまり興味がないという若い世代にとっては、マスメディアの構造と変わらず、面白く見えないのです。

そのため、抖音では、無名の若者が一夜にしてスターになる仕組みがどうしても必要でした。

 

抖音では、なんでもない普通の人が一夜にして全国レベルの有名人になっていたということがたびたび起こります。

2018年には成都甜甜(チャンドゥーティエンティエン)という女性が、一夜にして全国的な有名人になる「事件」が起きました。成都甜甜は、成都市に住む普通の女性でしたが、ウェブ番組の街頭インタビューに答えたわずか15秒程度の映像が猛烈に拡散し、人気となったのです。

その街頭インタビューは「結婚相手の男性にはどのくらいの月給が必要ですか」というものでした。多くの女性が具体的な金額を答える中で、成都甜甜ははにかみながら、「時々ご飯を食べに連れていってくれればいいです」と答え、その様子が純情で可愛らしいと一気に人気になったのです。

その後、スマホメーカーOPPO(オッポ)を始めとする企業が、ウェブCMなどの出演をオファーし、現在でもタレント、モデルとして活動しています。わずか15秒の映像で人生が変わった例です。

 

https://www.douyin.com/video/6595542992088468740?previous_page=app_code_link

成都甜甜が有名になるきっかけになった映像。ウェブメディアの街頭インタビューに答えたわずか15秒の映像が猛烈に拡散をした。

 

最近、抖音の中から彗星のように登場したスターが井川里予(ジンチュアン・リーユー)です。日本人風の名前で活動していますが、杭州市生まれの中国人で、現在、浙江経済職業技術学院に通う専門学校生です。まったくの無名状態から、たった2つのムービーにより、2週間足らずで1300万人のファンを獲得しました。

この2つのムービーには、ヒットする要素がいくつも重なっています。まずダンスがアイディアに溢れていることです。うまいかどうかはともかく、今までになかったフリを取り入れていて、しかもセクシー系と純情系がうまくミックスされています。

そのため、「純欲天花板」(純情セクシーの天井)と呼ばれるようになりました。また、ファッション、髪型もムービーごとに変える工夫もしています。高度なダンステクニックではない分、真似をしやすく、この「真似しやすい」というのが抖音で流行するひとつのポイントになっています。

さらに、使った音楽もヒットしました。原曲は、「出山」(花粥)で、この曲は中国の民間伝承などを元にした歌詞と中国風の伝統音楽の要素を取り入れ、現代風にアレンジした曲で、アート好きの都市生活者の間で聞かれる曲です。井川里予は、この曲をEDM風にアレンジした「出山DJ版」を使って、自分のダンスを披露しました。この曲の新鮮さも手伝って、井川里予の人気を高めました。

現在では、無数の人が「井川里予を踊ってみた」ムービーを投稿する状態になっています。

 

https://www.douyin.com/video/7008363777620053283?previous_page=app_code_link

▲井川里予の映像をまとめたムービー。ムービーごとに髪型やファッションを変える、真似しやすいダンス、新鮮な音楽など複数のヒット要素が込められている。この映像を発表する前、井川里予はアイドル活動をしていたが、大きな人気を得ることはできないでいた。

 

なぜ、抖音では、このような爆発的な拡散が起こるのでしょうか。それはリコメンドシステムの仕組みに理由があります。このAIを使ったリコメンドシステムは、マサチューセッツ工科大学(MIT)の雑誌「MITテクノロジーレビュー」が選ぶ2021年版の「世界を変える10大テクノロジー」(https://www.technologyreview.jp/s/239046/10-breakthrough-technologies-2021/)のひとつにも選ばれることになりました。

抖音には毎日数百万件のショートムービーが投稿されます。これをすべて配信していたら、つまらないムービーもたくさんあるわけですから、視聴者にとってはつまらないムービーが流れてくるだけのつまらないサービスになってしまいます。面白いムービーだけをリコメンドして、次から次へと面白いムービーばかり流れる状態をつくるにはどうしたらいいでしょうか。

今回は、抖音のリコメンドシステムについてご紹介します。

 

続きはメルマガでお読みいただけます。

毎週月曜日発行で、月額は税込み550円となりますが、最初の月は無料です。月の途中で購読登録をしても、その月のメルマガすべてが届きます。無料期間だけでもお試しください。

 

今月発行したのは、以下のメルマガです。

vol.092:「テンセントの壁」が崩れ、ネットのオープン化で何が変わる?異なる流量戦略を持っているWeChatとアリペイのミニプログラム

vol.093:機械学習によるリコメンドがトレンド。EC「京東」、音楽サービス、TikTokのリコメンドシステム(上)

 

登録はこちらから。

https://www.mag2.com/m/0001690218.html