中華IT最新事情

中国を中心にしたアジアのテック最新事情

音楽ストリーミングサービスで焦点になる「AIリコメンド」。開発を始めるテンセントと網易

アリババの「蝦米音楽」などがサービスを停止したことで、中国の音楽ストリーミング市場はテンセントと網易の2社が競争をする状況になっている。そこで焦点になっているのがAIリコメンドだ。AIが次に曲を選ぶことで、快適さを提供する競争が始まっていると媒体が報じた。

 

中国の音楽ストリーミングはテンセントと網易が独占

中国の音楽ストリーミングサービスは、騰訊(タンシュン、テンセント)と網易(ワンイー、ネットイース)の2社が市場をリードしている。サービス別の2020年の月間アクティブユーザー数(MAU)では、「QQ音楽」「酷狗音楽」「網易雲音楽」「酷我音楽」の順となっているが、網易以外の3つのサービスは、騰訊音楽娯楽(テンセントミュージックエンターテイメント)傘下のサービスでありテンセント系だ。

この他、Apple Musicもサービスを提供しているが苦戦をしている。中国の音楽ストリーミングは月額課金が数百円の安さで、音楽ファイルをダウンロードし、他の再生アプリなどにも移すことができるようになっているからだ。GoogleYouTube Musicはサービスを提供していない。Spotifyはテンセントと提携することで、中国市場に参入している。

価格、自由度、国内曲の充実度の点で、海外系ストリーミングサービスは国内系に太刀打ちができていない。

f:id:tamakino:20211011113007p:plain

▲中国音楽ストリーミングサービスの2020年月間アクティブユーザー数のシェア。「QQ音楽」「酷狗音楽」「酷我音楽」の3つはいずれもテンセント系であるため、テンセントと網易の2社が音楽ストリーミング市場を独占している。「2020中国オンライン音楽業界報告」(Fastdata)より作成。

 

AIにより楽曲の類似度を判定するPlex

その中で、唯一、利用者数は多くないものの固定ファンがついているのがPlexだ。リコメンドアルゴリズムや音質にこだわったサービスで、コアな音楽ファンから支持をされている。

そのPlexが、新しいリコメンドシステムSuper Sonicを実装した。音楽のリコメンドシステムは、一般的には音楽にタグ付けをすることで行われる。音楽ジャンルやテンポ、言語、使用楽器などのタグをつけていき、それを元に類似度を計算し、リスナーが好む音楽と類似度が高い楽曲を推薦するという考え方だ。

しかし、Plexは、AIを活用して、自動で音響的なパラメーターを50種類以上抽出して、楽曲をN次元空間の中にマッピングをしていく。これにより、リスナーが好む楽曲と距離が近い、つまり音響的に近い曲を推薦していくというものだ。

計算量は膨大になるが、一度マッピングさえできてしまえば、次々とサウンド的に似ている曲がかかり続けることになる。

 

音楽のDNAを分析する手法がトレンド

音楽をアーティスト名やジャンルといった外形的なタグで分類するのではなく、サウンドや雰囲気、感情といった角度で分類し、リスナーの感覚に響くようなリコメンドをしようという試みは、Pandora Radioが先駆けて行っている。

Pandoraは2000年にMusic Genome Projectをスタートさせた。これは音楽の専門家が、1つの楽曲についてリズムやテンポ、雰囲気、コード進行、ギターエフェクトといったものを、450種類の観点から、0から5評価のタグづけしていくというものだ。1つの曲の分析をするのに15分から30分はかかるという。

つまり、楽曲のDNAを解析しようというもので、専門知識を持つ専門家を起用したが、Plexはほぼ同じことを人工知能にやらせようとしている。

いずれにせよ、ジャンル、歌手といった外形的なタグ分類だけでは、リスナーを満足させることができなくなっている。

 

遅れていた中国の音楽ストリーミングのリコメンドシステム

中国の音楽ストリーミングは、このような最先端のリコメンドシステムからは遅れをとっている。QQ音楽は、基本的にタグづけによる楽曲分類がベースになっている。ただし、中国特有の「国風」「都市フォーク」「大衆流行」などのタグを採用し、さらに楽曲だけでなく、PV(プロモーションビデオ)がある場合は、映像のタグづけも行う。

このようなタグから、楽曲をマッピングし、リスナーが好む曲から最も距離の近い楽曲をリコメンドするという考え方だ。

 

直近の履歴から「今の気分」を分析する

網易雲音楽は、サービス内に掲示板やSNSの機能があり、リスナー同士が楽曲を評価し、紹介し合えるようになっている。これがリコメンドシステムにとっては貴重な情報源となっている。SNS内での書き込みを自然言語解析し、一人のリスナーの好みを分析していく。

また、リスナーの今の気持ちに即しようという工夫もされている。過去に聞いた楽曲すべてから次の曲をリコメンドするのではなく、あえて一定時間以内に聞いた楽曲だけを元にリコメンドする機能がある。音楽は、時と場合によって、聞きたい音楽の方向性が大きく異なってくる。元気を出したい時はアップテンポの曲、静かに落ち着きたい時はスローな曲を聞きたい。そのため、最近聞いた曲だけを元にすることで、今の気持ちにぴったりの楽曲をリコメンドしようという考え方だ。

 

リコメンドの可解釈性が鍵に

最適なリコメンドシステムの構築は簡単ではない。Plexのような深い分析をしたからリスナーが満足するとは限らない。単純なタグづけだけだからリスナーが不満に感じるとも限らない。

清華大学のリコメンドシステムの研究では、可解釈性が注目された。ECサイトのおすすめ商品を表示するリコメンドシステムで、なぜその商品が推薦されたのかがユーザー自身にも理解できる場合、購入率があがったという。例えば、旅行パック商品を購入後に、スーツケースが推薦されれば、その理由がユーザーにもわかり、可解釈性が高い。一方、ユーザーにも推薦の理由がよくわからない可解釈性が低い推薦にはあまり反応しない。

このことを考えると、リコメンドシステムは深い分析、分類をすればいいというものではないことがわかる。「知らなかった意外な曲まで紹介してくれる」という評価は、「なんだかわけのわからない曲ばかり紹介してくる」という低評価と裏腹なのだ。

その点、音楽や映像コンテンツのリコメンドで、過去に聞いたり、観たりしたコンテンツの具体的な名前を挙げ、「Let it Beがお好きなあなたへ」「ビートルズがお好きなあなたへ」という紹介の仕方は、心理的な可解釈性を大きくあげ、リスナーの満足度をあげることができる簡単な方法だ。

音楽のリコメンドシステムは、もはや20年の歴史を持っている。ユーザー分析、コンテンツ分析が中心に複雑化、高度化をしてきたが、リスナーの満足度に着目したリコメンドシステムが必要になってきている。テンセント、網易ともに、AIを活用したリコメンドシステムの開発を始めている。