SNSなどにアップロードされる画像、動画、音声には、暴力表現、ポルノ表現が含まれていることが想定される。これをチェックする作業は従来、人間が行っていた。しかし、現在では多くのSNSがテンセントの人工知能鑑定士を利用している。この人工知能は1日に1億件から10億件のポルノコンテンツを弾いていると文森特之剣が報じた。
アップロード画像のチェックも人から人工知能に
中国のネットで見られるムービーや写真、音声に、いわゆるポルノコンテンツはまず存在しない。アップロードされるすべてのコンテンツは、鑑黄師と呼ばれる人たちが事前にチェックをして、問題のあるコンテンツは削除されるからだ。1人が、1日に1万枚の画像をチェックしているという。
しかし、その労力は過大で、人件費もかかることから、多くのECサイト、SNS、動画共有サービスなどが、テンセントの人工知能鑑定士を利用している。この人工知能は、1日に1億件から10億件のポルノコンテンツを弾いているという。
▲従来は、アップロードされる画像、動画は鑑黄師と呼ばれる人が判定をしていた。ストレスのかかる作業だった。
人工知能が確率算出、人が最終チェック
このテンセントの人工知能鑑定士は、テキスト、写真、動画を機械学習により、「正常」「セクシー」「ポルノ」の3種類に分類し、その確率を算出する。サービスの運用ポリシーにもよるが、一定確率以上の「セクシー」に関しては年齢制限を、「ポルノ」に関しては拒絶をし、一定確率以下のものだけを人間の鑑黄師が判別すればよくなる。
▲男女の抱擁も、肌の露出度が高い場合は「セクシー」と判定される。
デモは以下のURLから試すことができる。
https://ai.qq.com/product/yellow.shtml
▲下着姿の女性は「セクシー」と判定される。
画像の「文脈」も理解して判定
この人工知能の学習はかなり進み、単なる肌の露出の多いものをポルノと判定するわけではない。例えば、ビキニの水着をきた女性は「セクシー」と判定されるが、ジムでトレーニングする女性は「正常」と判定される。肌の露出の多さだけではなく、着ているものの種類、周辺の状況なども学習をしている。
また、特定の要素に注目をするようにもプログラムされており、例えば女性の胸の谷間などに注目をして、それが正常(ナイトドレスなど)なのか、セクシーなのかポルノなのかを判定する。
▲左の水着の女性は「セクシー」、右のトレーニングする女性は「正常」と判定された。肌の露出度だけでなく、写真の文脈で判断をしている。
判定が難しい感情に訴える表現
さらに、学習が難しかったのは、人の感情表現だったという。例えば、服は着ていても、思わせぶりなポーズをとり、誘惑をしているという状況を学習をするのには試行錯誤が必要で、時間がかかったという。
また、動画に関しては音声トラックに着目することで大きな効果を上げている。これは人間の鑑黄師が、動画そのものよりも音声トラックの「あえぎ声」に注目して判定をするテクニックから、人工知能にも音声に注目して学習をさせた。しかし、人工知能は「あえぎ声」と苦痛による「うめき声」を判別できるようになるまでには、やはり試行錯誤が必要だったという。
結局、テンセントの開発チームは、ポルノ音声コンテンツを1000時間分集めて、学習させる必要があった。
誰でもデモを試すことができる
この人工知能のデモは、ウェブで誰でも試すことができるようになっている。用意されている画像を判定させることも、自分の写真を判定させることもできる。
実際に試してみると、この人工知能の優れた点と課題が見えてくる。
素晴らしいのは、男女がキスをしている写真は「セクシー」と判定されるが、親子がキスをしている写真は「正常」と判定されることだ。同じキスであっても、文脈で違いがあることを理解している。
また、裸の彫刻作品なども「正常」と判定される。
▲男女のキスシーンは「セクシー」と判定されるが、親子のキスシーンは「正常」と判定される。
▲裸体であっても、彫刻の場合は「正常」と判定される。
人間が錯覚する写真は、人工知能も錯覚する
一方で、課題もある。ポルノではないが、一瞬ポルノに見えてしまう錯覚写真がネットには流通している。1枚はありふれた男女の写真だが、女性の手袋が、色や飾りの関係で一瞬男性器に見えてしまう写真がある。人工知能はこれは正常と判定した。
また、同様の錯覚写真で、女性の胸が露出しているかのように見えてしまう写真がある。実は胸ではなく、ひざだが、これは「セクシー」と判定された。
▲手袋とその飾りが男性器に見え、一瞬びっくりしてしまう錯覚写真。人工知能は「正常」と判定した。
▲女性の膝が露出した乳房に一瞬見えてしまう錯覚写真。人工知能は「セクシー」と判定した。
芸術がポルノと判定されてしまう課題
さらに、裸体を描いた芸術作品も「セクシー」と判断された。彫刻の場合、「正常」と判断されたのは、色などから彫刻作品と判断されたのだろう。しかし、絵画の場合は「セクシー」になった。芸術作品だからポルノ表現は許されるのか否か。ただのポルノ作品を芸術と言い張れば流通させていいのか。人間が悩んでいる問題を、人工知能も同じように悩んでいるようだ。
また、大相撲の写真も「セクシー」と判定されてしまった。「裸の人間が2人いる」ということに問題があるのだろう。
このような課題はあるものの、多くのサイトがテンセントの人工知能鑑黄師を利用し、ポルノコンテンツを弾いている。
▲裸婦の名画は「セクシー」と判定されてしまった。
▲日本の大相撲も「セクシー」と判定された。