中華IT最新事情

中国を中心にしたアジアのテック最新事情

すでにレッドーオーシャン化が始まっているAI訓練士。生き残る鍵は、標準化と専門化

地方都市にAI訓練センターが続々と生まれ、すでに過当競争が始まっている。北西部の小さな都市で800人規模のAI訓練センターを運営する揚科琪は、生き残る鍵は標準化と専門家だと語ったと新週刊が報じた。

 

地方都市に生まれているAI訓練センター

2017年、中国国務院は「新世代の人工知能発展計画」を公表し、AI産業を国家戦略産業として明確に位置付けをした。これにより、AIを開発する企業だけでなく、その周辺の産業も生まれるようになった。AIを訓練するAI訓練士もそのひとつで、2022年に国家職業分類目録に登録をされた。

揚科琪(ヤン・カーチー)と友人が、中国北西部の小さな町で、AI訓練業務のビジネスを始めたのもこの流れを受けてのものだ。AI訓練とは、例えば、自動運転であれば撮影された映像からどこまでが道路であるかを指定し、写っている対象物の中でAIがまだ理解できないものに対して、それが何であるかを教えてやる仕事だ。

揚科琪は新週刊の取材に応えた。「この仕事は、飲み込みの早い人であれば1週間ほどで業務がこなせるようになります。敷居は低い代わりに、やや退屈な仕事ですが、県級の町では給料さえよければ多くの人が働いてくれます」。

新週刊は揚科琪に現在の状況を聞いた。

▲揚科琪さんが運営するAI訓練センター。現在、800人が働いている。県級都市では、エアコンが効いていて座ってできる仕事は多くない。勤務時間も自由度が高く、途中で保育園や学校に子どもを迎えに行き、会社に連れてくることも可能。給与は相場並みだが、労働環境のよさで人気の仕事になっている。

 

AIに道路の幅を教える仕事

現在、1000人分のコンピューターが用意され、800人のAI訓練士がフルタイムで働いています。現在、私たちの仕事の多くは、無人運転のためのAI訓練で、無人運転車が撮影した実際の映像を拡大し、AIが設定した映っている車両の境界線をマウスで調整していきます。また、映像に写っている車両にはその属性も表示されていますが、それを確認し、間違っていた場合は修正を行います。また、道路の幅もAIはうまく認識できないことがあるため、道路の境界線をマウスで修正をし、AIに覚え込ませていきます。

今年2023年の3月、デロイト中国は「人工知能基礎データサービス白書」を公開しました。これによると、現在AI訓練の仕事の52%が自動運転のものになっています。自動運転は実用化を迎え、収集データが飛躍的に増加をしています。これにより、私たちの業界にも爆発的な需要が生まれました。他の分野のプロジェクトと比べ、自動運転は継続性があり、長期の仕事を確保することができます。

 

月収は約8万円

AI訓練士の報酬は、業務の難易度によって異なりますが、1本の境界線を調整することで0.3元から0.8元。1日8時間で2000本以上がこなせ、月収は3000元から4000元(約8万円)ほどになります。

私たちの会社では年の離職率は30%から40%の間です。私たちの仕事はデータクリーニングとデータラベリングです。ぼやけた画像、ノイズが多い音声データ、誤りが含まれているテキストをクリーニングしたのち、以来元の要望に応じてデータラベリングを行なっていきます。仕事は単純で、コンピューターの前で座ってできる仕事で快適ですが、退屈だと感じる人もいます。

 

クラウドソーシングでは品質が安定をしない

この業界は、クラウドソーシングから始まりました。データラベリングが必要になると、ネットで人材を募集して、専用のクラウド内で業務をしてもらうというものです。私たちも創業当時は、クラウドソーシングの手法で、より安価な人材を探して業務を行なっていました。

しかし、この業界が初期の混沌とした状況を抜け、標準化が進んでくると、作業量と品質が変動しやすいクラウドソーシングから、AI訓練士を雇用して業務委託を受ける企業が台頭してきました。私たちも、それで県級の町に訓練センターを設置したのです。現在、クラウドソーシングは減少をして、業務委託が急激に増えています。

▲業務ができるのであれば、障害があっても採用される。車椅子の人は椅子を使わないだけのことなのでまったく問題がない。地方都市にとっては、労働環境を改善するきっかけにもなっている。

 

すでにレッドオーシャン化が始まっているAI訓練士

私たちがこの業界に参入した2019年、データラベリングやAI訓練士という言葉すら知らない人が多く、この業界は参入するチャンスでした。しかし、現在は多くの企業が参入しています。

さらに、ビッグテックは独自に訓練センターを建設する方向に動いています。例えば、百度はすでに済南市、山西省臨汾、重慶市鳳凰四川省大州、甘粛省酒泉、江西省新宇など10ヶ所に独自のAI訓練センターを持っています。AIが進化をするとともに、データラベリング業務も高度化していることと、企業秘密の漏洩を考えるようになっているからです。

この業界は、すでにレッドオーシャン化が始まっています。単価は、2019年と比べて30%ほど下落しているように感じています。

 

生き残るのに必要なのは標準化と専門化

2022年11月にChatGPTが発表され、その後、中国のビッグテックも次々と対話型AIを発表し、世の中のAIへの関心がますます強まりました。これにより、AI訓練士の仕事はますます求められるようになっています。

AI開発の業務量の中で、データラベリングは全体の20%から30%を占め、しかも多くの人手を必要とする業務です。しかし、いずれ自動化が進み、さらにはAIがAIを訓練できるようになり、次第に必要なAI訓練士の人数は絞られていくことになります。

私たちにとって必要なのは、標準化と専門化です。標準化を進めることにより、幅広い企業の注文に応えることができるようになり、ラベリング品質をあげていくことができます。また、同時に専門化も要求されるようになります。例えば医療AIのラベリングをするには医学的な知識がなければ良質のラベリングはできません。財務AIであれば財務知識がなければ良質のラベリングはできません。そのような2つの軸の方向に同時に進むことができるかどうかが、私たちAI訓練士の業界で生き残る鍵になっていくと思います。