中華IT最新事情

中国を中心にしたアジアのテック最新事情

人工知能の学習には膨大な人手が必要。農村に続々生まれる人工知能訓練村

人工知能に学習させるには膨大なデータが必要になる。しかし、世の中のデータの80%以上は、非構造データであり、人工知能が直接学習することができない。これを整形し、人工知能に教える仕事が人工知能訓練士だ。膨大な人手が必要になり、農村地区に続々と人工知能訓練村が誕生していると第一財経が報じた。

 

新しい職業「人工知能訓練士」

郭梅さんは、山西省の炭鉱で働いていた。景色のすべてが山と石炭であるような職場で、郭梅の仕事は、コンピューターの前に座り、表示される炭鉱内のガス濃度を監視することだった。システムが表示する数値を見続けて、異常値が表示された場合には上司に報告をする。

2年前、子どもが山西省太原市の学校に通うことになり、郭梅さん一家は太原市内に引っ越した。郭梅さんは、太原市で新しい仕事を見つけなければならない。そこで選んだのが「人工知能訓練士」という仕事だった。内容はよくわからないが、コンピューターの前に座ってする仕事だというので、以前の仕事と似ており、自分にもできるだろうと考えたのだ。

仕事は、画像、テキスト、音声などに、一定のルールに従ってタグをつけていくという単純作業だ。始めたばかりの頃は、1日に200から300枚の画像しか処理ができなかったが、現在では1日に1300枚が処理できるようになった。報酬は歩合給であるため、郭梅さんの収入は、太原市の平均収入を超えた。

f:id:tamakino:20201210103214j:plain

▲ウェブを使っているとreCaptchaが表示される。これは機械には判別できない問題を出して、アクセスしているのがほんとうに人間であるかどうかを判断して、スパムを防止する仕組みだ。人工知能訓練士の仕事は、このreCaptchaの操作によく似ている。

 

国の職業分類にも登録された人工知能訓練士

人工知能は、なんでも学習でき、どれだけ学習しても疲れることを知らない学習モンスターだ。しかし、開発されたばかりの人工知能は赤子と同じで、何も学習していない。このような人工知能を教育していくのが人工知能訓練士で、2020年2月に、国の職業分類カタログに新しい職業として登録された。

自動運転の人工知能を訓練している李宇龍さんが、第一財経の取材に応えた。「赤いリンゴを人工知能に覚えさせたとします。しかし、それだけでは緑のリンゴはリンゴだと認識できないのです。そのため、さまざまな色のリンゴ、さまざまな大きさのリンゴ、場合によっては一口かじったりんごを見せて、ようやく人工知能はリンゴを認識できるようになるのです」。

まだ20歳をすぎたばかりの李宇龍さんは、いまだ自動運転車に乗ったことはなく、走っているところを見たことすらない。それでも、自動運転の人工知能を訓練する仕事をしている。

と言っても作業は単純だ。自動運転車が公道走行試験を始めるようになると、走行と同時に風景の撮影も行う。その中から、人工知能が車線を識別できない画像が自動で抽出される。李宇龍さんは、その画像に車線の位置をコンピューター上で指定をする。人工知能は、李宇龍さんの指定した車線に従って走行をするようになる。

李宇龍さんの報酬も歩合給で、現在は1日300元程度であるという。しかし、2019年の太原市の平均年収は3万6362元(約57.9万円)なので、李宇龍さんが年に200日働いたとすると年収は6万元となり、平均収入を大きく上回ることになる。

f:id:tamakino:20201210103228j:plain

人工知能訓練士の仕事風景。処理したデータ量で報酬が決まるため、勤務時間や年齢制限は緩やか。農村では町で働くより高い給料がもらえるとあって、多くの人が人工知能訓練士の仕事をしている。

 

マスク顔認証の背後にも人工知能訓練士

人工知能訓練士は、データに対して、一定の規則で指定をしていく仕事であり、特別なスキルを必要としない。報酬は処理したデータ量で決められる歩合給であるため、勤務時間や年齢制限も緩やかだ。

しかし、人工知能訓練士は社会に大きく貢献している。新型コロナの感染拡大が始まる前、中国では顔認証が大きく拡大をしている時期だった。オフィスは顔認証で出退勤管理をするようになり、スマホ決済のアリペイは大々的に顔認証決済レジを飲食店家コンビニに展開をしていた。

ところが、コロナ禍により、マスクをつけるのが常識となり、顔認証は一気に使い道のないものになってしまった。

しかし、現在はマスクをしたまま顔認証ができるシステムが普及をし始め、非接触ということからも拡大をしようとしている。このマスクをしたまま顔認証ができるようになったのも、人工知能訓練士の努力の成果だ。

企業などから社員の顔画像を受け取り、それを人工知能訓練士が眉毛、眼鏡、頬骨などの特徴点を打っていく。これにより、マスク以外の露出している部分だけで顔認証ができるようになった。

f:id:tamakino:20201210103236j:plain

人工知能訓練士の仕事はスキルや知識もほとんどいらない。マスク顔認証の人工知能を訓練するために、眉毛や目、眼鏡などの特徴点を打っていく。

 

農村地区に続々と生まれる人工知能訓練村

調査会社IDCによると、全世界で生産されるデータ量は2016年の16.1ZB(ゼタバイト=ギガ×ギガ×10)から2025年には163ZBに急増すると予測されている。しかし、その80%から90%は非構造データであり、そのままでは活用しようがないものだ。データを構造化したり、クレンジングをして整理をする必要がある。人工知能訓練士は、このようなデータクレンジングも行い、人工知能が利用可能なデータに変換をしている。

このような人工知能訓練士センターは、人件費の安い農村地区での設立が続いている。河南省、河北省、貴州省では、積極的に誘致を行い「人工知能訓練村」に転換する農村も現れている。

f:id:tamakino:20201210103218j:plain

山西省百度人工知能基礎データ産業基地。2000人が勤務し、5万人のクラウドソーシングを行なっている。中国で最大の人工知能訓練施設。最終的には従業員5万人、クラウドソーシング2000万人が必要になるという。

 

中国最大の人工知能訓練センター「百度基地」

百度山西省に設立した人工知能基礎データ産業基地は、現在、中国最大の人工知能訓練センターで、訓練士が2000人働き、35社が業務を依頼し、年の売上は1億元を突破した。基地は拡大を続け、今後5年で、5万人の人工知能訓練士が勤務するようになるという。

百度人工知能基礎データ産業基地の責任者、尉赤は第一財経の取材に応えた。「すでに、この基地の人工知能訓練士だけでなく、ネット経由のクラウドソーシングで5万人の訓練士を確保しています。しかし、人工知能の普及の速度を考えると、5万人ではまったくじゅうぶんではなく、最終的には2000万人のクラウドソーシングが必要になると考えています」。

人工知能を社会で活用していくには、その背後に膨大な人手が必要になる。将来はこのような業務も人工知能が代替するようになるのかもしれないが、人工知能の精度にも直結する業務であり、人工知能が代替できるようになるまでには時間がかかる。人工知能訓練士センターは「人工知能の幼稚園」とも「人工知能のフォクスコン」とも呼ばれるようになっている。農村を中心に、中国で存在感を示す産業のひとつになろうとしている。

人工知能学習の「学習データ不足問題」を中国は膨大な人手を投入することで解決しようとしている。