中華IT最新事情

中国を中心にしたアジアのテック最新事情

クラスター発生リスクの高い地域を予測する機械学習モデルを百度が開発

クラスター発生リスクの高い地域を予測する機械学習モデルを百度バイドゥ)が開発した。病院などの生活関連施設が遠い地区は、移動距離が長くなるので感染リスクが高くなるという考え方に基づいている。この論文は、アメリ人工知能学会に採択されたと夕小瑶が報じた。

 

クラスター発生リスクの高い場所を予測する学習モデル

この学習モデルはC-Watcherと名付けられ、論文は「C-Watcher: A Framework for Early Detection of High-Risk Neighborhoods Ahead of COVID-19 Outbreak」(https://arxiv.org/abs/2012.12169)としてすでに公開され、AAAI 2021に採用された。

C-Watcherは、住宅地のどの場所からクラスターが発生するリスクが高いかを事前に予測するものだ。

従来、このようなデータは、疫学調査から得られる。しかし、疫学調査は事後であり、事前に予測をすることは難しく、また粒度も粗いため、対応策の取りようがなかった。

しかし、事前に小区(町内会規模)単位で、クラスター発生リスクが予測ができれば、都市全体を移動制限するのではなく、その小区だけを移動制限することで、効果的に都市全体の感染リスクを下げることができる。小さな小区に限定したロックダウンであれば、生活物資や生活サービスの支援も容易で、最小限の犠牲で、最大限の感染予防効果を得ることができる。

f:id:tamakino:20210316103516p:plain

▲エピセンターとなった都市で地域の特性を学習し、対象都市から感染リスクの高い地区を浮かび上がらせる。

 

住民の移動距離が長い地区は、感染リスクが高くなる

C-Watcherの学習データは、百度地図から得られるさまざまなデータだ。考え方はシンプルで、対象の小区の周辺にどのような施設が、どの程度の距離であるかをデータ化したもの。例えば、病院、バス停、学校、飲食店などだ。

このような生活に必要な施設までが遠い小区は、住民が長距離を移動することになるので、感染リスクが高まるという考え方が基本になっている。逆に、半径1km以内に病院や学校、飲食店が完備している小区では、住民の移動距離が短くなるので、感染リスクが低いと考えられる。

このような考え方を基本とし、実際の移動手段、移動量などを学習させていく。

f:id:tamakino:20210316103504j:plain

▲C-Watcherの基本的な考え方は、病院、飲食店、バス停、学校など生活関連施設までの距離が遠い地区は、移動距離が長くなるので、感染リスクが高くなるというものだ。

 

クラスター多発都市を学習し、参照都市でテストをする

C-Watcherの学習とテストには2つの都市データが必要となる。まず、エピセンターとなったクラスターが多発をした都市のデータを使って学習を進める。次に、対象の都市と地理的環境が似ていて、エピセンター都市ほどクラスターが発生していない参照都市のデータを使い、テストを行い学習モデルの調整をしていく。

その結果を、まだクラスターがほとんど発生していない都市に適用すると、事前に感染リスクの高い小区が予測できる。

実際には、武漢を含む16のエピセンター都市で学習を進め、5つの参照都市でテストを行い、10の対象都市について高リスクの小区を予測した。

現在、その結果はわかっているので、このC-Watcherの性能が評価できる。すると、他の機械学習モデルに比べて高い性能を示すことがわかった。

f:id:tamakino:20210316103520p:plain

クラスターが多発したエピセンター都市のデータを学習し、対象都市と地理的条件が似ている都市を参照都市として使い、学習モデルの精度を高めていった。

 

f:id:tamakino:20210316103513p:plain

▲さまざまな機械学習モデルとC-Watcherの精度を比較したもの。多くの都市で、他の学習モデルよりも高い精度を示した。

 

感染症に強い町づくりにも貢献できる

すでに新型コロナが終息をしている中国で、このC-Watcherが直接役に立つことは少ないが、今後、同様のアウトブレイクが発生した場合は、事前に高リスク地区を予測し、効果の高い予防対策を実施することが可能になる。

また、小区と生活施設の関係で感染リスクが決まるという知見から、感染症に強い都市計画を立てることも可能になる。

AAAI2021は、リモートで開催され、9034の論文が提出され、7911の論文が審査をされ、最終的に1692の論文が採用された。採用率は21%になる。その中で、百度は24の論文が採用され、人工知能の学会での存在感を増している。

f:id:tamakino:20210316103508p:plain

▲C-Watcherの論文に掲載されている学習モデルの構造。