機械学習は「ポスレジのバカ」 AIで新型コロナ感染拡大を予測できるのか? 

2020年3月23日 16:52

印刷

 アメリカ疾病予防管理センター(CDC)が、『新型コロナウイルス感染症(COVID-19)』の感染拡大予測を行っているようだ。インフルエンザ感染拡大時の予測において、優秀な実績を残してきた有数の研究室にそれを要請している。また、CDCは毎年、「有数の研究室を集めたコンペ」としてインフルエンザ感染拡大の予測を行ってきていた。

【こちらも】【AIシミュレーション】新型コロナウイルス感染、45日間で最大25億人 死者5290万人

 アメリカ全体から優秀な研究チームを集め、それぞれ研究機関独自の方法で予測を競い合い、最優秀成績チームには研究資金を提供、その研究室はCDCに協力してフルエンザ・シーズンに備えていると言う。今年のインフルエンザの患者数は2600万人、死者1万4000人以上に達していると見られている。しかし実は、この中に新型コロナウイルスであった可能性のある人数が含まれていると見られ始めたのだ。

 一方、日本ではPCR検査の数が極端に絞られてきたため、新型コロナウイルス感染者の数が明確にならず、一般的な肺炎として処理されてきた中にも新型コロナウイルス感染者が含まれているとの見方も出ている。やはり、「重症者の治療のために入院ベッド数を確保する」動きとは別に、新型コロナウイルスによる感染者数を特定するための「検査を先行するべき」と見られる。

 このように、「過去のデータ」が正確であるとは限らない中で、AIによる感染予測は「困難」であるとするのが、最高レベルの研究機関による見解のようだ。

■機械学習は「ポスレジのバカ」
 「ポスレジのバカ」とはあまり喜ばしくない言葉であるが、『過去のデータで物事を見ると、潜在データが見えてこない』ことを示している。物流の店舗などで使われるポスレジのデータは、これまで店舗に訪れてくれた客数、購買客数などであり、「顕在化しているデータだけ」なのである。

 そのため「潜在している市場を捉えることが出来ない」のだが、今回の新型コロナウイルスによる感染拡大も、新型ゆえにその性質も良く判明しておらず、「予測が困難」であるはずなのだ。

 つまり、AIは「教師データ(過去のデータ)」で学習して、現実の動きを分類整理したり、関連性を重み付したりしていく。そのため、過去のデータにない特性は見抜けない可能性が高いのだ。「人間だって経験のない問題を解くのは難しい」ではないかとなる。

 今回は、過去の「急性呼吸器症候群(MERS、SARS)など」と「新型コロナウイルス」による症状とどこが違っているのか?などが明確にならない中で、AIで予測することは困難と言える。また、今回初期段階において、MERS、SARSの経験則を検証なしに適応させてきた間違いがあると言える。「相似形」を探す作業と言えるため、この分野では「人間の能力がかなり抜きんでている」と見るべきだろう。

 AIによる感染拡大予測は、まだ「確率が低い」ことを知らしめるべきだ。その上で、感染拡大を抑える手立ては、特効薬やワクチンがない段階では「隔離」しかないことを浸透させた上で、経済活動をどの様に回復させるのかの判断をすべきなのだ。

 そして「経済対策」の必要性は、その時点での情勢判断が重要であることを踏まえなければならない。つまり、検査を先行させ、データを集め、実態把握をしなければならないことは誰もが知っているはずだ。日本においては、それを「何らかの理由で・何らかの立場で」抑えているため、「政府の専門家委員会」の意見が定まらず説得力がないのだろう。(記事:kenzoogata・記事一覧を見る

関連キーワード

関連記事