jippiniusの自然科学研究

ジッピニウスの自然科学や技術関連についての備忘録です。

イタリアにおける新型コロナウイルス による死者数:ついに中国を抜く...

武漢を中心とする新型コロナウイルス の感染流行によって出た犠牲者はおよそ3200人余りだ。ピーク時の1日の死者数はガウス分布で計算した平均で120人、統計上の最高値は2月13日に記録した255人/日だった。この数字を見たときに恐怖を感じたのを覚えている。

昨日(3月19日)、イタリアの1日の死者数は475人だった。恐怖を感じる前に卒倒してしまいそうである。これがピークかと聞かれれば「まだである」と答える人は多いと思う。武漢が恐怖なら、イタリアは絶望である。

www.bbc.com

中国のときと同じ分析手法で、ここしばらく、イタリアの統計をもとに分析を行ってきた。その結果を最後に公表したのは一週間前である。データの揺らぎが大きく、計算予測は過大評価であるのは明らかだった。統計が溜まるにつれ、次第に現実的な値になってきてはいたが、依然として揺らぎは大きく、連日計算するたびに、最終的な死者数の予測は5000人から数万人の間を行きつ戻りつという状態であった。

しかし、この数日で統計データは系統性を示し始めるようになってきた。とはいえ、その数字の大きさにまだ「一時的なゆらぎじゃないか?」という疑念を心の片隅にまだ持ち続けているのは確かである。信じられない、信じたくない。科学者が持ってはならない「先入観」との葛藤である。しかし「この数字は認めざるを得ない」という気持ちがだんだんと優ってくるようになった。昨日の475人の死者は「記録的」であり、今日300人台に戻ってきたならば、「ゆらぎ」説が復活したかもしれないが、本日427人の死者が出たという報道をみて、これはもう計算しても信頼できるな、と納得したのである。そして、この427人の死者が追加されたことで、ついにイタリアの全死者数は中国のそれを抜いたのである。今朝の世界中の新聞のトップ記事はこれである。

www.theguardian.com

1日の死者数はガウス分布に従うというのは、中国の分析で確認できた。それを利用して最小二乗法でガウス分布のパラメータを最適化し、データと比較したのが次のグラフである。中国、フランス、スペインの統計データに対する分析結果も同時にプロットしてみた。

f:id:jippinius:20200320093033p:plain

Number of deaths per day in Italy by COVID-19: Mar 20, 2020

紫の四角がイタリアの統計データで、緑の曲線がそのデータについて計算した理論曲線である。ゆらぎはまだ見えているが、系統性は見えてきていると思う。この予測によれば、来週の今日(3月27日)ごろに、1日の死者は500人を超え、そこでピークを打つであろう。

赤い四角と黒い曲線が、中国に対する統計データと理論曲線である。あれほど恐怖を感じた大きなガウス分布の山が、イタリアに比すると、小さくなだらかに見えるのは驚異的である。

統計データの揺らぎが多きく、計算にまだ不確定要素が多分に残っていると思われるのが、スペインとフランスである。この両国はこの数日というもの、新しいデータが出るたびに予測が大きく変動していて、その予測信頼度はまだ低い。特にスペインは3桁と2桁のデータが交差するように出てきていて非常に計算結果が不安定であった(黄色の四角がスペインの統計データ)。しかし、この2、3日はなんとなく傾向が見えてきた感じである。今日のところ、計算結果(水色の曲線)は中国の2倍ほどのスピードと強度で死者が増えてくることを示している。とはいえ、この結果はまだ流動的だ。

フランスは今、感染流行が激甚期へと移行している感じである。ここ数日のデータ数の跳ね方がすごい。計算結果もそれに引きずられて過大評価気味の結果を示している。イタリアの分析経験に基づけば、このフランスの結果はおそらく、明日、明後日のデータで修正されてくると思われる。グラフから飛び出す勢い...これがいわゆるオーバーシュートである(が、そうなるかどうかは現在は疑わしい)。

死者総数の見込みを見てみよう。スペインとフランスについては、まだ計算が不安定なので公表はしないことにする。まずは中国から。

f:id:jippinius:20200320094339p:plain

Number of deaths by COVID-19 in China, Mar. 20, 2020

Covid-19のoutbreakから数えて30日分のデータを利用して計算した理論曲線を使い続けているが、その後のデータは理論曲線によく乗っているのがわかる。最近、若干多めに推移しているが、総死者数は予想通り3100-3200人程度となりそうだ。

 

次はイタリアのケースを見てみよう。最初の死者が報告された日をoutbreak初日とすると、今日で27日目である。中国のデータ分析に利用した30日に近づきつつあるので、この結果はこれ以上は変わって来ないはずだ。

f:id:jippinius:20200320094945p:plain

Number of deaths in Italy by COVID-19: Mar20,2020

感染のピークが来週になることがわかる。発生からピークまでが約1ヶ月、収束までに2ヶ月かかるという予想になっているが、これは中国とほぼ同じ感じである。ただ、死者数の桁が大違いである。イタリアの死者数は5月には1万人をうかがうような水準となる可能性をこの計算結果を示唆している。

湖北省の全人口に対する致命率は0.005%だったが、この計算ではイタリアの致命率は0.0167%となって3倍も大きい。武漢の病院や街で見たあの凄惨な光景以上の光景が今イタリアで発生しているのである...

これだけ激しい速さで感染が流行してくると、中国のデータが活かせるので予測しやすいと言える。違いは、おそらく、中国は強権を発動して感染を押さえ込んだが、イタリアはそれができないという点だ。おそらく収束間際のモードが中国と違って、粘り出す可能性もあるから予断できない。

さて、日本はどうかというと、データは信頼性がないし、統計が信用できないので劇的な感染流行が起きているかどうかすらはっきりしない。本当にゆっくり進んでいるのか、それとも水面下で爆発しているのか?これがはっきりしないと、中国、イタリアの分析結果を日本に応用することはまだまだ難しい。