jippiniusの自然科学研究

ジッピニウスの自然科学や技術関連についての備忘録です。

イタリアの死者数に対する理論曲線の検証(2): 2日目

感染流行期間を(1)初期(T-2s)、(2)中期(T-s), (3)ピーク期(T)に分けて分析する方法を編み出した。ただし、T、sはガウス分布の「平均値の時間(つまりピークの日)」と「分散値(つまり幅)」を表す。3つの期間に分けるので、「3期間外挿法」とでも呼ぶことにしよう(Three-stage extrapolation method; T-SEM)。

しかし、パラメータによって計算結果がずれる問題が解決できず、とりあえず決めた値が果たして実際のデータを再現できているか検証することになって2日目である。

初日(つまり昨日)はなんとか許容範囲にデータが乗ってきた。果たして2日目の本日はどうだろうか?

f:id:jippinius:20200331075227p:plain

T-SEMによる予想曲線(イタリアの死者/日)

最後の2つの丸い点が、理論曲線を作った後に発表されたデータである。緑色の「負の曲率」をもつ係数で作ったガウス分布に乗ってきている感じがある。今のところ、なかなか順調だ。

スペインとフランスの状況も見ておこう。この2国は従来の方法でなんとか再現できているので、引き続きそれで分析する。

f:id:jippinius:20200331080238p:plain

Number of deaths per day in Italy (Spain, France, and China): Mar 31, 2020

フランス(水色の四角)は数日前にピークを打ったように見えたのだが、今日跳ね上がった。やはりここ数日の振る舞いは予想通り「フェイント振動」だったようだ。再び増加傾向に転じた。

一方スペイン(黄色の四角)はピークを打っているように見える。激しく感染が蔓延した分、急速に終息に向かう可能性がある。

イタリアも念の為、古い方法で分析してみた。スペインと同じ傾向だが、もう少し緩やかに推移している。とはいえ、どちらの国もすでに医療崩壊している。とりわけ、蔓延の速度が早かったスペインは地獄絵をみているはずである(イタリアですでに地獄絵だったから、想像を絶する)。

日曜にしっかり休んだ御役人:東京都の感染者が13人となった理由

月曜日に東京都が発表した新たな感染者は13人と、ここ数日続いていた大量の感染者数に比べると大幅な減少となった。この数字だけをみてぬか喜びしてはならない。

以前、東京都のPCR検査数に不思議な周期性があるのに気づいたので分析をしてみると、その周期が7日であると知って愕然とした(というか笑った)ことがある。

jippinius.hatenablog.com

クラスター感染が頻発し、院内感染も深刻度を増し、感染爆発が目の前に迫っていると都知事が緊急会見するなど、これだけ緊急性の高い事態になったにも関わらず、東京都の保健所が(いつものように)日曜はしっかり休む方針を貫いたのは、ある意味見事だ。まさかとは思ったが、発表された数字から察するに、おそらく、この日曜日のPCR検査も0件のはずである。0件の検査から60件の陽性者を見つけるのは絶対に不可能である。

結局、今日判明した13人の陽性者というのは、必要に応じて土日も仕事をする「民間の検査会社」が行なったPCR検査で見つけた感染者だ。

台湾と日本の違い

台湾と日本の違いは明らかだし、周知の事実であるが、ここでもう一度確認しておきたい。それは、春節の時に中国からの観光客を受け入れたか、それとも締め出したか、の違いである。

もちろん、台湾も一定の割合で中国観光客を受け入れたが、PCR検査や検疫と隔離を徹底し、国内に新型コロナウイルス を入れないように水際で全力を尽くしたところが、日本政府のやり方とまったく違ったのだった。

日本政府は、「爆買い」とかなんとか言って、中国人が落としていく「端金」に執着したため、新型コロナウイルス に罹患した「無症状感染者」をガンガン受け入れたのである。自由に入国させ、自由に移動させ、自由に宿泊させ、自由に飲み食いさせたのである。一方の台湾政府は、検査を徹底的に行い、感染者は隔離して行動を徹底的に制限したのである。

その結果、現在のところ、台湾の感染者は298人(日本は1894人)、台湾の死者は3人(日本は59人)だ。日本の感染者は6倍多く、死者は20倍多い!

しかし、これはあくまで統計上の話であり、日本の場合にはしっかりPCR検査を行っていないので、本当の感染者の数はもっと多いはずである。本日の東京都の会見で、政府のクラスター対策を担う医者が認めたように、日本の統計が語るのはあくまで「氷山の一角」のみである。

台湾と日本の差は、これから開く一方であろう。かたや、科学的根拠に基づいて政策を策定した国家であり、かたや科学的根拠を無視し、経済的な都合に基づいて政策を決めた国家である。どちらが多くの国民の命と生活を守ったかは説明不要であろう。

ましてや、経済に関しても、「爆買い」に伴う端金と、感染蔓延を防止による経済効果とを比べれば、いったいどちらが「お得」だったかは明らかで、結局は、経済的な側面でも台湾に軍配があがるのである。科学は経済を守るし、経済は科学を支えるのである。どちらか一方がいびつに成長するのは不気味だし、長続きしない。

ここで疑問である。科学に基づかねば、悲惨な結果になることは、多くの日本人には自明の理であった。にもかかわらず、なぜ日本政府は愚挙に走ったのか?いくら端金が欲しいとしても、その先が想像できれば、台湾と同じ道を選ぶはずである。誰がどうやってこの愚挙のコースを決定したのか?それが疑問である。

ここから先は、自然科学ではない。が、隠された真実を解き明かすという意味では、自然科学に似ている。そういう意味では、探ってみる価値はあるのかもしれない。

最近、この疑問の答えに結びつくかもしれないと思われる、一つの報道があった。それは、新型コロナウイルス で毎日人が死んでいる状況で、とある政府の要人が、観光業の落ち込みに苦しむある地方に(視察という名目で)激励に向かったというのである。

コロナウイルス の撲滅にあまり興味を示さず、観光の打撃の方をむしろ心配する、というのは、「海外観光客が落とす端金のために新型ウイルスを日本国内に侵入させ、日本人を疲弊させた神経」と相通じるものがある。私は、この人物の研究をはじめてみることに決めた。

メルセデスベンツのF1チームとダイソンの心意気

メルセデスベンツのF1チームは、ここ数年ドライバーズチャンピオンのみならず、コンストラクターズチャンピオンの座も独占してきた。昨シーズンはホンダのマシン性能も上がり、ホンダもよい成績を納め始めてきたが、それでもフェラーリを抜くのに精一杯で、なかなかメルセデスの牙城を崩すところまでは到達していない。

メルセデスのエンジン、メカニックは圧倒的な性能と信頼性を誇り、そこにはドイツの科学/技術の魂を感じる(そもそも、世界最初のガソリンエンジンを開発したのはメルセデスベンツである。)。しかし、それでいて、ドイツ人自身はそれを鼻にかけることは一切しない。ナチスドイツの苦い思い出を心に刻んでいるからである。「愛国主義は独裁を許す」ということを、彼らはよく理解している。

f:id:jippinius:20200330225437p:plain

from wikipedia (public domain)

ダイソンは、英国の掃除機メーカーで、最初の製品が登場した時は「どうして掃除機なのか」とバカにしてしてまったのだが、コードを無くしたことは大きく評価した。とはいえ、同じタイプの掃除機はすでに日本のメーカーが随分前から「自動車のインテリア用」として販売していた。

ダイソンの着眼点が素晴らしかったのは、「どんな掃除場所でもコードは邪魔だ」という理念を最後まで追求した点だ。車だろうが、家の中だろうが、コードがないことはいいことなのだ。いまや掃除機でダイソンの右に出る者はいないし、羽根のない扇風機や、雑巾式ロボット掃除機など、面白い製品を次々に発表し、世界中から注目を浴びている。AIやWiFiを搭載したロボ型掃除機が登場した現在、掃除機は掃除機の型枠を飛び出した。「電気製品の覇者の候補」にソニーパナソニックも、もはや出てこない。それはダイソンかiRobotかといったところであろう。掃除機は革命の引き金となったのだ。

f:id:jippinius:20200330225654p:plain

from wikipedia (public domain)

メルセデスのF1チームと、ダイソンは、コロナウイルス の治療で最後の切り札とも呼べる「人工呼吸器」の開発に乗り出した、とCNNが報じているメルセデスは、既存のシステム(おそらくF1の吸排気系のメカ)を改良して、わずか100時間で新型の呼吸器の開発に成功し、ヨーロッパの医療現場に送り届けているという。F1が開催できない今、全力を尽くして、社会に貢献する姿には感動すら覚える。

edition.cnn.com

ダイソンも新型の人工呼吸器の開発に着手した。わずか10日でデザインを書き起こし、3月中旬に新製品"CoVent"を発表するところまでこぎつけた。今までの人工呼吸とはまったく異なるコンセプトでデザインされ、素早く大量に生産することが可能だという。ダイソンの創造性の高さは周知のとおりである。掃除機のシステムを改良し(たぶん掃除機とは逆回し)軽くて効率のよいシステムで、患者の気道へ空気を送る新しいシステムの開発に成功したのだろう。見事である!

edition.cnn.com

 

 日本にはテルモオムロンがあり、アメリカの外科医が発明した人口肺「エクモ」を製造することができる。しかし、その使い方は難しいようで、専門の医技官が必要だという。他人が大昔に発明した者を改良しながら作り続けるのは大切なことである。しかし、革命的なデザインを編み出し、ひとつ上のレベルを目指す心意気も大事だ。

日本にも多くの素晴らしい工業や職人が存在する。いまこそ、その知識と技能をコロナウイルス で苦しむ人々を助けることに注ぐべきではないだろうか?ちょっとした発想の転換をすれば、いつもの製品からエクモを超える素晴らしい医療機器が誕生するはずである!

感染初期における分析の精度

今日は、感染初期\(t=T-2s\)における分析をやってみようと思う。昨日は、感染中期\(t=T-s\)における分析を行った。今日のデータを見る限り、一定の成功を収めている感じである。

昨日の計算結果を用いると、\(T=45\leftrightarrow 43, s=15\leftrightarrow 13\)という結果である。したがって、感染初期は\(t=T-2s=15\leftrightarrow 17\)に相当することになる。この期間におけるテイラー展開

\begin{equation}g(t)\simeq A\text{e}^{-2}\left(1+\frac{2}{s}(t-T+2s)+\frac{3}{2s^2}(t-T+2s)^2\right)\end{equation}であるから、計算結果を代入すると

\begin{equation} g(t)\simeq A\text{e}^{-2}\left(1+\frac{2}{13}(t-17)+\frac{3}{338}(t-17)^2\right)\end{equation}あるいは

\begin{equation} g(t)\simeq A\text{e}^{-2}\left(1+\frac{2}{15}(t-15)+\frac{1}{150}(t-15)^2\right)\end{equation}となる。この結果をデータと比較してみよう。

f:id:jippinius:20200330170503p:plain

感染初期における近似

「まあまあ」である。 よくデータを再現しているのは\(t=T-2s\)より少し後の時間帯である。最小二乗法でフィットするなら、\(t=T-2s\rightarrow t=T-s\)の区間になるだろう。

では、昨日書いたコードを走らせて係数を求めてみよう。

フィットする区間の終端点を少しずつ動かしながら計算してみたが、t=30まで計算するとa0=430.1108193..., a1=-55.9585084..., a2=2.196953781....という結果となった。

感染中期の計算結果と、解析的な表式を組み合わせて作った上の近似式の係数を計算すると(上のグラフでg1(x)に相当するもの),\begin{equation} a_0\rightarrow 137.01, \quad a_1\rightarrow -21.34, \quad a_2\rightarrow 1.28\end{equation}となり、おおよそのオーダーや符号はあっているが、絶対値の合致性が悪い。

そこで、計算の終端点をt<30として計算した最小二乗法の結果のなかで、もっとも上の結果に近いものを探してみると、t=26までの計算を実行したとき、a0=90.0751748..., a1=-20.9043456...., a2=1.3194305...という結果が得られているものがあった。

これら2つの結果を重ねてプロットしてみたのが下の図である。

f:id:jippinius:20200330174140p:plain

感染初期における近似(解析的結果と数値的結果)

t=26までの最小二乗法で求めた結果(図中のf2(x)に対応)がデータと非常によい一致を見せているのがわかる。また、この数値結果は、先に解析的に求めたg1(x)ともよい一致を見せている。

つまり、最小二乗法は、データ点の総数を変えながら、もっともデータにフィットするものを選び出す必要があるということである。

さて、最もデータを再現できる数値結果から、ガウス分布のパラメータを導出してみよう。感染初期における近似式を整理すると\begin{equation} \frac{g(t)}{A\text{e}^{-2}}\simeq \frac{3}{2s^2}t^2+\frac{2}{s}\left(4-\frac{3T}{2s}\right)t+11-\frac{8T}{s}+\frac{3T^2}{2s^2}\end{equation}となる。したがって\begin{equation}\frac{a_1}{a_2}= \frac{4}{3}\left(4s-\frac{3T}{2}\right),\quad \frac{a_0}{a_2}=\frac{2s^2}{3}\left(11-\frac{8T}{s}+\frac{3T^2}{2s^2}\right)=\frac{2}{3}\left(11s^2-8Ts+\frac{3}{2}T^2\right)\end{equation}となる。最初の式をつかって、2つ目の式からsあるいはTを消去すれば、2次方程式が得られるので、それを解けば良い。

この連立方程式をsについて解くと、予想外に簡単な形となる。\begin{equation} s=\frac{3}{2a_2}\sqrt{2a_0a_2-\frac{a_1^2}{2}}\end{equation}

まずは、感染中期の結果を用いて解析的に求めた係数を使って、公式の正確性を確かめてみよう。\((s=13, T=43)\)の場合は\((a_0,a_1,a_2)=(137.01, -21.34,1.28\)であることを既に計算してあるので、これを上の公式に代入してみる。\begin{equation} s= \frac{1.5}{1.28}\sqrt{2\cdot 137.01\cdot 1.28-\frac{(-21.34)^2}{2}}=12.995 \sim 13\end{equation}となって辻褄が合う。この公式は正しいと思って良いだろう。

では、最小二乗法の結果を代入してみよう。上のグラフでf2(x)に対応する数値を代入してみよう。t=30までのデータを取り込んで得た数値を代入すると\(s=12.2934...\)となる。正解のおよそ95%の値であるから悪くない!つぎに、見た目には非常によくデータを再現したt=26までの結果を代入してみよう。驚いたことに\(s=4.98145...\)とずいぶん過小評価した値となる。「人間の目」ではなかなか正しい答えが出ない、という厳しい結果である。

連立方程式を完成させよう。平均値は\begin{equation}T=\frac{8}{3}s-\frac{a_1}{2a_2}=\frac{4}{a_2}\sqrt{\frac{4a_0a_2-a_1^2}{2}}-\frac{a_1}{2a_2}\end{equation}で与えられるので、t=30までのデータで求めた結果を代入すると\(T=45.51773\)となる。正解はT=43だから、こちらもまずまずの値である。

感染初期のデータから、それらしいガウス分布のパラメータを導出することは「可能である」ことがわかった。一方で、データの個数や、見た目の「一致具合」に騙されて、大きな誤差が生じる可能性があることもわかった。

この教訓を胸にして、いよいよ東京の分析に取り掛かってみよう。もちろん、東京は「感染初期」の段階にある。果たして、意味のある結果を導くことはできるだろうか?

 

志村けん氏の死去

志村けん氏が、昨晩遅くに死去したという報道がお昼前にあった。非常に残念だ。エクモを装着していたと聞いていたが、ダメだったようだ。エクモも全能ではないということを知ったのも衝撃である。

以前のブログ記事で、喫煙と新型コロナウイルス による死者との関係を考察したことがあったが、志村さんもかなりのヘビースモーカーだったと報道で言っていた。また、飲酒も相当していたようで、徹夜で飲み明かし、そのまま仕事に出て、また飲み屋に戻ってくる、というような生活もかつてやっていたようである。

志村さんの感染源は特定できないそうだが、おそらく飲食店で感染したと推測する人は多い。東京の夜間営業の飲食店での「隠れたクラスター」が指摘されているが、その最初の犠牲者だった可能性がある。

個人的には、日本テレビでのクラスター感染の一部ではないかと考えていたが、症状が発症した1週間前にテレビ朝日のドキュメンタリー(彼の生い立ちを辿る番組)の撮影をしていたという。日本テレビのレギュラー番組の収録はそのさらに5日ほど前だという。潜伏期間から少し外れているような感じがする。が、この情報だけでははっきりしたことは言えないだろう。

以前のブログ記事で、志村さんがPCR検査にたどり着くまでの時間が、一般人に比べてとても短いことを指摘したが、今日の報道によると、倦怠感を感じて自宅療養した翌日にはすでに意識混濁(意識不明?)の重篤な状態だったという。医者も今の状況ではさすがに「肺炎」とは判断せずに、COVID-19を疑ってPCR検査を実施したのかもしれない。

が、今まで一般人は、肺炎とか敗血症とか「誤診」され(意図的か意図的でないかはともかくとして)、PCR検査もせずに無視されてしまった人は多かったと推測する。阪神の野球選手やJリーグの会長のPCR検査も実に速やかに行われたようなので、やはり「特殊ルート」というのは存在するのではないか?

志村さんの場合、最初に入院した港区の病院にあった人工呼吸器では間に合わずに、エクモのある新宿の国立病院へ移送されたというが、はたして一般人の場合、このような厚遇はされるのであろうか?すこし気になるところではある。

いずれにせよ、国民的なコメディアンの死去により、コロナウイルス の怖さが日本人に広く行き渡るのは確実である。これを機に、「人の移動が一番の問題である」という認識に多くの人がたどり着けば幸いである。志村さんの死を無駄にすべきではない。

 

イタリアの最新の結果が出た:理論曲線は予言できているか?

イタリアの死者数が更新された。10,779人となり、1日あたりの死者数は756人であった。これは前日の887人/日、その前日の記録的な971人/日と比べると減少である。「フェイント振動」の可能性はあるが、果たして昨日計算した予測曲線に乗ってきているだろうか?さっそく確認してみよう。

f:id:jippinius:20200330130038p:plain

Number of deaths per day in Italy (with the prediction)

丸い点のうち、連結されていない点が最新データである。昨日作った予測曲線のうち、2次の係数が正のものになんとか乗ってきた感じである。まずは第一関門突破である。

ちなみに、今までの古い手法で計算した予測曲線はどんな感じになっているだろうか?フランスとスペインのデータも更新されたので、合わせてみてみよう。

f:id:jippinius:20200330130539p:plain

Number of deaths per day in Italy (Spain, France, and China): Mar 30, 2020

古い曲線の方も、本日のイタリアのデータに対しそれなりに健闘しているように見える。ただ、もし「フェイント振動」が明日か明後日に発生するならば、予想曲線の信頼度は下がってくる。

一方、スペインの1日の死者数は832人/日となり、イタリアよりも多い数字となった。スペインのデータは綺麗な系統性をここ1週間は示していて、古い手法でもデータと予想曲線が結構よく合致する。

フランスはどうだろうか?このところ、数字の伸びが落ち着いてきて、若干の「フェイント振動」らしきものがみえているが、こちらも今のところ、よく再現できている。

いずれの予言曲線も、ヨーロッパの山場は、あと1週間程度(7-10日の幅はあるが)だろう。1日の死者数は最大で1000人程度で、これを大きく超えることはもうないと予想する。いずれにしてもピークは近いという予想である。

収束までの予想は、あと30-45日というところである。つまり5月中ということになろう。

日本は2、3週間遅れて感染爆発が起きているので、6月までずれ込む可能性は大いにある。

いずれにせよ、まだ手持ちの予言曲線の信頼度は低い。明日以降のデータに着目していくことにしよう。