jippiniusの自然科学研究

ジッピニウスの自然科学や技術関連についての備忘録です。

不思議な東京都の統計データ

不思議な東京都の統計データ

東京都の陽性率は本日6.3%だと公表された。どう考えても計算があわない。例えば、本日の感染者は295人である。この数が3日前の検査数2745人から発生しているとするならば、その陽性率は295/2745 (x100) = 10.7%というとんでもない高い値になる。

いろいろ試してまたがどうにも説明がつかないので、もう一度統計データを見直してみることにした。すると、検査数には2種類存在することに気づいた。一つは、「検査実施件数」で、もう一つが「検査人数」である。

検査人数と検査件数の違い

英語で考えれば、前者がcasesで, 後者がsamplesのような気がしたので、いままでは前者を使って陽性率を計算してきた。ところが、どうやら東京都は逆の意味で使っているようなのである。つまり、同一人物でも陰性確認のために何度も検査する必要がある。陽性と出るたびに入院が長引くが、陰性が2度続くと退院できるというあのルールである。

数字の中身を吟味してみると、検査人数の方が、検査実施件数よりも少ない。つまり、繰り返しを省いているのは検査人数の方だったのだ。例えば、これまでに最高の検査件数だといって都知事が胸を張ったのが、7月20日の4993件だったわけだが、検査人数をみると3703件に過ぎないではないか!実は、新規感染疑いの人に対して最も検査を行ったのは、7月16日で4515件の検査が実施された。この日の検査数は4661件だとあるから、入院患者の検査はわずか146件に過ぎなかった。一方、これまでに「最高」だと言っていた7月20日は入院患者のための検査が1290件もある。つまり入院患者が増えてきたので、確認のための検査をやる回数が増えてしまったが故に、PCR検査を回しているだけであって、実際には新規の感染者疑いの人を見つけ出すための検査回数はそれほど増加していないのだ。

東京都の定義する「陽性率」を再現する

新規感染者向けに実施した検査回数が最高値を記録した7月16日は、それまでの3日間が100人台と異様に少なかった後にいきなり286人に跳ね上がった日である。この日の陽性率を計算してみると286/4515 (x100)=6.3%となる。なるほど、これが東京都のいう「陽性率」の意味か!と閃いてしまったというわけである。

加えて、東京都の陽性率の計算には、直近7日の移動平均が利用されている。

陽性率 = 陽性者の数 / 検査人数

で、右辺の「数」がすべて移動平均である。ただ、割り算しているので、別に過去7日の陽性者総数を検査人数の総数で割るだけでも同じ結果になる。

さて、では本日の陽性率6.3%がどのように計算されたのか検算してみよう。

まず、7/18から7/24までの検査陽性者と検査陰性者の合計をそれぞれ計算する。集計すると、各々967人と14482人となる。陽性率の公式に代入すると\begin{equation} R_{TPR}=\frac{967}{967+14482} = \frac{1}{1+\frac{14482}{967}} = \frac{1}{15.97621..}=0.06259....\end{equation}と計算される。つまり6.3%というわけだ!

これで陽性率の計算法がマスターできた。

新規感染者と陽性者の数に不一致がある!

「さあ、これでちゃんとした予測ができるようになった」と喜んでいたら、新たな謎が浮上し、再び暗礁に乗り上げてしまった...なんと、「新規感染者」と東京都が呼んでいる数字と、「陽性者」の数が一致しないのだ...たとえば、7月13日から19日までの陽性者の数と感染者の数を見てみよう。

「陽性者数」は167, 220, 287, 340, 278,192, 74と推移し、この1週間の合計は1558人となる。

一方の「新規感染者数」は293,286,165,143,119,290,188と推移しているので、1日ごとの比較をするとまったく一致しない。合計を見ても1484人と74人も少ない...もし新規感染者の集計が3日ほど遅れているというのなら、集計日がずれている可能性もある。3日だけずらしてみよう。143, 119,290,188,168,237,238と推移する。合計は1383人となり175人も少ない!(むしろ悪化である)。

これは大問題である!陽性率が算出されているデータと、「新規感染者」のデータの間で首尾一貫性がないからである。これではいくら計算しても合わないわけだ。

調べてみると、すでに東京新聞がこの問題に気づいていて、以前記事に取り上げていた。東京新聞が調べた時も、陽性者数>新規感染者数 という不等号が成り立ち、その差が160人程度であった。つまり、先週と似たような状況である。

 

www.tokyo-np.co.jp

東京新聞によると、 陽性者数は病院から都庁へ届く報告を集計して算出しているが、新規感染者は保健所からの報告を集計しているという。本来2つの数字は一致すべきだが、保健所の状態を考えると、「新規感染者数」の方が間違っているような気がする(あるいは処理が終わらず、保健所内にプールされている件が数多くありそうだ)。

いままで、東京都の発表よりも多めに予測して「失敗」してきたが、おそらく保健所中に処理できずに残ってしまったデータが50-100の単位で存在し、それが予想外に少なかったり、多かったりという「揺らぎ」の原因になっているような気がしてきた。

東京都の「新規感染者数」というデータは信頼度が非常に低いのではないかと思い始めている。そもそも陽性率と新規感染者数は相関がとれてないから、両者を同時に使ってはならない。陽性率が使えるのは陽性者数の方である。

f:id:jippinius:20200726021122p:plain

「陽性者数」と「新規感染者数」の不一致

陽性者数(新規感染者数)の1週間の総計を今週、先週、先々週、4週間前の順で集計してみた:739(1269); 1558(1484); 1208(1162); 578(540)

感染者が増加するにつれて、陽性者数と新規感染者数の差が開いてきているのがわかる。今週を除くと、病院から直接くる数字(陽性者数)の方が、保健所からくる数字(新規感染者数)よりも大きいことがわかる。今週だけは逆転しているが、これはおそらく、病院は連休中は「お休み」なのに対して、保健所は休日出勤して、これまでに積もりに積もったデータの処理に追われているからではないだろうか?

結論

東京都が発表する「新規感染者数」というデータには科学的な価値があまりないように思えてきた。もしあるとするならば、陽性者数であるが、そちらも病院の営業形態に大きく左右されてしまうので、1週間の平均、あるいは1週間の総計を使って議論すべきかもしれない。

陽性者数を使って、7日間の移動平均を計算してみると、確かに右肩上がりの傾向は見えるのだが、指数関数的な増加と比べるとかなり弱い増加なので、いままでの考察結果と異なる結果になってしまう。

一方で、連休のタイミングで陽性者(の平均)数が低下してきているのは理解できる。そうすると今度は、小池都知事が発表する「新規感染者」数がが(3日ほどのずれがあるにせよ)連休に入っても上がっているのは変な感じがする。

とにかく、東京都の出してくる統計データはどちらをとってもおかしいことだらけである。

証明はできないのだが、直感としては、感染者の指数関数的増加に対し、PCR検査の増加が不十分のため、検査数が頭打ちになってしまい正確な統計的傾向を掴めない状態になっているのではないだろうか?陽性率は一桁で一見まともな値に見えるのだが、感染率が異様に低い日本の状況を加味すると、実は「非常に高い値」と解釈すべきなのかもしれない。

無症状感染者を見逃している現在のやり方では、結局正しい状況を掴むのは無理なのかもしれない。この辺りが「ファクターX」だとすると、統計操作こそが「日本人のウイルスに対する強さ」の理由になりそうで、世界の笑い者になりそうな恐れがある。そうはならないことを祈る。

ただ、良いニュースとしては、いまだに日本の感染流行は欧米に比べれば非常に低調だということだ。やはりD614G突然変異型はまだ侵入していないのではないだろうか?

とにかく、毎日の「新規感染者数」の予想をするのは科学的に無駄であることがわかったので、我輩の中で完全に興味が薄れたのは確実である。