jippiniusの自然科学研究

ジッピニウスの自然科学や技術関連についての備忘録です。

K値とはなにか?(なんだったのか?)

 

最近話題から消えつつある「K値」という指標

大阪大学核物理センターのセンター長である中野貴志教授らが編み出した、感染ステージを推測するための指標だということである。これまでに様々な予想をしてきたが、ことごとく外した経歴をもつ「評判の悪い」指数である。

txbiz.tv-tokyo.co.jp

それにもかかわらず、なぜ政治家や経済学者、それにジャーナリストなどに支持されたのか?答えは、感染の広がりを過小評価することが可能であり、それが政権をはじめとする経済活動を優先する人々に好まれたからである。都庁などが公表する累積感染者数を使ってK値の関数系をフィットすると、あっというまに感染が収束するという結論がもたらされるのだ。その結果をみて「大した病気じゃない(風邪?)」と誤解する政経関係者が、「じゃあ旅行に行こう」とか「宴会をバンバンやろう」とか都合よく解釈したのである。

しかし、まともな科学者たちはK値を「役立たず」と切り捨てている。特に、神戸大学牧野淳一郎教授は「周転円と同じ」と断じている(銀河多体問題で有名な彼に周転円と呼ばれたら立つ瀬があるまい)。実際、K値の予言を都合よく解釈して、様々な経済活動を再開した結果が惨憺たるものであったことは周知のとおりである。

その正当性はともかくとして、K値自体を中野教授のようなグラフの形で再現してみたい、という科学者としての欲求がある。再現できないものは科学ではない。どれだけダメな指標でも、言われたとおりの手順で結果が再現できれば、それなりの意味はあるはずである。

総感染者数の時間変化

時間\(t\)における総感染者数を\(N(t)\)とする。回復しようとしまいとおかまいなしの数字である。感染したことがある人と現在感染している人を足し合わせた総数を意味するものとする。報道などでは「累積感染者数」と表現することもある。

指数関数的増加というのは、\(N(t)\)が次のような関数系で時間変化することをいう。

\begin{equation}N(t)=N_0\exp\left(\frac{t}{T_0}\right)\end{equation}

\(\exp(x)\)という関数はネイピア数\(e=2.7182818...\)に対する冪を意味し、\begin{equation}\exp(x)=(2.7182818...)^x=e^x\end{equation}を表す。定数\(T_0\)の意味は、時間が\(T_0\)経過するごとに\(N(t)\)が\(2.7182818...=e\)倍、つまり2倍から3倍に増加することを意味する。\begin{equation}N(t+T_0)=N_0\exp(\frac{t+T_0}{T_0})=N_0\cdot e \cdot \exp(\frac{t}{T_0}) = e\cdot N(t)\end{equation}

このような増加を見せる量は次の微分方程式を満たす。\begin{equation}\frac{dN(t)}{dt}=\frac{1}{T_0}N(t)\end{equation} これを伝染病の感染者について適用して解釈すると、新規感染者の数と、総感染者の数が比例することを意味していて、その比例定数が\(1/T_0\)である。つまり、感染者の合計が指数関数的増加を示すならば、新規の感染者も指数関数的な増加を示すのである。この点は意外に重要である。

ネイピア数無理数なので、増加の割合について直感的なイメージをもつことが難しい。そこで指数の底をネイピア数から2へ変更すると「倍増」、あるいは鼠算のイメージを持ち込むことができる。\begin{equation}e^x=2^{x/\log 2}\end{equation}であるので、\begin{equation}N(t) =N_0 2^{\frac{x}{\log 2 \cdot T_0}}\end{equation}となる。ここで\begin{equation}T_2 \equiv \log 2 \cdot T_0\end{equation}を「倍加時間」という。\(N(t)\)が倍増するまでの時間である。\begin{equation}N(t+T_2)=2N(t)\end{equation}

K値の定義

K値は次のように定義されている。\begin{equation}K(t)=1-\frac{N(t-7)}{N(t)}\end{equation} ただし、時間\(t\)は「日」の単位で測る。日本の検査体制は週末になると検査数が減少するので、その人工的な変化に惑わされないように1週間(つまり7日)の増加平均のようなものを考えたいちうわけである。しかし、よくみると、この定義はいわゆる「増加率」とはひっくり返しになっている。

1週間あたりの増加率をあえて「Z値」と呼ぶことにしよう。その定義は\begin{equation}Z(t)=\frac{N(t)}{N(t-7)}-1\end{equation}である。K値とZ値の値は\begin{equation}Z=\frac{K}{1-K}\end{equation}の関係がある。増加率は小学校でも習う概念だと思うが、どうしてわざわざK値という概念を持ち出したのか、我輩には分かりかねる。結局両者は同じものであることが上の関係式からわかるにも関わらずだ。

Z値の拡張

Z値は1週間の増加率平均であるから、容易に微分の形へと拡張することができる。

\begin{equation}Z(t) = \frac{N(t)-N(t-7)}{N(t-7)} = \frac{N(t)-N(t-7)}{7}\frac{7}{N(t-7)}\rightarrow \frac{N(t+\Delta t)-N(t)}{\Delta t}\frac{\Delta t}{N(t)}\end{equation}最後の表式のところで微分操作を導入すると\begin{equation}Z(t)\rightarrow \frac{d}{dt}\log N(t) dt = d(\log N(t))\end{equation}となる。予想通り「増加率」というのは微分量なのであるが、対数に対する微分(変化率)なのである。これを\(d\zeta (t)\)と書くことにしよう。

実は、指数関数が満たす微分方程式も同じように変形することができる。

\begin{equation}\frac{1}{N}\frac{dN}{dt} = \frac{1}{T_0}\end{equation}

左辺が\(d\log N(t) /dt=d\zeta(t)/dt\)に他ならない。すなわち、指数関数というのは「増加率が一定(\(1/T_0\))の場合に現れる関数と解釈できる。

実際の感染の広がりの場合

実際の感染症の蔓延に関しては、増加率が一定ではない。感染初期は蔓延の速度は大きいが、感染者が増えたり、抗体保有者が増えたりすると感染の速度は低下する。そこで、感染の増加量を時間の関数だと思って微分方程式を作ると

\begin{equation} \frac{d}{dt}\log N(t) = \frac{1}{T(t)}\end{equation}と書けるだろう。これを変形すれば\begin{equation}d\zeta(t) = \frac{dt}{T(t)}\end{equation}となる。

増加率\(d\zeta\)を計算/測定する期間\(dt\)において、指数\(1/T(t)\)がほとんど変化しなければ近似的に定数とみなすことができる。\(dt\)を相当広げたときのみ\(T(t)\)の時間変化が検知できると仮定する、という意味である。したがって、このとき、Z値を時間の関数とみなすと一次関数、すなわち直線で近似することができる。

K値の計算においても、発表された総感染者のデータを線型近似している。傾きが一定の区間が結構見つかるのは、そこで指数関数的な増加が起きているということである。上述したように局所的に定義した「倍加時間」はいずれ時間変化する。変化が目に見えて起きれば、近似直線の傾きが変わる。そこで、再び線型近似をやり直す、というのが中野氏らの手法である。

K値とZ値の関係を用いれば、普通の増加率を用いて分析したってまったく同じ情報が手に入る。わざわざK値とかいう不思議な指標なぞ使う必要はない。K→0でZ→0となるので、収束の定義も同じである。

累積感染者数の動向は、超伝導物理の「フェルミ関数」というのによく似ている。本質的なところだけ抜き出してみると\begin{equation}N(t)=\frac{N_1}{1+\exp(-a(t-t_0))}\end{equation}という関数形でかける。\(a=1,t_0=5, N_1=1\)としてグラフに描くと下の図のようになる。

f:id:jippinius:20200803020851p:plain

Fermi分布型の累積感染者数の時間変化(数理モデル

増加率(Z値に相当)はこのグラフの対数に相当するから、それをプロットしてみると次のようになる。

f:id:jippinius:20200803021052p:plain

フェルミ分布の対数グラフ

大雑把に言って、このグラフの振る舞いは、K値の振る舞いを上下逆さまにしたものによく似ている。感染蔓延の初期で、綺麗な直線を描いているのがわかるだろう。そして、感染が収束すると零値へ収まっていくのである。

最大の問題(数理というよりも人間の問題)

数理的な興味からK値についてここまで分析してきたが、我輩の「Z値」とK値を比較してどっちが優れているか判定してみよう、などという気はさらさらない。K値という指標を「考案」して、一生懸命予言らしきことをやっている努力は尊重したいと思う。しかし、いま現在、日本の官公庁が公表している「統計データ」というのは、役人があっぷあっぷした挙句に結局最後まで処理しきれずに、翌日に積み残してしまうような、「質の悪い統計データ」なのである。こんな数字をつかって、一生懸命に数理モデルをこしらえて分析したって、無駄な結果に終わるのは目に見えているのである。

つまり、K値モデルがいいとか悪いとかという問題の前に、今公表されている統計データをまともに分析して意味があるのかどうか、という問題に直面しなくてならないのだ。このブログで何度も書いているように、現在公表されている「感染者数」の分析は無駄である。だいたいPCR検査の数が足りないから、世の中の感染者全てを把握できてないのだ。科学的に分析するのは、「真実の数」であるから、人間の目に映るものだけを分析しても正しい結果は得られない。そのうえ、手工業的にデータを処理しているシステムがパンク状態になっている状況で出てくる数字は「劣化」していて、まともな分析には耐えられないはずである。

以上により、複数の理由から「K値による収束予想」というものは幻想であり、うまくいかないのは当然なのである。さらに、K値などというものは不要であり、単に小学校の算数で習った「増加率」をみるだけで、結構な分析はできるのである(もしデータの質がよければ、の話だが)。

K値を考案した中野先生もさすがに、自分の予言がこれだけ外れてくると、統計データそのものの質がわるいのではないか、と疑いだしたようである。

www.asahi.com

こういうところは、さすがに科学者としてのトレーニングが積んである立派な方だと思う。が、こういうところに物理学者のナイーブさが見て取れる。物理学者が日頃相手にする数字は、厳しいチェックが掛けられた「質の良いデータ」である。機械が不良のまま取り出したデータではなく、最高の状態で整備された実験機器を用いて得られたデータである。それを数理モデルで分析すれば、宇宙の真理がいつの日か得られるであろう。

ところが、役所が発表する統計データというのは、恣意的な加工もあれば、積み残しのような不適当な処理を通して加工された数字になっている場合もある。こういう数字は科学的なデータとは呼べないから、まともな数理理論を使って分析しても意味のある結果は取り出せない。正直者は馬鹿を見る、という感じになってしまう恐れがある。

中野先生は、感染者数データを用いた予言とか予測はもうおやめになった方がよいだろう。それより、役所に対し、「たくさん検査して、精度の高い数字をその日のうちに公表し、科学的な分析に耐えうるだけの品質をもった統計データにするよう」働きかけてもらいたいと思う。「K値の推測が失敗したのはお役所のせいだ」と声高に主張してもらえれば、データの品質が多少なりとも向上するかもしれない。そうなれば、数理モデルを適用しようと思いながらも適用できずに唇を噛んでいた多くの人が恩恵を享受できるだろう。K値の騒動はそこで初めて「価値があった」と認めてもらえると思う。