Umeko's diary

育児も仕事も大切。日々の出来事や、習ったことから得た気付きや学びを書いていきます。

統計学超入門とコロナ公開情報への応用。緊急事態宣言は言葉の定義が問題。

週刊ダイヤモンド統計学超入門を読みました。 

 

約1年前の雑誌ですが、コロナで数字が飛び交う中、数式なしで「目の付けどころ」を教えてくれる良書でした。

 

面白かったポイント;

1.データリテラシーを高める4箇条

  • 平均に気をつけろ;2017年の貯蓄現在高では平均値は1327万円!一方で中間値は792万円。平均値が極端に大きい数字に引っ張られることもある。常に平均値が真ん中を指すと思わないように。
  • 全体だけでなく部分も見ろ求人倍率1.88倍といっても売り手市場とは限らない。大企業に限ってみればたった0.37倍。全体だけ見るとミスリードの可能性あり。
  • 率は分母・分子に注意しろ;日本のキャッシュレス比率は経産省の計算だと18.4%だけど金融庁の試算だと54%!分子に銀行振り込みや電子マネーの乗車券が含まれていなかったり、分母に住居・電気等の支出や支払いや実際は発生しない持ち家家賃も含まれている。分子が過小で分母が過大!率は分母と分子に何を入れるかで大きく変わる。
  • 調査方法を確かめろ;やり方を見てみると大きな誤差が生まれるやり方かも。

 

2.Facebookはおじさんとおばさんしか使っていない?

よく言われていることだけど、検証してみると実は年代別には20代の利用率が一番多い。でも40代、50代が急増しているからおじさん”ばかり”と感じてしまう。

加えて「おじさんとおばさん」の定義が20代から見たら30代以上はみんなおじさんだから!?まず言葉の定義を明確にする必要がある。

 

データは作れる」を念頭に置いて数字と相対していかなければならないと感じました。

 

ではコロナに関して出ている情報はどうか。

首相が緊急事態宣言について「感染者の爆発的増加の可能性が相当程度低下する」などすれば速やかに解除するとされていましたが、解除されるかどうか、公開されている情報からわかるのでしょうか?

YahooのまとめとNHKの特設サイトの情報をみてみました。

 

  • 国内の感染者数は%ではなく人数で示されています。事実なので問題なし。1日当たりの感染者数の伸びは減り、回復者数は増えているように見えます。ただし、何人調べて何人が感染者とされたのか、分母になる数字がわからないので、爆発的増加の可能性が低下しているかはわかりませんでした。検査の信頼度(感度と特異度)もわかりません。
  • NHKの年代別のデータ解析では、「年代別割合」では全員を100%した各年代の人数が示されていました。「これって年代別の分母の人数が違うからなあ」とおもっていたら次に「人口10万人あたりの人数」のデータが。さすがNHKです。
  • 最低7割、極力8割の接触削減ができるか。NHKの17地点をピックアップしたデータでは、感染拡大前と比較して5~8割減っているようです。調査方法やどの時点の比較かも明示されており、さすがNHKです。ただ、実数が示されてないのでどの程度信用していいか、不明です。

 

感染しているか、していないか、といったシンプルな指標なのであまり統計としての作為が入っていないように感じました。

 

しかし、そもそも「相当程度」ってどれくらいか、言葉の定義が明確になっていないのでわからない!

そのため、結論としては指標の定義が明確でないため、公開情報だけではいつ宣言が解除されるかはわかりませんでした。

 

数字を見ると無条件に信じてしまいますが、こういった観点をもってあたると少し違った世界が見えそうです。