味噌消費量x人口あたり累計感染者数を都道府県別にプロット

2020-09-04

COVID-19 イソジン 味噌

t f B! P L
味噌の摂取量と感染者数の傾向を見てみたいと思いデータを探してみると

久保哲朗氏のサイト
「都道府県別統計とランキングで見る県民性」
に各種統計量がまとめられていて、都道府県別味噌消費量(g/年)もあった。
https://todo-ran.com/t/kiji/11495
「総務省の家計調査から味噌消費量の都道府県別ランキング。家計調査は全国から10000世帯を抽出して調査しており、この中から単身世帯を除いた二人以上の世帯の購入量を比較している。一般世帯における購入量と消費量はほぼ同じと考えて、ここでは消費量としている。家計調査には県庁所在地と政令指定都市の数値が掲載されており、複数の調査都市がある県はそれぞれの値を人口比で按分した数値を、それ以外の県は県庁所在地の数値を県の消費量としている。また、年による変動が考えられるので2014年~2018年の平均値をとっている。」とのこと。


また、感染者数については札幌医科大学のサイト
「【都道府県別】人口あたりの新型コロナウイルス感染者数の推移」
https://web.sapmed.ac.jp/canmol/coronavirus/japan.html?d=2&s=y#date
から9/1時点で掲載されている人口100万人あたりの累計感染者数を拾った。

KenMisoPat = {
   {"長野県", 8085, 127.4},
   {"岩手県", 7803, 15.5},
   {"新潟県", 7605, 64.8},
   {"青森県", 7358, 28.1},
   {"秋田県", 7245, 50.7},
   {"富山県", 7114, 377.4},
   {"山形県", 6835, 72.4},
   {"宮崎県", 6511, 314.1},
   {"静岡県", 6406, 132.3},
   {"熊本県", 6283, 299.8},
   {"鹿児島県", 6108, 226},
   {"福島県", 6098, 90.5},
   {"長崎県", 6042, 174.8},
   {"鳥取県", 5947, 39.6},
   {"佐賀県", 5940, 290.8},
   {"大分県", 5929, 129.5},
   {"宮城県", 5807, 89.8},
   {"北海道", 5703, 339.2},
   {"山口県", 5585, 125.2},
   {"岐阜県", 5523, 280.8},
   {"石川県", 5426, 573.8},
   {"三重県", 5371, 213.4},
   {"福岡県", 5353, 900.9},
   {"福井県", 5345, 302.1},
   {"埼玉県", 5262, 540.8},
   {"茨城県", 5260, 192},
   {"千葉県", 5229, 490.2},
   {"徳島県", 5213, 182.7},
   {"愛知県", 5122, 600.5},
   {"神奈川県", 4968, 545.8},
   {"広島県", 4764, 163.3},
   {"島根県", 4764, 203.3},
   {"高知県", 4751, 183.4},
   {"群馬県", 4726, 229.1},
   {"栃木県", 4652, 158.2},
   {"愛媛県", 4574, 85.1},
   {"山梨県", 4424, 213.3},
   {"滋賀県", 4373, 319.7},
   {"和歌山県", 4373, 248.6},
   {"京都府", 4348, 562.1},
   {"東京都", 4313, 1507.6},
   {"沖縄県", 4170, 1472.1},
   {"香川県", 4005, 80.5},
   {"奈良県", 3977, 393.2},
   {"岡山県", 3919, 76.7},
   {"大阪府", 3644, 982.6},
   {"兵庫県", 3471, 416.4}};

それぞれの列を変数に入れておく。

Ken = Transpose[KenMisoPat][[1]];
Miso = Transpose[KenMisoPat][[2]];
Pat = Transpose[KenMisoPat][[3]];


味噌の消費量を横軸、人口当たりの感染者数を縦軸にとってプロットしてみる。

ListPlot[Transpose[{Miso, Pat}]]














グラフのラベルに使おうとすると漢字がだめだったのでローマ字表記の都道府県も変数に入れておく。

KenR = {"Nagano", "Iwate", "Niigata", "Aomori", "Akita",

"Toyama", "Yamagata", "Miyagi", "Shizuoka", "Kumamoto",

"Kagoshima", "Fukushima", "Nagasaki", "Tottori", "Saga",

"Oita", "Miyagi", "Hokkaido", "Yamaguchi", "Gifu",

"Ishikawa", "Mie", "Fukuoka", "Fukui", "Saitama", "Ibaraki",

"Chiba", "Tokushima", "Aichi", "Kanagawa", "Hiroshima",

"Shimane", "Kochi", "Gunma", "Tochigi", "Ehime",

"Yamanashi", "Shiga", "Wakayama", "Kyoto", "Tokyo",

"Okinawa", "Kagawa", "Nara", "Okayama", "Osaka", "Hyogo"};


ListPlotで各点にラベルをつけるのは「→ラベルの並び」とやればいいようだ。

ListPlot[Transpose[{Miso, Pat}] -> KenR]




















相関関係は因果関係ではないし、これから結論を出そうというのは無理がある。
このデータセットの段階であれこれ統計量を出しても味噌の効果を調べる意味においては
多分意味ないだろうと直感的に思う。
ただ、味噌をたくさん摂っているほど感染しやすいという仮説は棄却できそうな気がする。

少なくとも人と人との遭遇確率を都道府県別に出してこれで感染者数を割り算するべきだろう。
さらにいうなら、遭遇した際にどの程度しゃべるか係数も加味する必要があるだろう。

「どさ」「ゆさ」で通り過ぎる人々と、一時間ほど世間話に花を咲かせて
最後に「オチ」をつけないと会話が終わらないような地方の人々とでは
感染確率が違ってくるだろう。

単純化するなら携帯会社が調べているような接触時間(定義が難しいが)の合計を使って
累計感染者数/人口/接触時間合計
を求めてこれと味噌消費量の関係を確認する必要があると思われる。
携帯会社のビッグデータどこかに転がってないかしら。

とはいえ、せっかくWolframCloudに入力したので、統計関数も確認してみる。

いわゆる相関係数は
Correlation[Miso, Pat]
-0.422227

他にもこんなのとか色々ある。

SpearmanRankTest[Miso, Pat, "TestDataTable"]





KendallTauTest[Miso, Pat, "TestDataTable"]





プロットオプションについて

デフォルトでは点が密集したところのラベルが省略されるようになっていたが
LabelingFunction -> Allをつけると全て表示された。
こんな環境が無料で使い放題なんて、Wolframすごい。

ListPlot[Transpose[{Miso, Pat}] -> KenR, LabelingFunction -> All,
AxesLabel -> {"年間味噌消費量 g", "累計感染者数/百万人"}]











QooQ