Yahoo!ニュース

『パンを食べるとガンになる?』って本当!?

森井昌克神戸大学大学院工学研究科 教授
詐欺

もしあなたの彼がアダルトサイトを見ているとしたら注意した方が良いかもしれません。なぜなら、The Institute for the Study of Laborが発表した研究で、男性がポルノを見る時間と結婚をしない確率は比例すると言う恐ろしい結果が分かったからです。

出典:アダルトサイトを見る男性は結婚率が低い―研究結果

本当でしょうか。何となく納得するところもあります。彼にアダルトサイトを見てほしくないという願望が納得に拍車をかけるのかもしれません。しかし、このような内容では一般的に因果関係が逆の場合もあるのです。アダルトサイトを見ているから結婚しないのではなく、結婚できないからアダルトサイトを見ているとも考えられるからです。このように統計に基づく調査では注意しなければなりません。もちろん、大学等の研究機関では間違う事なく正しい推論を下しているはずですが、ある結論に誘導するために、あえて数字だけを与えた信頼できない推論を与えている場合も少なくありません。

乳ガンはもともと欧米に多い病気ですが、ここ最近では日本でも乳ガン患者が急激に増えており、料理評論家の幕内秀夫さんによれば、乳ガンの患者さんで、朝にパンを食べている方の割合は、40歳以上で7割、20代、30代では8割に上ると言われています。

出典:朝食でパンを食べることが、人間の脳と体を完全に狂わせる。

これも同じです。本当でしょうか。

人は数字を上げられると妙に納得する傾向があります。しかし数字ほどウソをつくものはありません。正確に言えば、数字は正しくとも、その数字の意味が十分説明されず、結果としてウソになってしまうことがあるのです。ある調査でSE(システムエンジニア)の平均年収が590万円と書かれていたとします。この平均という言葉が曲者なのです。一般的には平均590万円と言えば、ほとんどの人が590万円前後の給与であるとイメージしてしまいます。しかし、ほとんどの人が200万円前後で、一部の人が2000万円以上ならば、平均をとれば、590万円になることだってあり得るのです。平均がすべての特徴を表しているわけではないのです。この「平均神話」とも言える考えが幅を聞かせている一つの理由が、「ほとんど同じ」という発想です。年収に関しても、格差がなくほとんど同じという仮定の上で、平均というイメージがあるのです。平均だけでは何もわからず、逆に平均によって間違った理解をすることがあるのです。また、平均という言葉にも裏があります。通常は相加平均を単に平均と呼んでいるのですが、計算式が異なる相乗平均や調和平均もあり、一般化平均や加重平均もあります。いろいろな平均を求める方法があり、場合によっては平均という言葉だけで、都合のよい値を選んで公表することもできるのです。

また、「SEの平均年収は590万円」とだけ書けば「すべてのSEの平均年収」と錯覚してしまいます。統計学的に言えば、この平均値は母集団の値か、あるいは標本に対する値かということです。一般には標本に対する平均値となります、つまり、世の中のすべてのSEの平均年収ではなく、一部のSE(サンプル,標本)を選んで、その平均値なのです。その選び方、数も大きく影響するのです。数字や統計は往々にしてウソをつくことがあるのです。

以前、「朝、味噌汁を飲む人は健康というデータが示された」というニュースが流されました。この手のニュースは時折、最近のクイズ形式のバラエティ番組でよく紹介されます。では、味噌汁は健康に良いのでしょうか。たとえ、数十万人という十分なサンプル数で、かつ、何十年にわたる長期間の調査であったとして味噌汁が健康に良いのか否かということはわからないのです。数字というデータだけが独り歩きをし、騙されてしまうことが多いのです。

朝に味噌汁を飲み人と味噌汁を飲まない人に分けて、数十年のわたり健康調査を行い、味噌汁を飲む人で健康な人の割合が、飲まない人で健康な人の割合に比較して、圧倒的に、たとえば何倍も多いとしても味噌汁の効用については何とも言えないのです。たとえば、味噌汁を飲むことが健康に寄与するのではなく、朝、味噌汁を飲むためには早起きしなければなりません。一般的に早起きするためには規則正しい生活をする必要があり、それが健康に寄与しているかもしれないのです。このデータを信じるためには少なくとも味噌汁以外を同じ状況にするとともに、味噌汁以外のものを飲む必要があります。一般に原因と結果の関係を明白にすることは非常に難しいのです。複雑怪奇な統計分析手法は多々あり、医学や工学等の理系の分野だけでなく、経済学や心理学の文系の分野で用いられています。後者の方がその利用については進んでいますが、この結果と原因の関係を明確に導出する統計分析手法は存在しません。原因や結果の候補は導出できる場合もあるのですが、最終的な意味付けは、人の経験による主観で行います。何のデータなのかということは疑ってみる必要があるのです。

「コーラの過剰摂取は低カリウム血症を引き起こす」とのニュースが流れたことがありました。ソフトドリンクの過剰摂取と健康上の問題はよく取り上げられ、飲み過ぎは健康に悪いことぐらい、実験をしなくても理解できそうです。では、コーラが低カリウム血症だけでなく、体に悪いのかというと疑問が残ります。過剰摂取と言っても、どれぐらい飲めば過剰摂取か人によって基準が異なるからです。私の個人的な基準では、一日1リットル飲めば十分過剰摂取のような気がするのですが、ニュースでは一日2リットルから9リットルと書いています。9リットルも飲む人がそう多くいるとは思えないのですが。

神戸大学大学院工学研究科 教授

1989年大阪大学大学院工学研究科博士後期課程通信工学専攻修了、工学博士。同年、京都工芸繊維大学助手、愛媛大学助教授を経て、1995年徳島大学工学部教授、現在、神戸大学大学院工学研究科教授。情報セキュリティ大学院大学客員教授。情報通信工学、特にサイバーセキュリティ、インターネット、情報理論、暗号理論等の研究、教育に従事。加えて、インターネットの文化的社会的側面についての研究、社会活動にも従事。内閣府等各種政府系委員会の座長、委員を歴任。2018年情報化促進貢献個人表彰経済産業大臣賞受賞。 2019年総務省情報通信功績賞受賞。2020年情報セキュリティ文化賞受賞。電子情報通信学会フェロー。

森井昌克の最近の記事