12/9(月) 応用科学学会シンポジウムで自動運転に関する講演を担当します☆彡(試乗会もあります!来て!)

26-5. 「疑似因果」の提唱(疑似相関という言葉を使うな)

はじめに

「疑似相関」という言葉は明らかに命名ミスをしているため、新しく疑似因果という言葉を提唱したいと思います。二番煎じでしたらすみません。

擬似相関とは

引用ですが、

擬似相関(ぎじそうかん)は、2つの事象に因果関係がないのに、見えない要因(潜伏変数)によって因果関係があるかのように推測されること。

Wikipedia「擬似相関」

因果関係がないのにあたかも因果関係があるように見えることを「疑似相関」「見せかけの相関」などと呼びます。

山口県「120 疑似相関って知っていますか?(令和3年8月19日掲載)」

こちらのサイトでは様々な疑似相関を楽しめます。

Spurious Correlations
Correlation is not causation: thousands of charts of real data showing actual correlations between ridiculous variables.

例えば次のような例です。お金持ちほど足が遅いのだとか。これを聞いて「ゆっくり走ればお金持ちになれる」と思う人はいないと思います。背後に年齢という原因が隠れているということです。

もう一つ例を挙げます。育毛剤を使う人ほど10年後の髪が少ない。育毛剤を使ったからハゲが進行するのであれば訴訟ものですし、10年後の毛量を確認してから育毛剤を使い始めることもありえません。背後に共通の原因があることが考えられます。(すみません、育毛剤に効果がないとまでは言っていません)

問題点

非常にややこしいことに、相関はあります。相関係数を計算すると+1や-1に近い値が出ることは事実です。それでも因果関係がないことを疑似相関と呼びます。

相関があるのに”疑似”相関。”疑似”は「本物によく似ていて紛らわしいこと」ですが、相関はあるのですから本物の相関です。なんなら別名の「見せかけの相関」もおかしくて、見せかけもなにも相関そのものですよ。

「疑似因果」の提唱

ということで、ここに疑似因果という言葉を提唱します。皆まで言わなくても分かりますよね。しばらくこれを使ってみて感触を確かめたいと思います。

ただし、依然として「共通の第3因子による相関」と「偶然の相関」は区別していません。これは擬似相関に関する文献でも明確に区別されていません。前述の「お金持ち」と「50m走タイム」は年齢が原因と考えられますが、「ミス・アメリカの年齢」と「蒸気・熱蒸気・その他熱いものによる殺人数」は相関係数0.87だそうですが偶然の相関でしょう。これらを一緒くたに擬似因果と呼ぶことが適切かどうかは議論の余地がありそうです。

SNS等でお気軽にご連絡ください

※当ブログに関することは何でもご相談・ご依頼可能です(Servicesになくても)
※TwitterはFF外の場合はDMではなく返信orメンションでお願いしますm(_ _)m

情報発信しています

質問・コメントはSlackやDiscordでお気軽に

勉強会の告知はこちらで

[I] その他・雑記
この記事を書いた人

博士(理学)。専門は免疫細胞、数理モデル、シミュレーション。米国、中国で研究に携わった。遺伝的アルゴリズム信者。物価上昇のため半額弁当とともに絶滅寸前。

この記事をシェアする
Vignette & Clarity(ビネット&クラリティ)
タイトルとURLをコピーしました