はじめに
「疑似相関」という言葉は明らかに命名ミスをしているため、新しく「疑似因果」という言葉を提唱したいと思います。二番煎じでしたらすみません。
擬似相関とは
引用ですが、
擬似相関(ぎじそうかん)は、2つの事象に因果関係がないのに、見えない要因(潜伏変数)によって因果関係があるかのように推測されること。
Wikipedia「擬似相関」
因果関係がないのにあたかも因果関係があるように見えることを「疑似相関」「見せかけの相関」などと呼びます。
山口県「120 疑似相関って知っていますか?(令和3年8月19日掲載)」
こちらのサイトでは様々な疑似相関を楽しめます。
例えば次のような例です。お金持ちほど足が遅いのだとか。これを聞いて「ゆっくり走ればお金持ちになれる」と思う人はいないと思います。背後に年齢という原因が隠れているということです。
もう一つ例を挙げます。育毛剤を使う人ほど10年後の髪が少ない。育毛剤を使ったからハゲが進行するのであれば訴訟ものですし、10年後の毛量を確認してから育毛剤を使い始めることもありえません。背後に共通の原因があることが考えられます。(すみません、育毛剤に効果がないとまでは言っていません)
問題点
非常にややこしいことに、相関はあります。相関係数を計算すると+1や-1に近い値が出ることは事実です。それでも因果関係がないことを疑似相関と呼びます。
相関があるのに”疑似”相関。”疑似”は「本物によく似ていて紛らわしいこと」ですが、相関はあるのですから本物の相関です。なんなら別名の「見せかけの相関」もおかしくて、見せかけもなにも相関そのものですよ。
「疑似因果」の提唱
ということで、ここに「疑似因果」という言葉を提唱します。皆まで言わなくても分かりますよね。しばらくこれを使ってみて感触を確かめたいと思います。
ただし、依然として「共通の第3因子による相関」と「偶然の相関」は区別していません。これは擬似相関に関する文献でも明確に区別されていません。前述の「お金持ち」と「50m走タイム」は年齢が原因と考えられますが、「ミス・アメリカの年齢」と「蒸気・熱蒸気・その他熱いものによる殺人数」は相関係数0.87だそうですが偶然の相関でしょう。これらを一緒くたに擬似因果と呼ぶことが適切かどうかは議論の余地がありそうです。