データにだまされるな(1) 因果関係

品質管理においてデータはとても大切なものですが、データが意味することを見誤ると大変なことになることがあります。今回は、その一つとして「因果関係」についてお話します。私の著書を読まれている方には重複する内容となりますが、復習としてご覧ください。

データを見ているとき、2つの項目が連動しているように見えることがあります。散布図を作ってみて相関関係が認められるとき、「どちらかが原因で、どちらかが結果だろう」と感じると思います。そして、直感的に「こっちが原因で、こっちが結果」と思い込んでしまうことがあります。しかし、原因と結果の関係(因果関係)を考えるときは、よくよく注意する必要があります。

ある2つの事象(AとB)に関連性がありそうなとき、その因果関係には次の4パターンがあります。
 ①Aが原因で、Bが結果
 ②Bが原因で、Aが結果
 ③別の要因Cが原因で、AとBは共にその結果
 ④AとBは無関係(偶然、関係があるように見えた)
これを見誤ると大失敗を起こします。

「第二十六回 因果関係」補足ページ

例えば、①と②の例を挙げます。「睡眠時間と心臓病の発症率との間に関連が見られる」と聞いて、どう感じるでしょうか?
 ⑴長く眠ると心臓に悪い → 長く眠らない方がよい
 ⑵心臓が悪いと長く眠る → よく眠って心臓を休ませた方がよい
このように、解釈が違うとまったく正反対の行動になります。

③の例も挙げます。「歯が痛い時によく肩がこる」という症状がある場合、どう考えるでしょうか? 普通は「歯の痛みのせいで緊張して肩がこる」と考えがちですが、実は初期の狭心症の関連痛として歯の痛みと肩こりが同時に起きることがあります。つまり、原因は想定外の狭心症であり、歯の痛みも肩こりもどちらも結果である場合があるのです。

どちらが「原因でどちらが結果か」を考える際は、仮説を作って検証を繰り返すことが必要です。この時、帰納的思考と演繹的思考の2つの思考(脳の働き方)が必要です。
【帰納的思考】事象の共通点から、法則を推測すること。
【演繹的思考】法則を組み合わせて、事象を推測すること。

「第二十七回 帰納的思考、演繹的思考」補足ページ

つまりこの2つは、物事を考える際の向きが違います。因果関係を考えるときは、この2つで「仮説と検証」を繰り返すのです。
◆ 仮説【帰納的思考】… 多くのデータを分析して、「こういうことが起こるのは、これが原因だろう」と考える。
◆ 検証【演繹的思考】… 得られた仮説について、「これが原因だとしたら、この場合はこうなるはず」と考えて、そうなることを確認する。

このように、データから因果関係を調べるときは、
 ①関係があるか調べる(相関分析)
 ②因果関係の仮説を立てる(帰納的思考)
 ③仮説を検証する(演繹的思考)
の3つが必要です。手間がかかりますが、とても重要なことです。

コメント

タイトルとURLをコピーしました