相關唔蘊含因果
相關唔蘊含因果(譯自英文:correlation does not imply causation)係統計學上嘅一句說話,指緊就算兩個變數之間有統計相關,都唔表示兩個變數之間有因果關係;假想而家有兩個變數 X 同 Y 之間有強嘅相關,噉可以有三個可能性-
- X 引致 Y;
- Y 引致 X;
- X 同 Y 有同一個原因。
由此可見,有統計相關唔表示呢兩個變數之間有因果關係呢句說話一定成立。
換句話說,
- 有統計相關,並非
- 呢兩個變數之間有因果關係
嘅充分條件。
詞解
[編輯]相關唔蘊含因果呢句說話講因果關係,有兩隻重點詞語:相關同蘊含。
相關
[編輯]統計相關通常用於統計學,講緊兩個變數之間有冇數據上嘅關係,如果話兩個變數間有相關,即係話當其中一個變數改變嘅時候,另一個變數都傾向有啲改變。呢種改變只係一齊出現嘅規律,唔代表其中一樣會導致另一樣發生。舉個例說明,假如做咗統計,發現城市入便雪糕嘅賣出量同泳池發生意外嘅次數兩個變數間有正相關,意思係話兩者數值傾向一齊升或者一齊跌,但唔代表食多啲雪糕會引致泳池多咗意外-可能只係因為夏天嚟咗,兩樣都一齊上升[1]。
皮亞遜積差相關係數(參見英文:Pearson correlation coefficient)係統計學成日用嘅指標,用嚟評估變數之間嘅相關,「兩個變數 同 之間嘅皮亞遜積差相關係數」()定義如下[1]:
- ,當中
蘊含
[編輯]蘊含係邏輯用嘅概念,指嘅係如果某個前提成立,噉某個結論都一定會跟住成立。譬如
- 「如果今日係星期日,噉學校就唔開門。」
就係一段邏輯蘊含關係。
喺形式邏輯入面,蘊含會寫成 A ⟹ B 噉嘅樣,即係 A 成立 B 就必定會成立(A 蘊含 B)[註 1][2]。喺星期日個例子之中:
- A(前提)係:「今日係星期日」
- B(結論)係:「學校唔開門」
所以全句就可以寫成:
- 如果 A(今日係星期日),噉 B(學校唔開門)
純用邏輯符號嘅話就係:
- A ⟹ B
又留意:如果今日唔係星期日(即 A 唔成立),噉成句命題(A ⟹ B)冇話一定要 B 成立,亦冇話 B 一定唔成立。
典故
[編輯]有唔少統計學初階學生都以為,兩個變數之間有明顯嘅相關就表示兩者之間有因果關係,以為相關蘊含因果,但呢個係錯誤嘅諗法。當兩樣嘢一齊變(一齊升或者一齊跌)人腦自然會覺得其中一樣嘢係導致另一樣嘢發生嘅原因。但事實上統計上有相關,唔等於其中一樣係另一樣嘅原因。舉個例子:研究可能發現
- 「小朋友書架上有越多書,學業成績越高。」
噉初學者可能會話:買多啲書俾仔女,就可以令佢哋讀書叻啲。但實際上,背後可能係有第三個因素,例如家長教育程度,會同時影響屋企有幾多書同小朋友嘅學業表現。
因此,統計學界就有咗句噉嘅說話:相關唔蘊含因果,用嚟提醒學生要小心[3]。
睇埋
[編輯]註釋
[編輯]引咗
[編輯]- ↑ 1.0 1.1 Rodgers, J. L.; Nicewander, W. A. (1988). "Thirteen ways to look at the correlation coefficient". The American Statistician. 42 (1): 59–66.
- ↑ Beall, JC and Restall, Greg, Logical Consequence The Stanford Encyclopedia of Philosophy (Fall 2009 Edition), Edward N. Zalta (ed.).
- ↑ Aldrich, John (1995). "Correlations Genuine and Spurious in Pearson and Yule" (PDF). Statistical Science. 10 (4): 364-376.