跳去內容

格蘭傑因果關係

出自維基百科,自由嘅百科全書

格蘭傑因果關係係一種多變量時間序列分析。最基本嗰種做法,係利用自迴歸模型嚟剖析兩個或以上嘅變數之間能唔能夠彼此預測,可以用嚟做假說檢定,幫助研究者判斷變數間嘅因果關係。想像下圖噉:

幅圖入便有兩條時間序列,反映 X 同 Y 兩個變數分別點樣隨時間而變化,假想研究者睇勻之前嘅研究,有理由相信 X 係因而 Y 係果。佢攞住兩條時間序列,揀好時間間隔 Δt。根據格蘭傑因果嗰套諗法:若果時間點 t 嘅 X 值傾向能夠預測(紅色箭咀)時間點 (t + Δt) 嘅 Y,噉 X 就可以算係 Y 嘅格蘭傑因

格蘭傑因果依種分析方法源自經濟學上嘅研究:經濟學成日分析唔同嘅經濟指標,留意呢啲指標嘅數值點樣隨時間上落;而到咗依家,格蘭傑因果喺各社科中都會用到,而且腦神經學都有用到依種技術[1]

好似 Python 等嘅程式語言都有套件,可以用嚟計數做格蘭傑因果分析[2]

基礎概念

[編輯]

用術語講,格蘭傑因果指緊嘅係:[3]

話 [y 並非 x 嘅格蘭傑因] 呢句嘢成立,若且唯若 x,考慮到 x過去作為條件,同 y 嘅過去統計獨立[4]

抽象化啲講,可以噉樣想像[註 1]

當中 表示機率A 係任意嘅非集合,而 分別代表喺時間點 t 嗰時可用嘅所有資訊,以及係排除咗 X 之後嘅資訊。假如上述嘅假說可以接受,X 就謂之 Y 嘅格蘭傑因[5][6]

格蘭傑因果嗰套分析法,建基於迴歸模型,尤其係自迴歸模型。舉具體例子,依家設 yx 都係平穩[註 2]嘅時間序列。要操作化噉分析兩者之間係咪有格蘭傑因果關係,可以用以下噉嘅自迴歸模型,透過 y 嘅過去嚟預測佢嘅現在:

之後攞住呢個自迴歸模型,擴充,加入 x滯後項,而滯後值係指攞幾多個時間點前嘅 x 預測 y

當中啲滯後項嘅意思,即係嘗試用之前嘅時間點嘅 x 嚟預測 y 現時嘅值。假如變數有三個或以上,都可以用同樣嘅思路嚟諗。格蘭傑因果做嘅分析,可以想像成假說檢定,想用 F 測試,得知拃滯後項嘅 b 系數係咪統計顯著。如果冇任何滯後項嘅系數達得到統計顯著,

[註 3]

就無法拒絕虛無假說,於是就會得出 x 唔會格蘭傑引致 y 或者 x 唔係 y 嘅格蘭傑因噉嘅結論

注意點

[編輯]

做格蘭傑因果分析嗰陣時,要留意好多嘢[7]

  • 假設
    • 平穩假設:呢種分析假設咗手上嘅時間序列嘅統計特性係恆常嘅,唔會隨時間變化,當中統計特性包括有平均值方差呀噉;要評估手上嘅數據係咪合乎平穩假設,可以使用擴張版迪基福勒檢驗
    • 線性假設:用線性自迴歸模型嚟檢測格蘭傑因果,假定咗啲變數之間嘅關係成線性,但呢點未必一定成立。[8]
  • 滯後點揀:決定滯後值要係幾多嗰陣,可以用到赤池準則貝葉斯準則等嘅概念。另一種簡單直接嘅做法,係睇勻前人做嘅研究,觀察佢哋用咗乜嘢滯後值。
  • 控制變數

即係同第啲統計分析法一樣,首先要檢驗假設係唔係成立,然後再決定參數,喺格蘭傑因果中參數包括滯後值。

腦神經學

[編輯]
睇埋:功能聯結

腦神經學有陣時會使用格蘭傑因果關係嚟分析神經造影得出嘅數據

腦神經學入便,功能聯結通常係用嚟形容唔同腦區之間嘅腦活動點樣相互協調。最基本上,當某兩個腦區喺時間上嘅活化模式有顯著嘅統計相關,佢哋就謂之存在功能聯結。呢個概念反映嘅並非單純嘅結構聯結[註 4]而係講緊佢哋喺功能上會唔會一齊活動。要分析功能聯結,研究者要睇腦電圖(EEG)或者功能磁振造影(fMRI)得出嘅數據,剖析唔同腦區喺時間上嘅訊號關係,即係話呢啲分析本質上就要考慮兩條或以上嘅時間序列點樣彼此預測、彼此關聯[9]。喺呢種分析入面,研究者通常會選定兩組時間序列:X 同 Y,兩條序列可以分別代表某兩個腦區嘅腦活動程度。例如:

前額皮層:X = [3.1, 3.3, 3.4, 3.6, 3.9, 4.1, 4.0, 4.2, 4.4, 4.5]
頂葉整體:Y = [2.8, 2.9, 3.0, 3.2, 3.5, 3.7, 3.8, 4.0, 4.2, 4.3]

然後研究者就可以分析兩條序列之間係咪有格蘭傑因果關係。做假說檢定,睇吓兩者之間嘅格蘭傑因果關係,係咪達到統計上顯著,係嘅話就初步確立,兩個腦區之間算係有功能聯結。



哲學爭論

[編輯]

有好多學者都認為,格蘭傑因果呢個名帶有誤導成份。

對於格蘭傑因果係咪可以證實兩個變數間存有因果關係,二十一世紀初嘅學界依然有一定爭議。格蘭傑因果個諗頭,基於兩個認為係合乎直覺嘅諗法:[6][5]

  1. 無論因果要點樣界定都好,因時間上都必定要發生喺果之前。
  2. 因嘅值能夠提供資訊,預測果嘅值。

不過就算確立到格蘭傑因果關係,都唔能夠成功證實 XY 之間有真正嘅因果關係,由哲學角度睇[10]:就算用數據計咗好多數,發覺 XY 之間有顯著嘅格蘭傑因果關係,都只係表示佢哋之中其中一個能夠預測另外嗰個跟住落嚟嘅變化,又或者提供有關另外嗰個變數嘅資訊;依然排除唔到一個可能性,就係可能兩個變數都同時受某個第三起因驅動[註 5]而呢個起因對兩個變數嘅時間滯後唔同。因此,統計師用親格蘭傑因果,會選用以下噉嘅語句:

「研究結果發現 X 格蘭傑引致 Y。」而非「研究結果發現 X 引致 Y。」

噉講用意係強調返佢哋講緊嘅因果,係基於格蘭傑因果分析得出嘅,有別於嚴格科學同哲學上用嚟確立因果關係嘅做法[註 6]。有關點先至可以確立變數間嘅因果關係,科學界一般認為要用實驗操作至得[11]

睇埋

[編輯]

文註

[編輯]

引用咗呢啲來源:

  1. Granger, C. W. J. (1969). "Investigating Causal Relations by Econometric Models and Cross-spectral Methods". Econometrica. 37 (3): 424-438.
  2. Granger Causality Test in Python
  3. What is Granger causality?
  4. Barnett, L. and Seth, A.K., 2014. The MVGC multivariate Granger causality toolbox: a new approach to Granger-causal inference. Journal of neuroscience methods, 223, pp.50-68,佢哋噉講:"We say that Y does not G-cause X if and only if X, conditional on its own past, is independent of the past of Y;"
  5. 5.0 5.1 Eichler, Michael (2012). "Causal Inference in Time Series Analysis" (PDF). 出自 Berzuini, Carlo (編). Causality: statistical perspectives and applications (第3版). Hoboken, N.J.: Wiley. pp. 327–352. ISBN 978-0-470-66556-5. 原著 (PDF)喺2014年2月26號歸檔. 喺2025年10月18號搵到.
  6. 6.0 6.1 Granger, C.W.J. (1980). "Testing for causality: A personal viewpoint". Journal of Economic Dynamics and Control. 2: 329–352. doi:10.1016/0165-1889(80)90069-X.
  7. Ultimate Guide to Granger Causality
  8. Lutkepohl. New introduction to multiple time series analysis. Springer Science & Business Media, 2005.
  9. Wang, H. E., Bénar, C. G., Quilichini, P. P., Friston, K. J., Jirsa, V. K., and Bernard, C. (2014). A systematic framework for functional connectivity measures. Front. Neurosci. 8:405,佢哋呢度噉講:"Functional connectivity is defined as the statistical dependence among measured time series..."
  10. Mariusz, Maziarz (2015-05-20). "A review of the Granger-causality fallacy". The Journal of Philosophical Economics (英文). VIII. (2). ISSN 1843-2298.
  11. Hinkelmann, Klaus; Kempthorne, Oscar (2008). Design and Analysis of Experiments, Volume I: Introduction to Experimental Design (2nd ed.). Wiley.

註釋:

  1. 呢條式用咗機率同埋條件期望嘅概念同數學符號
  2. 如果話某條時間序列平穩,意思係話佢嘅各統計特性唔會隨時間改變。
  3. 有關實際應用上,啲 b 系數嘅值要點樣由數據集嗰度估計出嚟,可以睇睇迴歸模型同埋最大似然估計等嘅概念。
  4. 結構聯結:指佢哋之間係咪有神經組織直接駁住。
  5. 相關唔蘊含因果相關嘅討論,都有講到呢種可能性。
  6. 再者,格蘭傑因果用咗統計模型,唔係咁方便用嚟處理決定型系統

參考

[編輯]

相關概念嘅外語嗌法:

  • 格蘭傑因果,參見英文Granger causality,又叫 G-causality 或者 GC
  • 格蘭傑因英文Granger cause
  • 格蘭傑引致英文(to) Granger cause
  • 平穩(形容時間序列),英文stationary
  • 滯後值英文lag,近似粵拼lek1

經濟學文獻成日討論格蘭傑因果:

  • Enders, Walter (2004). Applied Econometric Time Series (第Second版). New York: Wiley. pp. 283–288. ISBN 978-0-471-23065-6.
  • Granger, C. W. (1969). Investigating causal relations by econometric models and cross-spectral methods. Econometrica 37, 424-438. doi: 10.2307/1912791
  • Gujarati, Damodar N.; Porter, Dawn C. (2009). "Causality in Economics: The Granger Causality Test". Basic Econometrics (第Fifth international版). New York: McGraw-Hill. pp. 652–658. ISBN 978-007-127625-2.

非經濟學嘅文獻:

  • Barnett, L. and Seth, A.K., 2014. The MVGC multivariate Granger causality toolbox: a new approach to Granger-causal inference. Journal of neuroscience methods, 223, pp.50-68,由腦神經學嘅角度嚟教人點做格蘭傑因果分析。
  • Seth, A.K., Barrett, A.B. and Barnett, L., 2015. Granger causality analysis in neuroscience and neuroimaging. Journal of Neuroscience, 35(8), pp.3293-3297.

通向外部資源嘅拎: