跳去內容

參數

出自維基百科,自由嘅百科全書

參數粵音:caam1 sou3;參見英文parameter)係數學統計學人工智能等領域都會用到嘅概念,指緊能夠定義某個系統嘅數值。參數呢個概念喺建立統計模型或者預測現象嗰陣時都好有用,仲可以用嚟教人工智能做決策

基本概念

[編輯]
幅圖嘅兩條軸分別代表研究緊嗰兩個變數(x 同 y),每一個紅點代表一個個案,每個個案都喺兩個變數上各有個值。用迴歸分析可以估計出條線(綠線藍線都係可行嘅線)並且知道,兩個變數大致上成正比,呢條線跟住就可以攞嚟做預測。

喺數學同統計學入便,參數係指一啲喺個模型(數學模型統計模型)入便嘅數值,可以係預先固定咗,或者用數據估算佢哋嘅數值,用嚟表達個系統本身嘅特性。舉個例說明,用線性迴歸模型做例子:

根據呢個迴歸模型:

  • 截距,即係當 x = 0 嗰時 y 嘅估計值;
  • 斜率,反映咗 x 每上升一個單位 y 預計會升幾多;
  • 誤差項,代表個模型解釋唔到嘅變化。

舉幾個實際例子,x 同 y 可以係

  • 健康:如果 x 係一個人每日做運動嘅分鐘數,而 y 係佢體重嘅改變值,噉 代表運動量有幾預測到減肥嘅成功度。
  • 教育:如果 x 係學生嘅溫習時數,而 y 係佢最終考試嘅分數,噉 代表溫習量有幾預測到成績。
  • 營銷:如果 x 係某個廣告嘅播放次數,而 y 係產品銷量,噉 就代表廣告播放次數有幾預測到銷量[註 1]

喺呢個模型中, 就係模型嘅兩個參數。研究者攞到數據就可以用統計分析方法(例如最大似然估計呀噉)估算出佢哋嘅數值係幾多,做好估計之後研究者就得到有用嘅資訊,將來遇到新嘅數據嗰陣可以代新數據嘅 x 值入去條式度,預測 y 值。喺呢個過程中,個迴歸模型係一個假想嘅系統,模擬緊所研究嘅現象,而 就係描述緊呢個系統本身嘅特性[1]

機器學習

[編輯]
睇埋:機器學習

機器學習(ML)係人工智能下嘅學科,專門研究點樣教 AI 由數據中學習。喺 ML 之中,學習可以想像成參數嘅改變:想像依家個 AI 靠住線性迴歸模型(或者更複雜進階嘅統計模型」預測自己見到嘅現象,學習過程可以想像成係佢識得一路睇數據一路按數據調整自己嘅參數,順利嘅話就會令預測結果愈嚟愈準[2][3]

由迴歸模型至人工神經網絡,都可以想像成一個個模型,而所謂嘅「學習」,就係「教電腦自動噉不斷改良自身嘅參數」噉嘅過程。透過調整呢啲參數,模型可以更準確噉理解輸入數據同預測未知輸出,從而應用喺醫療診斷等嘅多個範疇之上。

奧坎剃刀

[編輯]
睇埋:奧坎剃刀

奧坎剃刀英文Occam's razor)係科學哲學上一條重要嘅原則,講緊以下呢點[4]

「如果有多個解釋,一樣咁解釋到研究緊嘅現象,應該揀最簡單嗰個解釋。」

科學上用統計學或者機器學習方法建立理論模型嗰陣,奧坎剃刀可以理解為:

「如果兩個統計模型解釋起數據上嚟表現差唔多,就應該揀參數較少(結構較簡單)嗰個模型。」

噉做有好多好處,譬如係模型較易理解、計起數上嚟較快、而且冇咁易出現過適嘅情況。簡單但有效嘅模型喺實踐中非常有價值,而參數數量好多時都係衡量模型簡單程度嘅關鍵因素。

睇埋

[編輯]

註釋

[編輯]
  1. 預測:單靠迴歸模型唔能夠確立因果關係,因為 x 可以預測 y 並唔表示 x 能夠引致 y 改變。可以睇睇相關唔蘊含因果嘅問題。

引述

[編輯]
  1. Data, C. E., & Using Descriptive Statistics Bartz, A. E. (1988). Basic statistical concepts. New York: Macmillan. Devore, J., and Peck.
  2. Seber, G. A., & Lee, A. J. (2012). Linear regression analysis (Vol. 329). John Wiley & Sons.
  3. YangJing Long (2009). "Human age estimation by metric learning for regression problems". Proc. International Conference on Computer Analysis of Images and Patterns: 74–82.
  4. Walsh, D. (1979). Occam's razor: A principle of intellectual elegance. American Philosophical Quarterly, 16(3), 241-244.