ID3

出自維基百科,自由嘅百科全書
跳去導覽 跳去搵嘢

ID3(全名係 Iterative Dichotomiser 3)係機械學習上一種用嚟建構決策樹演算法虛擬碼如下[1][2]

計吓成個數據庫嘅 information entropy訊息熵簡單啲講就係指柞數據有幾接近完全隨機

For 每一個用嚟做預測嘅變數
    計吓用咗佢分類之後嘅總 entropy
    計吓用咗佢分類之後嘅總 entropy 同成個數據庫嘅 entropy 差幾多information gain

 information gain 最高嗰個變數嚟分類

For 每一個分咗嘅類用嗰個類內嘅個案做數據庫做多次上述嘅過程直至用嗮所有用嚟做預測嘅變數或者到咗指定嘅分枝數上限為止

睇埋[編輯]

[編輯]