K-中點

出自維基百科,自由嘅百科全書
(由中點周邊分區跳轉過嚟)

K-中點係一系列同 K-平均聚類法相似嘅聚類分析演算法

中點周邊分區[編輯]

中點周邊分區(Partitioning Around Medoids,PAM)係種同 K-平均聚類法好似嘅做法,最基本如下[1][2]

  1. BUILD:首先,段演算法揀一點做中點(medoid),揀嘅原則係揀成本(cost;可以用同其他所有點之間嘅總距離)最低嗰點;
  2. 重複:揀成本最低嗰點出嚟做中點,直至揀咗 點出嚟為止;
  3. 將每點唔屬中點嘅點,掕落離佢最近嗰粒中點度;
  4. SWAP:如果能夠令成本下降,一路做
    • Foreach 中點 ,foreach 喺佢個聚類內嘅非中點
      • 考慮將 掉換,計吓兩者掉換咗嘅話成本會點變;
      • 如果場掉換係目前最好(最能夠令成本跌)嘅,記住呢場掉換;
    • 如果做出最好嗰場 掉換會令成本跌,就郁手做;否則段演算法就算行完(converged)。

PAM 唔少人用(下圖係 gif 圖解),而且好多做統計相關工作嘅人都鍾意「PAM 冇乜隨機性」呢一樣嘢,不過 PAM 又畀人詬病話佢計得慢-PAM 要係噉計「呢點呢點同其他所有點之間嘅距離嘅總和」[2]

PAM 嘅 gif 圖解,'"`UNIQ--postMath-00000009-QINU`"'
PAM 嘅 gif 圖解,

睇埋[編輯]

參考資料[編輯]

  1. Kaufman, Leonard; Rousseeuw, Peter J. (1990-03-08). "Partitioning Around Medoids (Program PAM)". Finding Groups in Data: An Introduction to Cluster Analysis. Wiley Series in Probability and Statistics. Hoboken, NJ, USA: John Wiley & Sons, Inc. pp. 68-125. doi:10.1002/9780470316801.ch2.
  2. 2.0 2.1 Helm, Martin (2021-08-20). "A deep dive into partitioning around medoids". Towards Data Science. 喺2022年9月26號搵到.