關聯規則學習

出自維基百科,自由嘅百科全書

關聯規則學習英文association rule learning)係一種機械學習做法,能夠攞一拃離散變數input,計完數之後畀出一拃 output 反映啲變數嘅唔同結果之間會點樣「共同發生」。

基本定義[編輯]

關聯規則可以理解為一啲「如果... 就...」法則,描繪數據當中啲變數之間有乜關係。

應用例子[編輯]

喺廿一世紀初嘅香港影到嘅一籃生果;事實表明,啲人買咗一種生果,好多時都會買埋其他幾種生果嚟送禮。

關聯規則喺營銷上可以好使好用:想像而家一間超市做好晒紀錄,記低晒每個客人買咗乜嘢(數據),佢哋可以叫電腦搵出呢啲數據入便有嘅關聯規則,得知:

  • 「如果一個客人買咗麵包,佢九成會買埋牛油。」
  • 「如果一個客人買咗泡菜,佢七成會買埋白米。」
  • 「如果一個客人買咗牙刷,佢八成會買埋牙膏。」
  • 數學符號表達:(關聯規則分析出嘅嘢),當中 X Y Z 當中每一個都係「有冇買呢件呢件產品」。

有咗呢啲資訊,做市場研究嘅人就可以預測客人嘅行為[1][2],再用各種手法圖利。例如而家知道咗客人成日會同時買 X 同 Y 呢兩種貨品,賣方可以特登將 X 同 Y 擺喺同一貨架上便(方便客人一嘢攞晒兩樣貨),又可以做減價嗰陣淨係同 X 或者 Y 其中一樣做減價,又或者暗中將啲賣 X 嘅廣告 show 畀買咗 Y 嘅客睇... 等等[3]

R 做法[編輯]

喺 2020 年代初,R 程式語言函式庫支援人做關聯規則分析[2]

引咗[編輯]

  1. Kumbhare, T. A., & Chobe, S. V. (2014). An overview of association rule mining algorithms. International Journal of Computer Science and Information Technologies, 5(1), 927-930. "The performance of FP-growth is better than all other algorithms."
  2. 2.0 2.1 (英文) 簡介點樣用 R 程式語言嚟做關聯規則探勘,講到關聯規則探勘當中嘅 support-confidence-lift 三大指標。
  3. Ng, A., & Soo, K. (2017). Numsense! Data Science for the Layman. Annalyn Ng and Kenneth Soo.