Tf-idf

出自維基百科,自由嘅百科全書

Tf-idf(全名 Term Frequency-Inverse Document Frequency)喺資訊提取上泛指一啲反映隻「喺份文件入面有幾重要」嘅數值。

一隻字嘅 term frequency 係隻字喺份文件入面出現咗幾多次除以份文件嘅總字數

睇埋[編輯]

文獻[編輯]

  • Salton, G., & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information processing & management, 24(5), 513-523.