文件詞彙矩陣

出自維基百科,自由嘅百科全書

文件詞彙矩陣英文document-term matrix)係自然語言處理上會用到嘅一種矩陣。喺一個文件詞彙矩陣,每行打戙行表示應付緊嘅其中一份文件,而每行打橫行表示一個詞彙,個矩陣每格入面嗰個數表示對應嗰個詞彙喺對應嗰份文件入面嘅「重要性」。

睇埋[編輯]