跳去內容

ROUGE (評估準則)

出自維基百科,自由嘅百科全書

ROUGERecall-Oriented Understudy for Gisting Evaluation)係自然語言處理上一類做法,用嚟評估一段自動總結或者機翻演算法「有幾好」。

諗頭

[編輯]

ROUGE 嘅基本諗頭係,人工智能最想做嘅嘢就係教電腦模仿噉嘅智能,所以如果話一段 AI 演算法掂,即係等同話佢展現到同人類專家一樣噉嘅表現;噉講即係話,研究者會去[1]

  • 搵一拃由受過訓嘅人類,叫佢哋人手同拃文件做總結;
  • 用自己設計嘅自動總結演算法同同一拃文件做總結;
  • 比較人類專家做嘅總結同段演算法做嘅總結;
  • 兩者愈相似,就愈表示段演算法掂。

睇埋

[編輯]

[編輯]
  1. Lin, C. Y. (2004, July). Rouge: A package for automatic evaluation of summaries (PDF). In Text summarization branches out (pp. 74-81).