跳去內容

Truecasing

出自維基百科,自由嘅百科全書

Truecasing粵拼tru1 kei1 sing4)係對某啲文字自然語言處理做嘅一種工序,指「攞一串文字做 inputoutput 俾出串文字『適當噉大階化咗』嘅樣」。例如[1]

  • my name is john.(「我個名叫阿莊」)呢句嘢做 input;
  • Output 要係 My name is John.英文入面句子最頭嗰個字母要大階,人名最頭字母都係要大階;

Truecasing 呢樣嘢淨係某啲語文嘅自然語言處理先會用到。例如粵文中文日文等嘅文字冇大細階呢家嘢,所以唔需要 truecasing。

睇埋

[編輯]

[編輯]
  1. Lita, L. V.; Ittycheriah, A.; Roukos, S.; Kambhatla, N. (2003). "tRuEcasIng". Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics. Sapporo, Japan. pp. 152-159.