跳去內容

計量語言學

出自維基百科,自由嘅百科全書

計量語言學(參見英文quantitative linguistics)係語言學下嘅學科,專運用數學化嘅方法(例如電腦模擬統計學)研究語言

定位

[編輯]

定律

[編輯]
  • 揳夫簡潔定律:語言學上一條定律;根據呢條定律[1],一隻詞語喺隻語言入面出現得愈密,隻詞就傾向愈短[註 1]
  • 協氏定律:語言學上一條靠實證[註 2]得出嘅定律;根據協氏定律,以下呢條式實會成立[2]
    ,當中
    • 指一份 隻詞咁長嘅文件入面有幾多隻唔同款嘅詞-am am 係兩隻同款嘅詞,I am 係兩隻唔同款嘅詞, 係某啲參數,數值視乎語言而定。喺英文入面, 數值通常會係 10 至 100,而 數值係 0.4 至 0.6(睇附圖)。

註釋

[編輯]
  1. 技術性啲噉講,即係話是但攞隻語言嚟睇,每一隻詞嘅「長度」同「出現頻率」呢兩個變數會成負相關
  2. 即係話語言學家都唔肯定點解會有噉嘅現象,但總之實際睇數據嗰陣就係睇到噉嘅規律。

引咗

[編輯]
  1. Bentz C., Ferrer-i-Cancho R. (2016). Zipf's Law of abbreviation as a language universal. Universitätsbibliothek Tübingen.
  2. Heaps, Harold Stanley (1978), Information Retrieval: Computational and Theoretical Aspects, Academic Press. Heaps' law is proposed in Section 7.5 (pp. 206-208).