語料庫語言學

出自維基百科,自由嘅百科全書
跳去導覽 跳去搵嘢

語料庫語言學英文Corpus linguistics)泛指靠語料庫嚟做嘅語言學研究,係語言學嘅重要一環[1]:語言學定義上就係研究語言,而要研究一樣嘢,就實要攞大量屬嗰個類嘅事物嚟做樣本-語料庫正正就能夠提供大量嘅語言材料,而語言學家攞住一隻語言嘅語料,就可以分析(例如)嗰隻語言嘅文法[2]

[編輯]

  1. Sinclair, J. 'The automatic analysis of corpora', in Svartvik, J. (ed.) Directions in Corpus Linguistics (Proceedings of Nobel Symposium 82). Berlin: Mouton de Gruyter. (1992).
  2. Gudkov, V., Mitrofanova, O., & Filippskikh, E. (2020). Automatically ranked Russian paraphrase corpus for text generation. arXiv preprint arXiv:2006.09719.