跳去內容

字詞

出自維基百科,自由嘅百科全書
  提示:呢篇文講嘅唔係文字字 (搞清楚)

字詞語言學上睇成語言基本單位,呢個出自西方概念。一般話,單位句中獨自咁用,意思亦拆無可拆。西洋對字詞,並無具體定義,語言學界時有爭詏。簡單來講,字詞由兩部份組成,音素形態素

唐話就有唔同,字詞有更基本單位,叫大清傳入西洋概念,亦叫西洋基本單位做字。好似香港叫英文字詞咁,會話佢英文字馬建忠學過拉丁文,學過佢文法,寫咗本文通,裏面基本單位一律叫字,好似名字[1]、代字、動字[2]、靜字[3]、狀字[4]咁。由於西洋字同唐字概念上唔同,有時要表達清楚。西洋用法,介乎唐話字同之間,就叫字詞。另外,語亦類似,好似成語咁,因而合叫詞語。有時就咁叫,而日本就叫

人非機械,語言本身模模糊糊[5],或者人本身睇世界就模模糊糊[6],唔似數學咁界限分明。而字詞都一樣會咁。字詞定義,任得人由唔同角度入手,有人用聲,有人用寫,有人用語法,或者其他都有,大家唔見得一樣。同埋,文法語法不過人為概括分野,相當主觀,各專家都有佢自己一套。人類並無世界通行語法[7],字詞定義就算有共通,種種語言內涵都有自己一套。

唐話就算叫字詞,查實可再拆成字,好似雪糕咁,拆得做來睇。上海舊時有例,三星白蘭地,都可以對出五月黃梅天[8]白蘭地個字詞,喺某啲語言論述,話唔可以拆成字,但實情無法咗止人會拆出來睇,人靈活過文法理論。咁可以睇出,就算現今詞典叫詞,並唔符合西方對字詞概念,因為再拆得開。英文都有類似困惑,好似ice-cream咁。

另一端,字詞可以長好。好似毛里族有個地名,喺紐西蘭,英文記錄,要八十五個英文字母,Taumata­whakatangihanga­koauau­o­tamatea­turi­pukaka­piki­maunga­horo­nuku­pokai­whenua­ki­tana­tahu。大概意思,呢個山頂,有男人叫他馬地亞,有雙大膝頭,識爬山又識滑落山,行到邊就佔地,會吹笛畀心愛嘅人。英文都有長字,pneumonoultramicroscopicsilicovolcanoconiosis,意思火山肺矽病,新字詞任人砌,就算裏面包含一串意思。又好似香港金鐘道,英文Queensway,若照正統文法,應該寫Queen's Way,但現實就寫Queensway成一字,英國倫敦有同例[9][10]。字詞隨人意組合,點為字詞,亦好隨意。

後面會講一西洋概念,大多數都用西歐語言描寫出來。留意呢啲並非世界通法,有啲就算描述類似,內涵可以唔同。

自大清以來,好多唐人文法家想用西法治唐話,不過由於特性唔同,有時會變到好複雜,甚至搞錯方向[11]。西方語言學家,就算有心為種種語言定義字詞,亦遇到唔合適情況,因而創造出音素、形態素等等,企圖解決呢個問題,仍然難以一概而論。

[編輯]

叫法有好多。後面列出一啲叫法。

  • 字詞。讀粵拼zi6 ci4
  • 詞語
  • 單字
  • 單詞
  • 單語

英文叫做word

概論

[編輯]
睇埋:構詞

「字詞」呢個概念喺語言學上要點樣定義,查實係有些少爭議性;字詞嘅一個常見定義係指「包含最少一個形態素(睇返上面)、可以單獨噉存在嘅語言單位」,例如上面提到嘅 re- 就係一個形態素但唔係一隻字,因為佢喺正常講嘢當中唔可以單獨噉存在;正路嚟講,一隻字詞會有以下呢啲特徵-

  1. 係對答嗰陣嘅最短可能答覆;
  2. 係「要再變長啲有難度」嘅單位當中係最大嘅;
  3. 如果一句句子要變,一隻字詞係「能夠郁動,同時郁咗又唔會搞到句句子唔啱文法」嘅最細單位;

... 呀噉[12]

亦都要留意,語言學上嘅(可以指講嘢或者寫嘢嗰陣嘅一隻隻字詞)同文字man4 zi6(攞嚟寫嘢嗰啲)係兩個好唔同嘅概念,不過兩者喺粵文入面個名好似。

定義

[編輯]

自從語言學研究開始以嚟,啲人已經嘗試咗好多唔同嘅方法去定義詞語係乜嘢,用咗好多唔同嘅標準。[13] 不過,到而家都未搵到一個令人滿意嘅定義,可以適用於所有語言同埋所有層次嘅語言分析。但係,喺唔同嘅描述層次度搵到一致嘅「詞語」定義係有可能嘅。[14] 呢啲定義包括喺語音音韻層次嘅定義,即係佢係可以通過詞語重音同埋邊界標記喺理論上分離出嚟嘅最細聲音片段;喺正字層次嘅定義,即係書寫或者印刷入面用空格表示嘅片段;喺形態學嘅基礎上,佢係語法範式嘅基本元素,例如屈折變化,同詞形唔同;喺語義學入面,佢係詞彙入面最細同埋相對獨立嘅意義載體;同埋句法上,佢係句子入面最細嘅可置換同可替換單位。[15]

喺一啲語言入面,呢啲唔同類型嘅詞語係一致嘅,而且可以分析,例如,「音韻詞」基本上同「語法詞」係一樣嘅。但係,喺其他語言入面,佢哋可能對應唔同大小嘅元素。[14] 好多困難都係源於歐洲中心嘅偏見,因為嚟自歐洲以外嘅語言可能唔符合歐洲學者嘅直覺。一啲為「詞語」而開發嘅標準可能只適用於廣泛嘅歐洲綜合結構語言。[14] 由於呢個唔清晰嘅狀態,一啲語言學家建議完全避免用「詞語」呢個術語,而係專注喺定義得更好嘅術語,例如語素[16]

字典會將一種語言嘅詞彙表分類成獨立列出嘅形式,叫做詞元。呢啲可以俾人當做係嗰種語言嘅作者認為係「詞語」嘅嘢嘅指標。一個詞語嘅呢種書寫形式構成咗一個詞素[15] 衡量詞語長度最合適嘅方法係通過計佢嘅音節或者語素嘅數量。[17] 當一個詞語有多個定義或者多個意思嘅時候,可能會喺辯論或者討論入面引起混淆。[18]

音韻學

[編輯]

術語「詞語」嘅一個可以區分嘅意思可以喺音韻學嘅基礎上定義。佢係一個大過或者等於一個音節嘅單位,可以根據音段或者韻律特徵,或者通過佢同音韻規則嘅相互作用嚟區分。喺沃爾瑪賈里語,一種澳洲語言,詞根或者後綴可能只有一個音節,但係一個音韻詞一定要至少有兩個音節。一個雙音節動詞詞根可以唔加後綴,例如 luwa-ø '打!',但係一個單音節詞根一定要加後綴,例如 ya-nta '去!',因此符合沃爾瑪賈里語詞語嘅音段模式。喺瓦蒂語皮詹賈賈拉方言入面,另一種嚟自澳洲嘅語言,一個詞語中間嘅音節可以以輔音結尾,但係一個詞語結尾嘅音節一定要以元音結尾。[14]

喺大多數語言入面,重音可以作為音韻詞嘅一個標準。喺有固定重音嘅語言入面,有可能從重音嘅位置確定詞語邊界。雖然喺有音位重音嘅語言入面,單單從重音係唔可能預測詞語邊界嘅,但係每個詞語都會得一個音節有主要重音,噉樣就可以確定一句說話入面嘅詞語總數。[14]

好多音韻規則都只係喺一個音韻詞入面運作,或者特別係跨越詞語邊界運作。喺匈牙利文入面,齒音輔音 /d/、/t/、/l/ 或者 /n/ 會同後面嘅半元音 /j/ 同化,產生相應嘅顎音,但係只會喺一個詞語入面發生。相反,外部連音規則會跨越詞語邊界起作用。呢個規則嘅原型例子嚟自梵文;不過,現代凱爾特語族入面嘅詞首輔音變化,或者一啲非R音性英文方言入面嘅 連接R音 現象,都可以用嚟說明詞語邊界。[14]

通常情況下,一個音韻詞唔會對應我哋對詞語嘅直覺概念。芬蘭文複合詞 pääkaupunki '首都' 在音韻上係兩個詞語(pää '頭' 同埋 kaupunki '城市'),因為佢唔符合芬蘭文詞語入面嘅元音和諧模式。相反,一個單一嘅音韻詞可能由多個句法元素組成,例如喺英文短語 I'll come 入面,I'll 形成一個音韻詞。[19]

詞素

[編輯]

一個詞語可以俾人諗成係講嘢嘅人嘅內部詞彙表入面嘅一個項目;呢個叫做詞素。不過,呢個可能同日常用語入面「詞語」嘅意思唔同,因為一個詞素包括所有屈折形式。詞素 teapot 指嘅係單數嘅 teapot 同埋複數嘅 teapots。重有一個問題係,屈折或者複合詞語應該喺幾大程度上俾包括喺詞素入面,尤其係喺黏著語入面。例如,喺土耳其文入面,house 嘅詞素應該包括主格單數嘅 ev 同埋複數嘅 evler,呢個係冇乜疑問嘅。但係,佢係咪都應該包括 evlerinizden「從你哋嘅屋企」,通過規則嘅後綴形成嘅,就唔清楚喇。重有啲詞素,例如 "black and white" 或者 "do-it-yourself",雖然由多個詞語組成,但係仍然形成一個具有固定意思嘅單一搭配。[19]

文法

[編輯]

有人提出,語法詞語由多個語法元素組成,呢啲元素以固定嘅順序一齊出現(唔係喺子句入面嘅唔同位置),並且具有固定嘅意思。但係,所有呢啲標準都有例外。[14]

單一嘅語法詞語具有固定嘅內部結構;當結構改變嘅時候,詞語嘅意思都會改變。喺迪爾巴爾語入面,佢可以用好多派生詞綴喺佢嘅名詞上面,有表示雙數嘅後綴 -jarran 同埋表示「另一個」嘅後綴 -gabun。對於名詞 yibi,佢哋可以排列成 yibi-jarran-gabun (「另外兩個女人」)或者 yibi-gabun-jarran (「另外兩個女人」),但係改變後綴順序都會改變佢哋嘅意思。一種語言嘅使用者通常都會將特定嘅意思同一個詞語聯繫埋一齊,而唔係單一個語素。例如,當俾人要求講下「不真實」嘅時候,佢哋好少會專注喺語素嘅意思,例如 -th 或者 -ness[14]

語義學

[編輯]

Leonard Bloomfield 喺 1928 年引入咗「最小自由形式」嘅概念。詞語俾人認為係言語入面最細嘅有意義單位,可以獨立存在。[20]:11 呢個將音素(聲音單位)同詞素(意義單位)聯繫起嚟。但係,一啲書寫詞語唔係最小自由形式,因為佢哋本身冇意義(例如,theof)。[21]:77 一啲語義學家提出咗所謂嘅語義基元或者語義素理論,唔可定義嘅詞語代表直觀上有意義嘅基本概念。根據呢個理論,語義素作為描述其他詞語嘅意義同埋佢哋相關嘅概念外延嘅基礎,冇循環論證。 [22][23]

特徵

[編輯]

簡約主義理論句法學學派入面,詞語(喺文獻入面都叫做「詞彙項目」)俾人理解為語言特徵嘅「捆綁」,呢啲特徵結合成為一個具有形式同意義嘅結構。[24]:36-37 例如,詞語 "koalas" 有語義特徵(佢表示現實世界嘅物體,樹熊)、範疇特徵(佢係一個名詞)、特徵(佢係複數,而且喺佢嘅領域入面一定要同動詞、代詞同埋指示詞一致)、音韻特徵(佢嘅發音方式係特定嘅),等等。

正字法

[編輯]
由字母組成嘅詞語,用空格分隔

喺有文學傳統嘅語言入面,乜嘢俾人認為係單一個詞語嘅問題受到正字法嘅影響。詞語分隔符,通常係空格同埋標點符號,喺使用字母文字嘅語言嘅現代正字法入面好常見,但係呢啲喺文字史入面係一個相對現代嘅發展。喺字元編碼入面,詞語分割取決於邊啲字元俾定義為詞語分隔符。喺英文正字法入面,複合表達式可能包含空格。例如,ice creamair raid shelter 同埋 get up 通常俾人認為係由多過一個詞語組成嘅(因為每個組成部分都係自由形式,可能 get 除外),no one 都係,但係相似嘅複合詞 someonenobody 就俾人認為係單一詞語。

有時,喺文法上接近嘅語言會用唔同嘅方式看待相同嘅詞序。例如,法文不定式入面嘅反身動詞同佢哋各自嘅小品詞係分開嘅,例如 se laver (「洗自己」),而喺葡萄牙文入面,佢哋係用連字符連接嘅,例如 lavar-se,喺西班牙文入面,佢哋係連接埋一齊嘅,例如 lavarse[a]

唔係所有語言都明確噉劃分詞語。現代標準漢語係一種高度分析語,屈折詞綴好少,令到喺正字法上劃分詞語變得冇必要。但係,喺現代標準漢語入面有好多多語素複合詞,以及各種各樣嘅黏著語素,令到清晰噉確定乜嘢構成一個詞語變得困難。[25]:56 日文使用正字法提示嚟劃分詞語,例如喺漢字(借用自中文嘅文字)同埋兩種假名音節文字之間切換。呢個係一個相當寬鬆嘅規則,因為實詞都可以用平假名嚟寫,以達到效果,但係如果大量噉做,通常會添加空格嚟保持易讀性。越南文正字法,雖然使用拉丁字母,但係劃分嘅係單音節語素,而唔係詞語。

詞語邊界

[編輯]

定義乜嘢構成一個詞語嘅任務包括確定一個詞語喺邊度結束,另一個詞語喺邊度開始。有幾種方法可以用嚟識別語音入面存在嘅詞語邊界:[13]

潛在停頓:俾講嘢嘅人重複一個俾定嘅句子,慢慢噉講,容許停頓。講嘢嘅人會傾向於喺詞語邊界插入停頓。但係,呢個方法唔係萬無一失嘅:講嘢嘅人好容易會將多音節詞語分開,或者未能分開兩個或者更多緊密連接嘅詞語(例如,喺 "He went to a house" 入面嘅 "to a")。

不可分割性:俾講嘢嘅人大聲噉講一個句子,然後俾人要求再次講呢個句子,但係要添加額外嘅詞語。因此,「我喺呢個村莊住咗十年。」可能會變成「我屋企人同我喺呢個細村莊大約住咗十年左右。」呢啲額外嘅詞語會傾向於喺原始句子嘅詞語邊界添加。但係,一啲語言有中綴,佢哋會俾放喺詞根入面。同樣噉,一啲語言有可分離詞綴:喺德文句子 Ich komme gut zu Hause an 入面,動詞 ankommen 係分開嘅。

語音邊界:一啲語言有特定嘅發音規則,令到容易搵到詞語邊界應該喺邊度。例如,喺一種有規律噉重讀一個詞語嘅最後一個音節嘅語言入面,詞語邊界好有可能會喺每個重讀音節之後出現。另一個例子可以喺一種有元音和諧嘅語言入面睇到(好似土耳其文):[26]:9 一個俾定嘅詞語入面嘅元音會共享相同嘅音質,所以每當元音音質改變嘅時候,好有可能會出現詞語邊界。儘管如此,唔係所有語言都有噉樣方便嘅語音規則,即使有嘅語言都會有啲例外情況。

正字法邊界:詞語分隔符,例如空格同埋標點符號可以用嚟區分單一詞語。但係,呢個取決於特定嘅語言。東亞書寫系統通常唔會分隔佢哋嘅字元。漢字日文(佢哋用表意文字字元),以及泰文老撾文(佢哋係元音附標文字)都係噉樣。

睇埋

[編輯]

參攷

[編輯]
  1. 氏文通 : 實字卷之二 - 中國哲學書電子化計劃ctext.org (臺灣中文)。喺2025-06-29搵到
  2. 氏文通 : 實字卷之四 - 中國哲學書電子化計劃ctext.org (臺灣中文)。喺2025-06-29搵到
  3. 氏文通 : 實字卷之三 - 中國哲學書電子化計劃ctext.org (臺灣中文)。喺2025-06-29搵到
  4. 氏文通 : 實字卷之六 - 中國哲學書電子化計劃ctext.org (臺灣中文)。喺2025-06-29搵到
  5. 林華東。合與創造:語言模糊性闡釋 (PDF){{cite web}}: CS1 maint: url-status (link)
  6. Barton L. Lipman (November 2009). "Why is Language Vague?" (PDF). Boston University.{{cite web}}: CS1 maint: url-status (link)
  7. McCrum, Robert (2012-03-25). "Daniel Everett: 'There is no such thing as universal grammar'". The Guardian (英國英文). ISSN 0261-3077. 喺2025-06-29搵到.
  8. 港電台網站 e-Learning:一分鐘閱讀app7.rthk.hk。喺2025-06-29搵到
  9. "What's the hot news happening in Queensway W2?". audleysinternational.com (美國英文). 2022-10-24. 喺2025-06-29搵到.
  10. "Queensway | Labyrinth". Labyrinth |. 2013-07-05. 原著喺2025-03-22歸檔. 喺2025-06-29搵到.
  11. 思泉 (庚申驚蟄)。文的主詞 (PDF) {{cite web}}: Check date values in: |date= (help)CS1 maint: url-status (link)
  12. What is a Word?. GLOSSARY OF LINGUISTIC TERMS.
  13. 13.0 13.1 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Haspelmath2011嘅參照
  14. 14.0 14.1 14.2 14.3 14.4 14.5 14.6 14.7 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做WACLT嘅參照
  15. 15.0 15.1 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做RDLL嘅參照
  16. Harris, Zellig S. (1946). "From morpheme to utterance". Language. 22 (3): 161–183. doi:10.2307/410205. JSTOR 410205.
  17. John R. Taylor, 編 (2015). The Oxford handbook of the word (第1版). Oxford, United Kingdom: Oxford University Press. ISBN 978-0-19-175669-6. OCLC 945582776.
  18. Chodorow, Martin S.; Byrd, Roy J.; Heidorn, George E. (1985). "Extracting semantic hierarchies from a large on-line dictionary". Proceedings of the 23rd Annual Meeting on Association for Computational Linguistics (英文). Chicago, Illinois: Association for Computational Linguistics: 299–304. doi:10.3115/981210.981247. S2CID 657749.
  19. 19.0 19.1 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Brown2005嘅參照
  20. Katamba, Francis (2005). English words: structure, history, usage (第2版). London: Routledge. ISBN 0-415-29892-X. OCLC 54001244.
  21. Fleming, Michael; Hardman, Frank; Stevens, David; Williamson, John (2003-09-02). Meeting the Standards in Secondary English (英文) (第1版). Routledge. doi:10.4324/9780203165553. ISBN 978-1-134-56851-2.
  22. Wierzbicka, Anna (1996). Semantics : primes and universals. Oxford [England]: Oxford University Press. ISBN 0-19-870002-4. OCLC 33012927.
  23. "The search for the shared semantic core of all languages.". Meaning and universal grammar. Volume II: theory and empirical findings. Cliff Goddard, Anna Wierzbicka. Amsterdam: John Benjamins Pub. Co. 2002. ISBN 1-58811-264-0. OCLC 752499720.{{cite book}}: CS1 maint: others (link)
  24. Adger, David (2003). Core syntax: a minimalist approach. Oxford: Oxford University Press. ISBN 0-19-924370-0. OCLC 50768042.
  25. An introduction to language and linguistics. Ralph W. Fasold, Jeff Connor-Linton. Cambridge, UK: Cambridge University Press. 2006. ISBN 978-0-521-84768-1. OCLC 62532880.{{cite book}}: CS1 maint: others (link)
  26. Bauer, Laurie (1983). English word-formation. Cambridge [Cambridgeshire]. ISBN 0-521-24167-7. OCLC 8728300.


引用錯誤 <ref> tags exist for a group named "lower-alpha", but no corresponding <references group="lower-alpha"/> tag was found