文字

文字(粵拼:man4 zi6)就係符號嘅一種,用嚟表示概念、記綠口語、事、物,用作人同人溝通嘅一種媒介。最早嘅書寫係喺公元前四千年尾嗰陣發明嘅。喺歷史上,每一種冇任何寫字知識底下發明出嚟嘅書寫系統,都係由包含少量原始書寫嘅表意字慢慢演變而成,而嗰啲表意字未能完全編碼口語,亦冇能力表達廣泛嘅各種諗法。
書寫系統通常會根據其符號(叫做「字素」)同語言單位嘅關係嚟分類。表音書寫系統(包括字母同音節文字)用嘅字素,係同相應口語入面嘅聲音對應。字母用嘅字素叫做「字母」(原本係字母),通常係同音位對應,並一般分成三類。一般嚟講,純字母制係用字母嚟代表輔音同母音嘅聲音;而阿布賈得(原本係abjad)只用字母代表輔音;阿布吉達(原本係abugida)則係用字符表示輔音同母音嘅組合。音節文字會用嘅字素叫做「音節符號」(原本係syllabogram),代表成個音節或者莫拉(原本係moras)。相反,表意文字(或者又叫形態表意,原本係logographic,alternatively morphographic)嘅書寫系統係用字素代表語言入面嘅意思單位,好似詞語或者語素。字母通常用嘅獨特符號細過一百,而音節文字同表意文字可能分別用到幾百或幾千個符號。
一個書寫系統亦包括任何用嚟幫助讀者同編碼額外意思嘅標點符號,包括喺口語中透過節奏、聲調、音高、口音、詞尾變化或者語調所傳達嘅信息。
背景:同語言嘅關係
[編輯]
根據大部分當代定義,書寫係一種用視覺同觸覺表達語言嘅記號。所以,一個社群使用書寫,預設佢哋對語言結構進行咗一定程度嘅分析。[1] 書寫入面用嘅符號,有系統咁對應住口語或者手語嘅功能單位。呢個定義排除咗一大類其他記號,例如圖畫同地圖。[a][3] 文本係指任何書寫材料嘅實例,包括口語內容嘅轉錄。[4] 撰寫同記錄文本嘅行為叫做「書寫」,[5]而閱讀同解釋文本嘅行為就叫做「閱讀」。[6]
書寫同語言之間更廣泛嘅關係,早喺亞里士多德(公元前384–322年)嗰陣,就已經成為哲學探討嘅題目。[7] 雖然語言喺全世界普及,但書寫就唔係;書寫係較遲出現,而且歷史上淨係喺好少地方獨立發明出嚟。雖然大部分口語都未被書寫,但所有書寫語言都係建立喺原有嘅口語上。[8] 當以手語做母語嘅人閱讀同口語相關嘅書寫時,就形成咗對第二種後天習得語言嘅識讀能力。[b][9] 一種語言(例如印地語)可以用唔同嘅書寫系統書寫,而一個書寫系統亦可以代表唔同嘅語言。例如,漢字曾經用嚟書寫整個漢字圈入面嘅唔同語言——包括至少由13世紀開始用嘅越南語,直到20世紀畀基於拉丁字母嘅越南字母取代。Template:Sfnmp
喺現代語言學成為科學學科嘅最初幾十年,語言學家通常將書寫視為淨係用嚟記錄口語嘅技術——因為口語獨特嘅潛能被視為至關重要,有助於深入了解人類認知。[10]
一般術語
[編輯]
雖然研究書寫系統嘅學者通常會用一啲核心術語,但具體定義同解釋可能因作者而異,通常取決於所採用嘅理論方法。[11] 一個字素係書寫系統入面最基本嘅功能單位。一般嚟講,字素係最細嘅有意思元素,合埋一齊就構成咗文本可建立嘅記號集合。Template:Sfnmp 所有書寫系統都需要一套已定義嘅字素,統稱為「文字」。[12] 字素嘅概念同用嚟研究口語嘅音位概念好相似。同樣,因為好多聲音上明顯唔同嘅音位單位(原本係phones)可能因講者、方言同語境而發揮相同嘅音位功能,好多外觀上明顯唔同嘅字形(或稱「graphs」)都可以被視為同一個字素。呢啲唔同嘅同形字就叫做一個字素嘅變體:例如,細寫字母Template:Gpm可以用雙層嘅Template:Gph或者單層嘅Template:Gph嚟表示,[13]或者用草書、楷書或者印刷體等其他形式。揀用邊個變體,可能受所用媒介、書寫工具、寫字人嘅風格、文本入面前後嘅字素、得閒寫字嘅時間、預期讀者,同埋個人書寫嘅無意識特徵影響。正字法(原文係直譯 「correct writing」)係指一個社群共同使用嘅書寫規則同慣例,包括字素嘅排列同彼此之間嘅關係。特別係對字母嚟講,正字法亦包括拼寫嘅概念。例如,英文正字法包括拉丁字母入面26個字母嘅大寫同細寫形式(嗰啲字素對應住各種唔同嘅音位)、標點符號(大部分都冇表音功能),同其他記號,例如數字。如果一個書寫系統能夠表達出口語入面所有可以講嘅內容,就可以視為完整;反之,一個部分嘅書寫系統就無法完整表達口語。[14]
依基本語言單位分類
[編輯]
書寫系統最常見係根據佢哋嘅字符同語言單位嘅對應關係嚟分類。書寫系統最基本可以分做表音文字(即係「寫聲」)同表意文字(即係「寫形」)兩種。前者啲字符係表示語言入面嘅聲音單位,後者啲字符就表示意義單位(好似詞同語素咁)。有啲學者仲會用「表詞文字」呢個舊啲嘅詞,意思可能同表意文字一樣,又或者專門形容以詞為基本書寫單位嘅系統。近年嘅學術界偏向用「表意文字」多過「表詞文字」,因為後者可能會令人誤解—主要係因為啲系統通常係以語素為單位,唔係以詞為單位。
好多分類都會將書寫系統分做三大類,而表音文字就再細分做音節文字同字母文字(又叫「分段文字」)。音節文字用音節符號嚟表示音節或者拍。字母文字就用字母嚟對應發音(更準確啲講係對應音位)。字母文字通常分做三種:輔音字母文字淨係得輔音字母,純字母文字有齊輔音同元音字母,而字母音節文字就用字符嚟表示輔音同元音嘅組合。大衛·迪林格提出咗一個五重分類系統,包括象形文字、表意文字、分析過渡文字、語音文字同字母文字。
實際上,書寫系統係根據主要使用嘅符號類型嚟分類,同時都會包括一啲符號運作方式唔同嘅特例。譬如喺英文呢種表音文字入面,都有表意字符,好似連字符號Template:Gpm同數字Template:Gpm、Template:Gpm等—呢啲符號對應特定嘅詞(「and」、「zero」、「one」等),而唔係對應佢哋嘅發音。大部分書寫系統都可以話係混合系統,即係兼有表音同表意嘅特徵。
表詞文字系統
[編輯]表詞字係一個表示語言入面語素嘅字符。而家仲喺使用緊嘅主要表詞文字系統就係漢字:佢歷史上用嚟書寫漢語嘅唔同變體,仲有日語、韓語、越南語同埋其他漢字文化圈嘅語言。由於每個字符都代表一個意義單位,所以要寫晒一種語言所有嘅詞就需要幾千個字符。如果啲表詞字唔足以表達晒所有意思同詞,寫出嚟嘅文字就可能會令讀者覺得含糊或者唔明。
表詞字有時會同表意字混淆,即係圖像化表示抽象概念嘅符號。大部分語言學家而家都反對呢種睇法:漢字通常係形聲字,即係包含一個同字義有關嘅部件,同埋一個提示發音嘅部件。
音節文字
[編輯]
音節文字係一組書寫符號(叫做「音節符號」),用嚟表示音節或者拍—一個韻律單位,通常但唔一定同音節一樣長。音節文字最啱用嚟寫音節結構相對簡單嘅語言,因為每個音節都要用唔同嘅符號。舉個例,日語大概有100個拍,用平假名嚟表示。相反,英語嘅音節結構就複雜啲,有好多元音同複雜嘅輔音組合—總共有大約一萬五、六千個唔同嘅音節。有啲音節文字有更多符號:彝文就有756個唔同嘅符號。
字母文字
[編輯]字母文字用符號(叫做「字母」)嚟對應語言嘅音位,即係元音同輔音。不過,呢啲對應關係好少時係簡單嘅,而拼寫通常都會受到講者發音以外嘅其他因素影響。「字母」(alphabet)呢個詞係由阿爾法同貝塔演變而嚟,呢兩個係希臘字母頭兩個字母嘅名。輔音字母文字係一種只用字母表示輔音音素嘅字母文字。佢哋係歷史上最早出現嘅字母文字,主要用嚟書寫閃米特語系嘅語言,最初係由原西奈字母演變而嚟。閃米特語系嘅語素學特別啱用呢種方法,因為標示元音通常係多餘嘅。輔音字母文字可以用可選嘅符號嚟標示元音,但通常淨係喺教育等場合先會用到。好多純字母文字係由輔音字母文字加入專門嘅元音字母演變而嚟,好似希臘字母喺大約公元前800年由腓尼基字母演變而嚟咁。「輔音字母文字」(abjad)呢個詞係阿拉伯文「字母」嘅意思:呢個詞係由阿拉伯字母傳統次序嘅頭四個字母得嚟(Template:Tlit、Template:Tlit、Template:Tlit、Template:Tlit)。

字母音節文字係一種字母文字,佢嘅符號對應輔音同元音嘅組合。每個輔音嘅基本符號都預設對應一個固有元音,而每個輔音嘅其他可能元音就要靠用規律嘅方法去改動基本符號嚟表示。喺字母音節文字入面,可能會有一個冇元音嘅「k」符號,仲有一個「ka」符號(如果「a」係固有元音嘅話),而「ke」就係將「ka」符號用同「la」變做「le」一樣嘅方法去改。喺好多字母音節文字入面,改動嘅方法係加入元音符號;其他方法包括將基本符號轉動,或者加入變音符號。
雖然真正嘅音節文字係每個音節用一個符號,而且符號之間冇系統性嘅視覺相似,但係大部分字母音節文字嘅圖像相似性都係因為佢哋源自輔音字母文字—喺原有嘅基本符號上面加入唔同元音嘅標記。最大嘅字母音節文字系統係婆羅米系嘅文字,包括差唔多所有印度同東南亞嘅文字。「字母音節文字」(abugida)呢個詞係由吉茲文字喺某啲場合用嘅次序嘅頭四個字母得嚟。呢個詞係由語言學家彼得·T·丹尼爾斯(1951年出世)創造嘅,佢係借用自衣索比亞語系。
特徵文字系統
[編輯]特徵文字系統係由傑弗里·桑普森(1944年出世)首先提出嚟做一個分類,用符號嚟表示次音位嘅成分—即係可以用嚟區分同分析語言音位嘅特徵,好似佢哋嘅濁音或者發音部位咁。而家最出名嘅特徵文字系統就係用嚟書寫韓語嘅諺文,佢嘅特徵符號會組合成字母,然後再組合成音節塊。好多學者,包括約翰·德弗朗西斯(1911–2009),都反對將諺文歸類做特徵文字系統—理由包括韓國人寫字嘅時候都唔會用呢種方式去諗—又或者質疑桑普森呢個分類嘅可行性。
由於諺文係由識字嘅專家特登設計嘅,所以丹尼爾斯將佢形容做一個「高級文字創制」—即係特登為咗特定目的而設計嘅書寫系統,同自然演變嘅系統相反。其他文字創制包括專業人士開發嘅速記同埋業餘愛好者同創作者設計嘅人造文字,好似托爾金為佢創造嘅精靈語而設計嘅滕格瓦文字。呢啲系統好多都有對應音韻特徵嘅進階圖像設計。呢啲系統嘅基本書寫單位可以係由音位到詞咩都得。研究顯示就算拉丁字母都有次字符特徵。
史
[編輯]有章法書寫之前,有原始書寫。多數有圖示符或速記符。
書寫系統嘅種類
[編輯]最古老嘅文字主要都係基於象形符號同埋表意符號呢啲元素嘅自然語標。大部分書寫系統都可以廣泛噉歸為三個類別:語標、 音節 同埋 字母 (亦或係 segmental);之但係,各種變化性好大嘅書寫系統入便是但揀出嘅任何一種,呢三種類別通通都可以喺其中搵倒。噉樣就通常就好難單一分類某一種書寫系統。嗰啲語標、音節同埋字母三者相混,好難分類嘅系統就經常用複雜系統嚟描述。
文字嘅種類 | 每個符號代表 | 例 |
---|---|---|
意音文字 | 語素 | 漢字 |
音節文字 | 音節 | 日文假名 |
字母 | 音素(子音或母音) | 拉丁字母 |
Abugida | 音素(子音+母音) | 印度天城文 |
輔音字母 | 音素(子音) | 阿拉伯字母 |
特徵字母 | 語音特徵 | 韓國嘅諺文 |
意音文字
[編輯]

語標 係一個單獨寫出來嘅符號, 代表住一個文法上嘅字. 大部分中文字 都係語標.
每個符號代表一個字,準確啲係代表一個語素。
音節文字
[編輯]字母
[編輯]Abugida
[編輯]輔音字母
[編輯]特徵字母
[編輯]寫字方向
[編輯]
Tân niên hạnh phúc bình an tiến (新年幸福平安進)
Xuân nhật vinh hoa phú quý lai (春日榮華富貴來)
古義
[編輯]「字」係文字嘅組成部分,係意思嘅基本部份。有啲有基本意思,未必成字,例唐文拆字細件,或者英文字綴。字可以組成一句嚟讀,一句讀組成辭[15]。古時嘅「字」同現代嘅「詞」,意思部分重疊[16]。
華夏講字,有兩重意思,一種為單字,逐個單字理解,如說文咁,解林單字,「平土有叢木曰林。」另一種唔理單字定多字,按意思為一字,好似爾雅咁,釋訓有「明明斤斤,察也」,明明斤斤視為一字。又釋天,「大歲在寅曰攝提格」,「攝提格」為一字咁。
按周禮後人加註,「古曰名,今曰字。滋益而名,故更曰字。」上古叫字做名,叫字因為佢衍生繁多。亦即事物畀得名就係字,無話單個定多個。近世或有唔明解,或想將兩者分開,改叫辭,或叫詞,反而造成混亂。辭同詞經常通假,然意思各異,之不過,都同講嘢有關。不過都無拆細基本元素嘅意思。辭同詞,一句又得,長到成篇咁又得,如楚辭、陳辭、宋詞、曲詞。
今意
[編輯]喺語言學上,「字」喺中文係書寫單位,各佔一個方塊,幾千個常用,數以萬計或更多個少見,詞/詞語係意思單位,多數由一至幾個「字」組成[17]。喺拼音文字當中,書寫單位叫「字母」,意思單位叫「字」、「詞」或「詞語」——以上三者喺本句之中同義。[18]
睇埋
[編輯]參考
[編輯]- Coulmas, Florian. 1996. The Blackwell encyclopedia of writing systems. Oxford: Blackwell.
- Daniels, Peter T., and William Bright, eds. 1996. The world's writing systems. Place: Name. ISBN 0-19-507993-0.
- DeFrancis, John. 1990. The Chinese Language: Fact and Fantasy. Honolulu: University of Hawaii Press. ISBN 0-8248-1068-6
- Hannas, William. C. 1997. Asia's Orthographic Dilemma. University of Hawaii Press. ISBN 0-8248-1892-X (paperback); ISBN 0-8248-1842-3 (hardcover)
- Rogers, Henry. 2005. Writing Systems: A Linguistic Approach. Oxford: Blackwell. ISBN 0-631-23463-2 (hardcover); ISBN 0-631-23464-0 (paperback)
- Sampson, Geoffrey. 1985. Writing Systems. Stanford, California: Stanford University Press. ISBN 0-8047-1756-7 (paper), ISBN 0-8047-1254-9 (cloth).
- Smalley, W. A. (ed.) 1964. Orthography studies: articles on new writing systems. London: United Bible Society.
出面網頁
[編輯]- decodeunicode 五萬字符 Unicode Wiki
- About African writing systems by the John Henrik Clarke Africana Library at Cornell University:
- 文字通識
- ↑ Coulmas (2002), pp. 151–152.
- ↑ Powell (2009), pp. 31, 51.
- ↑ Meletis & Dürscheid (2022), p. 14.
- ↑ Crystal (2008), p. 481.
- ↑ Bußmann (1998), p. 1294.
- ↑ Bußmann (1998), p. 979.
- ↑ Rutkowska (2023), p. 96.
- ↑ Rogers (2005), p. 2.
- ↑ Meletis & Dürscheid (2022), p. 17 ; citing Morford et al. (2011)
- ↑ Sampson (2016), p. 41.
- ↑
- Condorelli & Rutkowska (2023), p. 4 .
- Joyce (2023), p. 141 , citing Gnanadesikan (2017), p. 15 .
- ↑ Coulmas (2002), p. 35.
- ↑ Steele & Boyes (2022), p. 232.
- ↑ Ottenheimer (2012), p. 194.
- ↑ 〈文字的定義〉。club.ntu.edu.tw。原著喺2021-10-26歸檔。喺2021-08-22搵到。
- ↑ https://humanum.arts.cuhk.edu.hk/cgi-bin/agrep-lindict?query=%c3%f8&category=wholerecord
- ↑ 〈字≠詞〉。www.pcerc.org。喺2021-08-24搵到。
- ↑ Yeung, Zephyr。〈「oct-」、「cent-」與數字有關!破解英文詞彙DNA,從字首字根入手,記單詞更易入腦!-Zephyr Yeung 職場英語教室-職場-生活-ET Net Mobile〉。ETNet。喺2021-12-21搵到。
引用錯誤 <ref>
tags exist for a group named "lower-alpha", but no corresponding <references group="lower-alpha"/>
tag was found