表意文字描述字元

出自維基百科,自由嘅百科全書

表意文字描述字元英文Ideographic Description Character,IDC)係萬國碼區段,收錄用來描述中日韓字元集形意符號,屬萬國碼自第三點〇版對漢字嘅支援。

目前大部份編碼包含萬國碼,處理漢字編碼時大致先搜集漢字,幫每隻字編碼。但漢字數量龐大,字集往往唔完整;再加上漢字本身係開放組合,漢字用者好可能自造新字,無可能有字集可搜集晒全部漢字,所以用呢啲字元描述某「字」點用簡單啲嘅部件組合出來。

[編輯]

表意文字描述字元
Ideographic Description Characters
[1][2]
官方碼表(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+2FF乜
註釋
1.^ 依據萬國碼十三點〇
2.^ 灰唨嘅碼位未分配

另有收錄U+303E ideographic variation indicator表意文字指示符,以表示形似但唔一樣嘅字。

表意文字描述序列[編輯]

表意文字描述序列(英文:Ideographic Description Sequence,IDS)係萬國碼標準定義嘅漢字結構描述語法,描述序列由描述字元同兩粒或以上特定字元(主要係漢字)組合而成,表示漢字嘅抽象結構。

萬國碼定義唨12種組合字元:

編碼 字元 意義 例字 序列 例字 序列
U+2FF0 兩部件由左至右組成 ⿰木目 𠁢 ⿰丨㇍
U+2FF1 兩部件由上至下組成 ⿱木口 𠚤 ⿱𠂊丶
U+2FF2 三部件由左至右組成 ⿲彳氵亍 𠂗 ⿲丿夕乚
U+2FF3 三部件由上至下組成 ⿳亠口小 𠋑 ⿳亼目口
U+2FF4 兩部件由外而內組成 ⿴囗口 𠀬 ⿴㐁人
U+2FF5 三面包圍,下面開口 ⿵几皇 𧓉 ⿵齊虫
U+2FF6 三面包圍,上面開口 ⿶凵㐅 ⿶乂丶
U+2FF7 三面包圍,右面開口 ⿷匚斤 𧆬 ⿷虎九
U+2FF8 兩面包圍,兩部件由左上至右下組成 ⿸疒丙 𤆯 ⿸耂火
U+2FF9 兩面包圍,兩部件由右上至左下組成 ⿹戈廾 𢧌 ⿹或壬
U+2FFA 兩面包圍,兩部件由左下至右上組成 ⿺走召 𥘶 ⿺礼分
U+2FFB 兩部件重疊 ⿻工从 𣏃 ⿻木⿻コ一
U+2FFC 三面包圍,左面開口
U+2FFD 兩面包圍,兩部件由右下至左上組成
U+2FFE ⿿ 水平翻轉
U+2FFE ⿿ 旋轉

IDS嘅運算方式係前綴表示法,運算子寫先,對應數量嘅運算元寫後。呢種方式唔使用括號等字元輔助就可無歧義表示運算順序。

萬國碼標準噉定義表意文字描述序列:

IDS := 漢字 | 部首 | 中日韓筆畫 | 私人造字區 | U+FF1F | IDS二元運算子 IDS IDS | IDS三元運算子 IDS IDS IDS
IDS二元運算子 := U+2FF0 | U+2FF1 | U+2FF4 | U+2FF5 | U+2FF6 | U+2FF7 | U+2FF8 | U+2FF9 | U+2FFA | U+2FFB
IDS三元運算子 := U+2FF2 | U+2FF3

合規範IDS必須由漢字、中日韓部首字元、中日韓筆畫字元(U+31C0至U+31EF)、私人造字、全形問號字元(U+FF1F),以IDC連接而成。

睇埋[編輯]

出面連結[編輯]