Unihan數據庫
閱讀設定
Unihan數據庫係統一碼聯盟為統一碼編咗碼嘅中日韓統一表意文字建立同維護嘅一個數據庫。
內容
[編輯]數據庫裏面包括統一碼標準中全部經過編碼嘅統一漢字,具體嘅資料包括例如:
- 統一碼同其他標準嘅碼嘅對應關係
- 個字喺一啲重要字典(例如《康熙字典》)邊頁邊度搵到
- 正字同(有編碼嘅)異體字之間嘅對應關係
- 個字喺各種話嘅發音(資料唔完全)
- 個字嘅部首
- 個字唔計部首幾多劃
- 個字計埋部首幾多劃。
實現
[編輯]數據庫嘅發布方式有:
- 統一碼聯盟自己網站嘅網上互動介面;
- 可以下載嘅純文字檔;
- 基於上述文件開發嘅第三方版本,其中包括由libUnihan項目開發嘅一套 C 語言函式庫(以 LGPL 條款授權),同埋一個 SQLite 格式嘅 Unihan 數據庫(以 MIT 條款授權)。