Wikipedia talk:粵文拼音/存檔
- 由Talk:頭版搬過嚟嘅。
關於拉丁化粵文
[編輯]請問粵語維基有冇方法好似zh版既繁簡轉換功能咁,設計一個拉丁化粵文既版本???
至於標準,建議用香港語言學學會粵語拼音方案,而聲調就用附加符號標示。
第1/7聲:ä
第2聲:ã
第3/8聲:â
第4聲:a
第5聲:á
第6/9聲:à
請各位高手賜教!!-Wiki637※傾計 2011年8月7號 (日) 13:40 (UTC)
- 用monobook 有件架生仔可以換減筆字,如果有人有時間,做拼音都唔會太難。* = )< Hillgentleman|書|二零一一年八月八號(星期一)格林威治 08點22分31秒。>
- 咁點先可以做到好似zh版既維基咁??-Wiki637※傾計 2011年8月8號 (一) 09:55 (UTC)
- Firefox 同 Chrome 都有個叫「同文堂」嘅 extension/addon,裝咗之後,撖粒掣就可以繁簡轉換!所以我覺得無必要浪費人力物力去搞個簡體版(或者有轉換功能嘅)粵語維基。 -- 敦 (傾偈) 2011-08-08T11:37:25+00:00 2011年8月8號 (一) 11:37 (UTC)
- 唔該!I thought so. * = )< Hillgentleman|書|二零一一年八月八號(星期一)格林威治 13點48分49秒。>
- 咁其他 browser (IE, Safari,Opera)嘅人點算,冇理由逼人用 Chrome 或者 FF,我覺得要做就連繁轉簡(!唔係簡轉繁)一齊做埋佢。--WikiCantona (傾偈) 2011年8月10號 (三) 22:39 (UTC)
- 其實我既意思係用zh版維基既技術, 做一個拉丁化粵文既版, 好似客家話版維基咁, 而唔係簡體版!!--Wiki637※傾計 2011年8月10號 (三) 16:55 (UTC)
- 其實,有做過相關嘅實驗同初部嘅討論。因為一字多音都幾難吓。--WikiCantona (傾偈) 2011年8月10號 (三) 22:27 (UTC)
- 咁, 請睇下我整既一個範例: User:Wiki637/JyutpingTest--Wiki637※傾計 2011年8月11號 (四) 18:19 (UTC)
- 一字多音係個問題; 如果你有個表, 都可以試下用機械人整.* = )< Hillgentleman|書|二零一一年八月十二號(星期五)格林威治 22點57分22秒。>
- 咁既話可以好似轉繁簡,用一個例外既list,同埋,響咩地方可以搵到呢D表??同埋用咩方法整個表??請指教!--Wiki637※傾計 2011年8月13號 (六) 14:30 (UTC)
- 用呢個網站 (http://arts.cuhk.edu.hk/Lexis/lexi-can/) 既字表黎做得唔得呢?--Wiki637※傾計 2011年8月13號 (六) 16:51 (UTC)
- 用起來要小心。佢有時亦入啲新造音。HenryLi (傾偈) 2011年8月14號 (日) 09:01 (UTC)
- 一字多音係個問題; 如果你有個表, 都可以試下用機械人整.* = )< Hillgentleman|書|二零一一年八月十二號(星期五)格林威治 22點57分22秒。>
- 咁, 請睇下我整既一個範例: User:Wiki637/JyutpingTest--Wiki637※傾計 2011年8月11號 (四) 18:19 (UTC)
- 其實,有做過相關嘅實驗同初部嘅討論。因為一字多音都幾難吓。--WikiCantona (傾偈) 2011年8月10號 (三) 22:27 (UTC)
- 我屬意用萬國音標爲主,多種拼音爲副。純用拉丁字母,真係唔易讀得準。萬國音標,世界通行,可補此弊。今下拼音多種,各有各用途。就算大學敎廣東話,都各適其式。耶魯式近英文,洋人多學呢款。黃錫凌式標音用來編字典。學會式似普通話拼音。政府式廣用於人名地名。HenryLi (傾偈) 2011年8月14號 (日) 09:01 (UTC)
- 用唔同嘅方案嚟整套雜錦系統?!幾有創意。不過,唔知啲人受唔受呢?--WikiCantona (傾偈) 2011年8月15號 (一) 02:17 (UTC)
- 同意樓上,每一套方案都有優點同缺點,我地可以將不同方案集結,成為「粵語維基拉丁化方案」!--Wiki637※傾計 2011年8月15號 (一) 13:44 (UTC)
- 仲有,音標應該主要以26個拉丁字母為主,如果唔係既話輸入都係一個問題。至於一開始提及既聲調,全部(除左"~"配i, u, e外)可以用"美國(國際)"呢個配置,例如:â, ä, õ, í, è等等。--Wiki637※傾計 2011年8月15號 (一) 13:50 (UTC)
- 不過,第一,如果我純悴係用家,淨識黃錫凌式標音,唔識其他,一定睇到會一頭霧水。第二,呢都係維基百科,唔係維基大學,我地有冇責任去自創一套新嘢。第三,如果個系統似中文維基百科,咁有多隻轉換,冇必要淨得一個標音方式,幾個係唔成問題。當然,自創系統可以係其中一個,之不過唔會係優先考慮啦。--WikiCantona (傾偈) 2011年8月16號 (二) 00:38 (UTC)
- 用唔同嘅方案嚟整套雜錦系統?!幾有創意。不過,唔知啲人受唔受呢?--WikiCantona (傾偈) 2011年8月15號 (一) 02:17 (UTC)
方案
[編輯]- 我覺得大部份寫粵語嘅人都慣咗係讀寫漢字;寫羅馬字嘅係少數。如果要做羅馬字嘅話,一定要係用轉換工具由漢字單向轉換做羅馬字(即係,我反對1、2、3號方案),如果唔係會浪費我哋好多精力。識睇粵語嘅人多數都係識睇漢字,而唔係拼音。翹仔 2011年8月17號 (三) 07:57 (UTC)
- 咁有無啲具體啲嘅方法??--Wiki637※傾計 2011年8月18號 (四) 16:08 (UTC)
- 所有文章都要用漢字寫,同時引入中文維基嘅繁簡轉換系統,但係唔止繁簡,仲可以漢字轉拉丁字。(塞爾維亞文維基百科都引入咗呢套系統,都解決到拉丁字母同西里爾字母之間唔係一對一轉換嘅問題。翹仔 2011年8月18號 (四) 16:32 (UTC)
- 我想知既係點樣先可以整到???--Wiki637※傾計 2011年8月19號 (五) 14:45 (UTC)
- 去這裡。 --A-eng (傾偈) 2013年7月21號 (日) 10:15 (UTC)
- 我想知既係點樣先可以整到???--Wiki637※傾計 2011年8月19號 (五) 14:45 (UTC)
- 所有文章都要用漢字寫,同時引入中文維基嘅繁簡轉換系統,但係唔止繁簡,仲可以漢字轉拉丁字。(塞爾維亞文維基百科都引入咗呢套系統,都解決到拉丁字母同西里爾字母之間唔係一對一轉換嘅問題。翹仔 2011年8月18號 (四) 16:32 (UTC)
- 咁有無啲具體啲嘅方法??--Wiki637※傾計 2011年8月18號 (四) 16:08 (UTC)
關於粵語粵文及拉丁粵文之間相互轉換嘅建議
[編輯]- Wikipedia:城市論壇_(技術)搬過嚟嘅:
通過大家近日嘅努力,粵語維基百科內容廣泛性亦達到一定嘅規模。此實眾所樂見。但係,中國國內廢除粵語勢力日益強大,有佔主導地位之趨勢,粵語生存條件十分惡劣。同時亦有鑑於“中文”維基百科,突發此想。希望能與大家談討。
因此為咗能夠向世界廣大嘅學習者更好、更方便、更簡單噉學習同推廣粵語,除咗傳統嘅漢字粵文類書寫粵語之外,仲有必要增加以拉丁字母嚟拼寫嘅粵文,從而使唔識漢字粵文嘅人士尤其係外國人能夠以較快嘅速度學習粵語。在此,我建議參照中文簡繁字體轉換嘅方式同技術,設立漢字粵文與拉丁粵文字間嘅自動轉換。對於此自動轉換,技術上可以參考中文維基嘅各地區之簡繁字體轉換。
另外,建議只於此三種字體之間之切換:傳統粵文、簡體粵文及拉丁粵文。以避免太多複雜無謂之區分,混淆視聽,妨礙推廣。 --Helpcanbepowerful (傾偈) 2013年7月11號 (四) 07:47 (UTC)
其實當前已經有呢種技術,可以參考:粵K越愛粤拼歌词注音網站 及 google 翻譯嘅『漢語拼音』。
仲有,請問邊度有簡體粵語嘅選項?--Helpcanbepowerful (傾偈) 2013年7月11號 (四) 08:51 (UTC)
另外,我想問一下,閣下嘅意思係咪即係粵文有成千上萬個字,若果要實現拉丁粵文同漢字粵文之間嘅轉換係咪就係要整理出所有詞彙嘅一一對應? 如果,呢個係實施過程中最難實現嘅一樣嘢,那麼,我認為只要有足夠嘅人力同時間就可以整理出一部拉丁粵文同漢字粵文嘅對照。噉樣嘅話,我哋大可以馬上展開呢項工作。因為,我哋同樣有成千上萬嘅粵語維基人願意為粵語維基作貢獻。我哋可以將呢項工作放長嚟做,直到所有嘅詞彙都有咗對應,我哋先至將最後嘅版本放上網調試。我認為此事嘅難度係工作量大,而唔係技術上不可能。所以,我哋可以即管去做。--Helpcanbepowerful (傾偈) 2013年7月11號 (四) 09:07 (UTC)
最好啦,因為客家語同台文維基都有咗拉丁文轉換。粵文拉丁化的確迫在眉戚。Isuzu1001 (傾偈) 2013年7月11號 (四) 17:09 (UTC)
反對!用拉丁字母書寫粵語,除咗幫到外國人學粵語之外,根本無其他好處,反而重會造成更多嘅混淆。如果連簡體字都已經唔足以用來書寫粵語嘅話,咁改用同形異意詞多十幾倍嘅拉丁字母,就更加一啲幫助都無。
另外,我之前都喺粵語協會生存過一段時間,發現強力推廣用拉丁字母寫粵語嘅,全部都係有政治目的嘅。維基百科唔係舌戰群鸚嘅地方,唔應該任由政治干預學術。 — 粵語文學大使殘陽孤侠 2013年7月11號 (四) 18:40 (UTC)
- 粵文拼音之前講咗一段時間,有唔同嘅做法(睇Wikipedia:粵文拼音),不過,成個做法最好係咁:將粵文用 javascripts 或者喺 MediaWiki 嘅軟件上面加嘢,做到機械式轉換,亦即係一個正體字(傳統字/繁體字)轉成七種以上嘅拼音、 拉丁字、或者簡体字,而每一種轉換成一篇文(例:Hei³tai²)。強調嘅係呢個做法係『單向轉換』,唔係「相互轉換」,即係話,而加寫粵文用傳統字嘅方針冇任何嘅改變,亦唔會畀用戶用拉丁字簡体字寫嘢。--WikiCantona (傾偈) 2013年7月11號 (四) 23:22 (UTC)
- 對之前嘅睇法嘅回應:第一:以上所提出嘅做法唔應該會做成「混淆」,只係幫粵文嘅讀法加入規範,中文字可以生存成千年,不過,古音就唔會,一日我哋寫嘅粵文都變成古文嘅時候,或者,大吉利是,所有講廣東話嘅人都死晒,拉丁化嘅附加有助粵語嘅保育,喺學術上好有意義。第二:做單向轉換唔係淨係靠多人就得,技術上有問題,中文對拉丁拼音嘅「一對一」嘅轉換唔難(One to one mapping all Chinese character with Cantonese sound is not difficult.)。 問題係「One to many」同「context dependence」,即係話,同一個中文字會,係唔同情況之下會有唔同嘅讀音(睇埋文白異讀,轉音),要睇吓相應嘅詞,或者嗰句講緊乜,先知個字點讀,呢個課題比起「繁簡轉換」難得多。Mapping between Character and the Cantonese sound and pronouciation has partially been done: see 粵語審音配詞字庫。--WikiCantona (傾偈) 2013年7月11號 (四) 23:51 (UTC)
- 如果拉丁粵文嘅第一用途係正音同埋教學嘅話,咁就容我推薦新法蘭西粵語拼音方案——目前唯一一種唔單止可以轉寫廣州話/香港話,重可以轉寫埋其他幾種重要粵語方言(包括台山話同南寧白話)嘅拼音方案。 — 粵語文學大使殘陽孤侠 2013年7月22號 (一) 04:21 (UTC)
完全贊同單向轉換方案,畀唔識漢字嘅人嚟讀。Isuzu1001 (傾偈) 2013年7月12號 (五) 03:47 (UTC)
認同樓上講法,支持單向轉換。其實唔需要理會每一個提議是否有政治目的,因為,如果一個提議係冇目的嘅話噉呢個提議就會變得毫冇意義。再者,漢字係粵文嘅根源,任何人都唔應該放棄漢字粵文。漢字轉拉丁文嘅目的係為咗唔識字嘅外國人士了解到粵語維基,所以並唔需要由拉丁文反轉向漢字,亦無需要噉做。--Helpcanbepowerful (傾偈) 2013年7月12號 (五) 06:39 (UTC)
正體粵文
↕↕↕↕↕↕↕ → LäaiDïngJyùtMan
简体粤文
正體粵文 與 简体粤文 之間互相轉換並可自動轉向至LäaiDïngJyùtMan,而 LäaiDïngJyùtMan 只能被前兩者轉換,不能逆向轉換。 正體粵文 對己,简体粤文 對內,LäaiDïngJyùtMan 對外。噉樣就可以更好噉展示粵語維基嘅包容性之餘,又唔會顧彼失此。--Helpcanbepowerful (傾偈) 2013年7月12號 (五) 06:55 (UTC)
對於用邊一種拉丁方案,我個人較為推薦用Jyutping,因為佢嘅通行性同認受性,已經出現咗幾種根據Jyutping嚟做嘅拼音輸入法。當然,政策嘅民主性亦不能忽略,我建議對選邊一種拉丁化方案進行投票。--Helpcanbepowerful (傾偈) 2013年7月12號 (五) 07:12 (UTC)
- 很抱歉我不是廣東人所以我用普通話分享我個人的意見。
- 有人在以上提到:「技術上太難,因為中文字有成千上萬個字,轉拉丁粵文就好難」。
- 我不同意這個看法。我們現在21世紀的電腦科技已經進步到可以把幾乎每個漢字都自動轉換成拉丁字母。
- 你可以參考漢越辭典摘引的Phiên ân(翻音)標籤就可以把整篇漢字文章轉換成越南拉丁字母!
- (以上也有人提到google 翻譯嘅『漢語拼音』功能)。
- 關於要用 Penkyamp 或Jyutping 拉丁系統,我個人是認為先採用Penkyamp 比較有美感,然後穩定以後就可以再考慮加Jyutping。
- 雖然目前的CJK Unicode 裡面有70,000個漢字,但實際上學者研究已經確認在97.5%的中文文字媒體中大概只包含一小部分的字群,約3000個漢字。
- 我建議先把類似像這3,000個漢字對照成Penkyamp。其他漢字可以漸漸被添加。
- 因此主張的系統如下:
- 正體粵文
- ↕↕↕↕↕↕↕ → LäaiDïngJyùtMan
- ↕↕↕↕↕↕↕
- ↕↕↕↕↕↕↕ → Jyutping (以後再加上)
- 簡體粵文
單向轉換,正字為本
[編輯]上面兩位都加入啲不必要嘅對換(相互對換),因為粵維基都用正體字,大部份用家都希望保持咁。畀我再講:
『單向轉換』嘅做法,所有文章無論新或舊,都係用粵語正體/傳統/繁體字來寫改。简体字唔鼓勵用。正體粵文會通過「機械式轉換」成另一篇文章,轉換得來嘅文章,可以係 LäaiDïngJyùtMan、简体粤文、Jyut Ping Jyut Man、 黃錫凌式音標粤文、yuht yúh 粵文、jrytjryr 粵文.... 即係話,一個正體/傳統/繁體字就有好幾種相對嘅「字」,喺 Database 度:
正體字 | 黃錫凌式音標 | 劉錫祥拼音 | 粵拼 | 粵語羅馬字 | Penkyamp | 简体字 | ... |
---|---|---|---|---|---|---|---|
粵 | _jyt | yuet6 | jyut6 | jryt | Yeùd | 粤 | ... |
語 | ⸝jy | yue5 | jyu5 | jryr | Yeú | 语 | ... |
... | ... | ... | ... | ... | ... | ... | ... |
亦即係:
正體粵文
⤷ LäaiDïngJyùtMan
⤷ 简体粤文
⤷ Jyutping
⤷ ....
⤷ ....(之後再加)
咁做個 Database 簡單啲,programming code 都少啲,免去 Chinese Wikipedia 由簡轉繁嘅「one to many」嘅問題。重因為之後重會做埋 Wikipedia:粵語地方用字轉換。--WikiCantona (傾偈) 2013年7月21號 (日) 23:58 (UTC)
- 我一直都支持呢個方案,只係要有人做。我唔介意可以用簡體粵文做原文,不過系統就會比較複雜,我哋未必有人手維持。翹仔 2013年7月28號 (日) 13:02 (UTC)
應該一步一步嚟
[編輯]其實粵語目前問題有比較多,包括:
- 正體粵文、简体粤文同埋LäaiDïngJyùtMan之間嘅轉換嘅技術問題;
- 究竟需唔需要係上述三種文本轉換之外仲要加入其它嘅粵語拼音方案;
- 有冇必有做埋地方用字轉換
其實上面有提過,太多複雜之區分,就會混淆視聽,亦會妨礙推廣。而家霎時間出現咁多問題,可能會令到編程人員拗爆頭。不如,我哋按照問題嘅緩急先後,一步一步嚟搞掂每個問題噉樣先至會順利走出樽頸位。
--Helpcanbepowerful (傾偈) 2013年7月31號 (三) 00:27 (UTC)
- 之前客家話維基百科係用拉丁字,好似幾個月之前轉咗拉丁漢字並存;或者粵維建可以用『識簡用正』,再用腳注形式加拼音加注都得(其中只係個人意見)。另外LäaiDïngJyùtMan係乜嘢嚟?係唔係『例頂粵文』?? Shinjiman ⇔ ♨ 2013年7月31號 (三) 00:55 (UTC)
- 摆明就系“拉丁粤文”,噉都睇唔出?--William915(傾偈) 2013年7月31號 (三) 04:48 (UTC)
- 啱啱先睇到…… Shinjiman ⇔ ♨ 2013年7月31號 (三) 05:47 (UTC)
- 摆明就系“拉丁粤文”,噉都睇唔出?--William915(傾偈) 2013年7月31號 (三) 04:48 (UTC)
- 我會好主張只係用「正體單向」,一向唔少用家對「用正體」有好強嘅認同,二來簡單,三來 maintain 易。第二樣,有需要三種文本轉換之外,冇理由係得一種拼音,咁硬銷,加多個,可以一步步慢慢嚟,有冇人落手做先係問題 --WikiCantona (傾偈) 2013年7月31號 (三) 06:24 (UTC)
技術問題
[編輯]技術有兩面,兩樣嘢係可以同時做:
- Database
- 轉換機制
其實第一步係整咗 Database,正字→其中嘅拼音;正字→拉丁字,係最嘥時間,有現成嘅 Database 攞嚟用就最好。講緊係至少 3000 中文做起步。
轉換機制係,要喺係 MediaWiki 度改,邊位有經驗?可以 list 啲 links 出嚟。--WikiCantona (傾偈) 2013年7月31號 (三) 06:24 (UTC)
- 好似記得之前係有人曾經整過呢樣嘢嘅,唔知依家重用唔用到。 Shinjiman ⇔ ♨ 2013年7月31號 (三) 07:35 (UTC)
- 改过Skin之后好多问题,又无人去执。--William915(傾偈) 2013年7月31號 (三) 07:47 (UTC)
繁简转换重新整紧。--William915(傾偈) 2013年8月10號 (六) 17:58 (UTC)
呢個結果好唔好?
[編輯]--Helpcanbepowerful (傾偈) 2013年8月13號 (二) 09:58 (UTC)
↑↑↑↑↑↑↑↑
正體粵文
↓↓↓↓↓↓↓↓
如果呢個結果噢畸嘅話,就可以去馬。