2007年5月20日 星期日

Google拼音與漢音輸入法(拼音)的比較

Google在大陸推出拼音輸入法,其中有繁體模式供使用者選擇,因自己本身用的是漢音(以羅馬拼音方式輸入),故嘗試比較兩者間之不同。




















一、拼音輸入

漢音輸入法因是由注音而來,故包含了聲調的輸入,以12345代表不同聲調【ba1八ba2拔ba3把ba4爸ba5吧】,而大陸的拼音(包括Google)不含聲調,所以ba就包含了【八拔把爸吧】,直接影響到選字的範圍,比如【li慄】在Google拼音光找就找半天,而漢音很快就可找到,為何以【慄】來作例子,以下會繼續說明。






兩者皆有針對曖昧(模糊)音的設定,也就是ㄗzi、ㄘci、ㄙsi,ㄓzhi、ㄔchi、ㄕshi,ㄣen、ㄥeng,ㄢan、ㄤang等,甚至於Google拼音還提供智能糾錯,在協助使用者快速拼出所想要的字與詞幫助不小。













單字音輸入:漢音小勝,Google拼音非戰之罪。

二、選字方式

漢音是以【拼音+聲調+空白鍵+最多每頁30字矩陣選字】,Google拼音是以【拼音+數字1~9+PgUp or PgDn選字】,兩者各有巧妙,但用慣了漢音後,總覺得右手小指移到右邊的PgUp or PgDn鍵很辛苦,(新版已增加tab及-=,.來選字,好用多了)不如空白鍵來選字的方便,且漢音提供最多5x6矩陣選字比起Google拼音要快得多。Google拼音有一特性會將有選過的字,在下一次輸入時放入最前方,可以讓頻繁輸入使用的字放置在最前面候選,而漢音已經不再繼續開發,故電腦登出或重開後,頻繁字都歸回初始值:(













選字來說:漢音的概念較好,加上台灣的拼音有聲調,大體上可以很快選到目標字。

三、辭庫選擇

由於中文字同音多,故長久以來台灣發展的注音(含拼音)輸入無不與辭庫結合,有像漢音的選擇使用各領域辭庫,或像自然輸入法智慧型選辭,Google拼音較像兩者之混用,因Google拼音無辭庫可供選擇,但普遍使用的辭語又可自動帶出,故推論之。



















Google拼音還有項先天條件的不足,由於以簡体中文輸入為開發主要方向,所以即便選取了【繁體模式】,仍然有很多自動帶出的常用語跟成語,在台港人士來看是錯誤的,如:
‧老姜煮老姜(薑)湯來喝
‧不寒而栗(慄)
‧我下面(麵)給你吃
‧谷(穀)物
這並非Google拼音的錯,而是有政治考量下簡化中文字所造成的,其他簡体中文拼音加辭庫也會如此。










就使用繁體中文(或稱傳統中文、正體中文)使用者來說,辭庫方面,建議Google拼音在選擇【繁體模式】時,應從其海量的搜索辭庫中(Google官方說法),篩選出台港(或繁體)中文使用區的對應辭庫,如此方能符合傳統中文使用習慣,也讓簡体中文使用者不須透過其他工具,就可直接了解傳統中文所用正確的字與詞。

漢音在傳統中文辭庫這方面表現較優,不會有【不寒而栗】這種問題,甚至於四個字注音直接打完,就自動選詞完成。
【不寒而慄】:雖不冷,可是打從心裡感到顫抖
【不寒而栗】:雖不冷,可是還是要栗子





Google拼音其實也很強,不考慮繁簡中文的話,其表現非常的好,頻繁字加上海量的辭庫,會將打字的正確率不斷的提高,以上面【不寒而慄】為例,只要將【栗】改選過【慄】,之後打buhanerli兩者皆會出現在前面的候選辭中。




建議Google:如果在繁體模式下,優先以傳統中文字庫排列候選字的話,會更完善。


四、自建辭庫及略(短)語

在自建辭庫方面,Google拼音較優,除了基本的自建詞庫外,還可以將詞庫同步至Gmail信箱,以後只要有Google拼音和網路,就可以將自己的辭庫帶著到處跑,感覺像在為未來虛擬電腦辦公室做基礎架構,眼光蠻長遠的。

五、結語

總括來說,漢音羅馬拼音與Google拼音因為兩岸拼音邏輯方式的不同:有聲調及無聲調,造成漢音(或自然輸入)羅馬拼音使用者不能很直接的轉移至Google拼音:

Google拼音:子音+母音+數字鍵選字
台灣拼音:子音+母音+聲調+空白鍵+數字鍵選字

每當拼完子音加母音後,漢音使用者會數字鍵1~5來輸入聲調,但Google拼音在輸入數字鍵時,等於是選字,會有些錯亂,沒辦法,Google拼音是以大陸為主要的目標使用者,所以台灣使用者如果真的要改用Google拼音,只能削足適屢地習慣此邏輯。

有注意到Google拼音改版的安裝檔案,從v1.0.16~18安裝檔案是越來越小,功能卻是不斷增加,可以看到這家公司對軟體工程不斷優化的努力;同樣情形也發生在GoogleEarth for Mac,在硬體設備不變的情形下,操作的流暢度是越來越好,可能在高階機種不會有太大的感受,但以五六年前的G4/1.2機種來看,改進是很明顯的。





後記:

為何前面所說簡化中文是政治考量下的做法呢?其理由在:以南北韓為例,兩者用的都是韓國字,北韓有為了說要掃除文盲而來簡化韓國字嗎?而南韓有因此而不識字的國民增加嗎?重點不在簡化字,而在於教育,中文字在大陸對比於台灣及香港亦同,不要藉口說港台與大陸人口數的懸殊比,在大陸這個土地上,請記得曾經有輝煌的唐宋等文明盛世,這些朝代有用簡化中文字來創建文明高峰或扭曲文化嗎?答案是很清楚的。

中文字本來就有在書寫上簡化字的運用,甚至於發展出行書草書的藝術表達,但人一生中中文字用看的時間大體上可能超過2/3【學20年活60歲估算】,加上現代化電腦(計算機)普及使用,簡化中文字實質上並沒有太大的意義,只會混淆及扭曲中文字所表達的文化含量,所以個人以為:【識繁書簡】乃為較中庸及符合人性的使用方式。

由於海峽兩岸政權對文化的忽視,導致原屬自己的文字文化領域被他人強行註冊至該國文化遺產:【韓國申請書法及端午節為其國家之世界文化遺產】。真慘,一邊台獨思想政權不想也不願繼承此中國文化,另一邊文化革命之後,改革開放以來國力增強,說著自己是文明古國,卻只能拿出用不到百年的簡化中文字【不含行書草書的簡化字】來敘說自己文明的淵遠流長,可泣復可悲也。

附帶一提,當我看到Google拼音和其他輸入法因辭庫雷同而吵得不可開交時,有種感覺:不對的辭庫有什麼好蔽叟自珍的。

另外,最近也常看到大陸網友及媒體對被閹割的Google.cn很有意見,但回頭一想:一群被閹割的人笑著為了進屋子而自我閹割的人,實際上該被笑的是規範凡進屋著必須符合閹割規則的主人吧!微軟、Yahoo不也是這樣,做生意嘛,民不與官鬥乃為上上策也,這也難怪台灣被稱為華人社會中言論自由度上最高的,因Google在台灣都不會有這些問題。