關於每天打字用的中文輸入法你了解多少?--科普中國

文章推薦指數: 80 %
投票人數:10人

盡管五筆字型輸入法有諸多好處,但“難學”這個致命的弱點讓其難以高度普及。

反倒是拼音輸入法,因為是操作最簡單的輸入法,始終沒有被拋棄。

21世紀 ... 時政國際財經台灣軍事觀點領導人事理論法治社會教育科普體育文化書畫房產汽車旅游健康視頻 登錄注冊 退出 登錄人民網通行証   立即注冊 記住登錄狀態 忘記密碼? 人民網>>科普中國>>科技點亮智慧生活 關於每天打字用的中文輸入法你了解多少? 2016年12月14日16:26  來源:北京日報   原標題:中文輸入法智慧的代碼 多少年來,打字一直是長篇文字最清晰、最整潔、最快速的錄入方式,而使用鍵盤上26個英文字母按鍵,敲擊出數萬個繁復美麗的漢字,幾代華人進行了不懈的努力。

難怪有外媒驚呼:計算機的發明將中國龐大的漢字目錄轉化為一項優勢,中國打字技術的先進程度遠超西方。

早期中文打字操作難 漢字是世界上最美麗的文字之一,漢字的數量多得驚人,從炎黃時期至今上下5000年,古代每個朝代都會造出新字,最著名的如武則天造的“曌”字。

究竟漢字有多少個呢?清代《康熙字典》有47000多字﹔1915年歐陽博存等編撰的《中華大字典》有48000多字﹔1959年日本諸橋轍次編撰的《大漢和辭典》收字49964個﹔1971年張其昀主編的《中文大辭典》,有49888字﹔當代的《漢語大字典》(2010年版)收字60370個﹔1994年中華書局、中國友誼出版公司出版的《中華字海》收字85568個﹔我國台灣地區教育主管機關編撰的《異體字字典》第五版,內容含正字與異體字,共106230字,是收錄最多漢字的字典。

應該說,漢字的數量並沒有准確數字,大約將近十萬個,北京國安咨訊設備公司漢字字庫收入有出處漢字91251個。

漢語難學、難寫在世界上是出了名的,不過如果真的需要我們掌握這麼多漢字,那難度實在是太大了,好在我們日常所使用的漢字隻有幾千個。

有人做過這樣的統計,大約1000個常用字能覆蓋約92%的書面資料,2000字可覆蓋98%以上,3000字則已到99%。

即使是經常使用的隻有幾千字,中文打字也是一件不容易的事。

1915年,山東留美學生祁暄發明的中文打字機獲專利。

此前,他將自己發明的打字機說明報請留美學生經理員轉詳教育部,請予轉咨農商部。

農商部以祁暄所制打字機器運用靈便,構造完備,所印字跡尚鮮明,特准按照暫行工藝品獎章給予專利5年,以示鼓勵。

這個中文打字機是什麼模樣呢?一個約A2紙大小的盤上,排滿了鉛字,鉛字的排列次序跟報館的習慣一樣,按部首畫數排列。

打字員首先要在鉛字盤上用一個小鉗把鉛字鉗起,再按一鍵時,小鉗就會舉起鉛字,隔著色帶印在紙上,當打完一行按回車鍵之后,又會自動卷回頁首,並跳往下一行。

這台中文打字機的工作原理和英文打字機基本一樣,而且能夠配合當時中國人書寫習慣,允許文字打直排。

由於中文打字機的操作並不容易,撿字也很困難,因此在上世紀60年代的香港,隻有比較富裕的學校,才有能力負擔一名能操作中文打字機的打字員。

除了手動式的中文打字機,還有電子中文打字機。

一般印刷公司都是用電子中文打字機,其撿字方式變成了用電子筆在一個超大鍵盤上按鍵,每個按鍵代表一個中文字。

字型是記錄在一張微型的底片上,再利用光學技術投射在一張俗稱“咪紙”的感光紙上。

早期的電子打字機是由日本發明生產的,所以其中的鉛字是按日語發音來排列,后期亦有按筆劃排的,但字型大多數亦是日體漢字。

現代輸入法音碼率先誕生 英文輸入法可以說是伴隨著個人計算機和文字處理軟件一同出現的,10個手指敲擊鍵盤,26個英文字母自然躍然屏上,打字原理基本和英文機械打字機一樣。

但在小小的電腦鍵盤上,使用26個字母按鍵輸入浩如煙海的漢字,可就沒那麼容易了。

從漢字的邏輯構造上看,漢字不能像英文那樣被分成少量的元素單位,從而不能進行以文字構造為基本單位的分類歸放、處理等。

雖然漢字可以分成不同的部首、偏旁等文字基本構件,但是被分成的基本構件數量過多並且基本構件在組成漢字時的位置、方位、朝向,都將決定漢字的構成,這就大大限制了漢字直接以本身的構造來進行快速錄入。

由於漢字有數以萬計,電腦鍵盤不可能為每一個漢字而造一個按鍵。

因此,人們需要替漢字編碼,通過敲擊多個按鍵來輸入一個漢字。

最早的漢字輸入法,一般認為是從上世紀70年代末80年代初期開始的,最先出現的是拼音輸入法。

漢字為什麼會有拼音呢?我國古代漢字讀音大多採用“兩字相切”的讀音方法,如“東”(都籠切)。

這個方法顯然太繁瑣,不易讀准。

公元1610年,法國有個叫金尼格萊的傳教士來到中國,在中國日子長了他就成了中國通。

西方人該怎麼比較容易地讀出漢字呢?1626年金尼格萊寫了一本書《西中儒耳目資》,在這本書中,他首次准確地用拉丁拼音字母記錄了漢字的讀音。

金尼格萊在中國期間結識了學者韓雲、王征等人,並在他們的幫助下,在利瑪竇等傳教士漢語注音的《西字奇跡》基礎上,編寫了中國第一部拉丁化拼音字匯。

漢語拼音在中國大陸使用范圍十分廣泛。

海外華人地區,特別是華語地區如菲律賓、馬來西亞和新加坡等,目前也在漢語教育中進行漢語拼音教學。

1955年,語言文字學家周有光提出普及普通話的兩項標准:全國漢族學校以普通話為校園語言,全國公共活動以普通話為交際媒介,並提出漢語拼音方案三原則,即拉丁化、音素化、口語化。

1958年,漢語拼音方案經全國人民代表大會通過﹔后周有光出席國際標准化組織會議,促成投票通過漢語拼音方案為拼寫漢語的國際標准。

之后,周有光繼續研究以詞語為單位的拼音正詞法,形成《漢語拼音正詞法基本規則》,並於1988年公布。

而周從上世紀50年代開始主編的《漢語拼音詞匯》,成為電腦中文詞庫基礎。

五筆字型具劃時代意義 拼音類的輸入法包括大陸的拼音輸入法和台灣的注音輸入法等。

拼音輸入法相比其他輸入法有著天然的優勢,因為現代每一個接受教育的中國人,在還沒學習漢字前就先用大量時間學習漢語拼音或注音符號,因此原本只是用來標記漢字讀音的拼音,也就可以輕鬆地作為漢字的輸入編碼。

拼音輸入法另一個優勢就是接近口語,所以拼音輸入法可以讓學習者在極短時間內適應。

但是,拼音輸入法有個致命的弱點,就是編碼時單字重碼率非常高,即使是詞組重碼率也是非常高。

尤其是在誕生之初,軟件功能差,字序固定,不支持詞組和整句輸入,甚至文字不能和編碼一起顯示。

在輸入漢字過程中,常常要翻很多頁才能找到需要的漢字,輸入效率非常低下。

雖然當時很多人隻會用拼音輸入法,但大部分人都不滿意拼音輸入法的輸入效率。

1983年,王永民推出了劃時代的五筆字型輸入法。

五筆輸入法採用普通的電腦鍵盤,隻使用英文字母鍵其中的25個參與編碼,不但可以讓我們輸入漢字,而且極大地解決了輸入速度慢這一頑症。

五筆字型完全依據筆畫和字形特征對漢字進行編碼,是典型的“形碼”。

形碼是相對於音碼而言的,形碼輸入法是依據漢字字形,如筆畫或漢字部件進行編碼的方法。

最簡單的形碼輸入法是12345五筆畫輸入法,廣泛應用在手機等手持設備上,電腦上形碼廣泛使用的有五筆字型輸入法、鄭碼輸入法,在港澳台等地流行的形碼有倉頡輸入法、行列輸入法、大易輸入法等。

作為國內第一個推廣的形碼輸入法,五筆字型一經推出即受到很多用戶的熱捧,在上世紀80-90年代,很多人學習電腦的第一要務,就是學習五筆字型輸入法,五筆教學培訓班也遍地開花。

五筆字型輸入法和拼音輸入法不同,需要認真學習,剛開始不容易上手,但一旦背熟了“字根表”,使用五筆字型可以實現“盲打”。

這個巨大的優勢讓“能否掌握五筆字型”成為打字是否專業的標志。

盡管王永民掀起了全國學習使用五筆字型的高潮,但是五筆字型學習難度高,而且編碼存在一些不合理的地方,比如字根不符合漢字基本部件與違反筆順的問題,所以一直無法成為國家教委的推薦輸入法。

在上世紀80-90年代,由於國家教委尚未有推薦輸入法方案,所以在中小學裡教的漢字輸入法相當多,各個學校教漢字輸入法也不盡相同,有的教五筆字型,有的教自然碼,有的教肖碼等。

不過由於五筆字型輸入法可以快速錄入漢字,因此在全國范圍內得到較為廣泛的商業推廣。

中文輸入已快過英文輸入? 計算機和手機漢字輸入法的探索發明之路已走過了近30年。

這30年可以用“萬‘碼’奔騰”來形容,市面上除了五筆字型輸入法、全拼輸入法外,自然碼、鄭碼、黑馬輸入法等各種各樣的輸入法紛紛涌現出來。

盡管五筆字型輸入法有諸多好處,但“難學”這個致命的弱點讓其難以高度普及。

反倒是拼音輸入法,因為是操作最簡單的輸入法,始終沒有被拋棄。

21世紀初期,拼音輸入法有了長足的改進,以微軟視窗操作系統內置的智能ABC、微軟拼音輸入法以及市面上非常流行的拼音加加、紫光拼音輸入法為代表,這個時代的拼音輸入法,隨著智能聯想、自我學習、模糊、細分專業詞庫等功能的不斷完善,用戶使用拼音輸入法錄入文字的速度得到大幅提升。

由於拼音輸入法不需要用戶花費額外的學習成本,因此很快贏得青睞,這個時期的拼音輸入法奠定了其成為中文輸入法主流的市場地位。

到了2005年以后,搜狗等新一代拼音輸入法崛起。

新一代拼音輸入法充分借鑒了互聯網的優勢,通過自動升級詞庫等方式,保持詞庫處於最新狀態,嵌入了網絡搜索的功能,智能化程度更高,自我學習能力更加強大,增加了英文單詞提示、中英文詞典等功能,還可以通過網絡保存用戶個人使用習慣和個人字典。

隨著各種個性化皮膚的涌現,其屏幕展現形式也更加豐富多彩。

為佔有用戶桌面端,越來越多的IT和互聯網廠商開始涌入拼音輸入法這塊陣地,如搜狗、QQ、谷歌等,甚至阿裡巴巴和百度等也開始涉足拼音輸入法領域。

廠商爭奪這塊市場已經遠遠超出了佔有拼音輸入法市場本身的意義,已成為廠商佔領用戶桌面端、移動終端的重要手段。

今年10月29日,2016搜狗大會在北京舉行,搜狗CEO王小川做了題為“搜狗的人工智能之路”的演講,提出搜狗輸入法將推出智能回復和分享功能。

王小川稱,未來輸入法不只是一個表達工具,它可以理解你的想法,別人向你提問,輸入法會自動代替你回復。

搜索的未來在於問答,未來搜索引擎將做到輸入一個關鍵詞獲得一個精確的答案。

搜狗搜索的下一個目標,是把從今天的關鍵詞系統變成問答系統,而搜狗已經逐步上線這樣的能力,大概有5%-10%的問題可以直接給答案。

據美國《大西洋月刊》網站11月1日報道,研究現代中國的歷史學家湯姆·馬拉尼正在舉辦中文打字機和鍵盤展覽。

這個展覽令馬拉尼得出結論說,中國正在打字技術方面大踏步前進,而西方遠遠落在后面,仍然緊抱著QWERTY鍵盤不放。

馬拉尼提出,在QWERTY電腦鍵盤上打英文,“是使用鍵盤的最基本方式”。

在鍵盤上按下“a”鍵,“a”就會出現在屏幕上。

“這不需要使用計算機的處理能力和內存。

”另一方面,在連接到一台中文電腦的QWERTY鍵盤上鍵入“a”,計算機將會“推測”你可能會打出的漢字。

用中文輸入,需要用戶從軟件層面來考慮問題。

換句話說,鍵入一個漢字,本質上是鍵入一組指令——如果你願意的話,也可以是一個代碼——來檢索一個特定的漢字。

他認為,正是中國在電報和打字機領域曾經遭遇的尷尬歷史,促使講中文的人在軟件出現之后對其進行了充分的利用——以至於現在用中文輸入比用英文要快得多。

(武銳) (責編:張萌、張希) 人民日報客戶端下載手機人民網   相關新聞 22點網民最嗨,他們在聊什麼中國網民日均打字350億搜狗輸入法與人民大學發布報告教育問題成網民最關注焦點人工智能的“能”與“不能”王小川:工程師在人工智能時代會處於越來越重要的位置阿童木續集搜狗輸入法裡的全新英雄主義搜狗輸入法助盲人溝通無障礙識字提前拼音置后感覺怎樣?教師:更加尊重教育規律 視頻新聞 爭當"小小演說家" 治理"黑停車場" 摩托車駕考熱 品嘗澳洲生蚝 山東:公益“大篷車”為老年人普法維權 國際旅游島汽車場地越野賽23日海口開幕 韓國上班族真的“亞歷山大”嗎? 熱點排行 紅外相機拍到大熊貓媽媽帶寶寶“巡山”台當局把小學生當“小白鼠”鋼管舞大賽因主辦方未准備中國國旗 中國…中共中央辦公廳國務院辦公廳印發《黨政主…郝平任北京大學黨委書記(圖/簡歷) 人民網版權所有,未經書面授權禁止使用 Copyright©1997-2016bywww.people.com.cn.allrightsreserved



請為這篇文章評分?