文字不僅是信息交互的載體,更是一個國家歷史與文化傳承的媒介。甲骨文以降,漢字經歷了數千年的發展與演變,蘊藏著中華民族的思維智慧、文化密碼。有些漢字因為使用頻率相對較低、人們不甚熟悉,成為所謂生僻字。這些生僻字因缺少計算機系統裡的通用編碼,因而無法在數字設備中順暢輸入與顯示。隨著互聯網、大數據等信息技術快速發展,政務、公共服務以及文化供給等加快向網絡化、智能化轉型,不少姓名中包含生僻字的人遭遇社保、公積金無法正常辦理,醫院不能正常實名掛號,手機App實名驗證受阻等問題。還有的地名中包含生僻字,為了避免不便,只好用讀音相同的常見字代替,原名中的文化、歷史記憶也因此被稀釋乃至掩蓋。
統計數據顯示,我國對通用規範漢字的信息化處理已基本普及,但仍有大量漢字需要進一步研究和保護,全國有6000萬人名及大量地名、古籍、方言中包含生僻字,其中多數尚未實現數字化。顯然,無論是站在社會生活便捷還是傳統文化傳承的角度,這種情況都亟待改善。
4月23日,工業和信息化部電子工業標準化研究院、光明日報全媒體、北京國家金融標準化研究院、漢儀字庫、陝西曆史博物館等聯合騰訊共同啟動升級版的“漢字守護計劃”公益行動。藉助現代科技賦能,生僻字輸入、顯示問題將得到進一步解決,這也是數字技術服務社會生活、傳承傳統文化的又一生動案例。
工業和信息化部電子工業標準化研究院牽頭制定的新版《信息技術 中文編碼字符集》強制性國家標準將於8月1日起實施。這套標準包括《通用規範漢字表》全部漢字,人名、地名生僻字以及古籍、科技用字在內的共計88115個漢字和部首的編碼。“標準不僅為漢字和我國少數民族文字的信息處理提供支撐,有效促進文字在各行業信息系統中互聯互通,也為人名、地名生僻字賦予統一的國家標準編碼,為生僻字的治理工作提供關鍵依據,在滿足群眾辦事需求的同時減輕服務機構的負擔。”工業和信息化部電子工業標準化研究院副院長孫文龍說。
在上述國家標準發佈後,在工業和信息化部電子工業標準化研究院的支持下,騰訊聯合各方於2022年11月共同發起了“漢字守護計劃”,針對姓名、地名、古籍等存在的生僻字,從徵集、考證、賦碼到擴容國標、字形設計、推廣應用等環節,全程助力生僻字數字化進程,重煥生僻字在數字時代的功能作用與文化價值。
今年迎來全新升級的“漢字守護計劃”公益行動從生僻字徵集、行業應用推廣兩大環節,進一步加速漢字尤其是生僻字的數字化進程。全國首個“生僻字徵集”微信小程序已於4月20日上線,直接面向用戶徵集無法輸入的生僻字。該小程序是由工信部電子工業標準化研究院指導和推薦的生僻字提交入口,用戶通過拍照上傳,即可提交。這些生僻字經過專業的考證、審核,有望獲得編碼、寫入國標、收入字庫。
在行業推廣方面,騰訊搜狗輸入法也同時正式發佈公共服務、政務服務、交通、教育等領域通用的生僻字解決方案。該方案支持包含新國標字庫在內的9萬多個漢字,並通過拆解字形,提供手寫、筆畫、拼音及“部首拼音+筆畫”等多種方式,解決生僻字難認難寫造成的輸入難題。這套方案包含了覆蓋多終端、多種操作系統的輸入法版本,儘可能滿足更多用戶的需求。
新加入“漢字守護計劃”的光明日報全媒體、陝西曆史博物館將從文博領域生僻字輸入、文博領域詞庫建設以及生僻字宣傳推廣等層面,助力生僻字數字化。“每個漢字都是文化遺產的一部分,既不應該在數字時代流失,也不應該成為數字社會的阻礙。”騰訊公司副總裁曾宇說,“漢字守護計劃”需要在政府機構的引導下,統合輸入法、字庫、硬件廠商、應用軟件乃至操作系統等各方力量共同推進,希望在全鏈條形成的合力推動下,實現漢字全量、全場景數字化應用的願景。
中國社會科學院語言研究所研究員、詞典編輯室原主任譚景春認為,“漢字守護計劃”不僅幫助少數群體解決日常生活中使用生僻字的難題,還將通過推動漢字的全面數字化,助力中華文化在數字時代傳承發展,承擔起漢字守護的使命。