[太阳]汉字不能被毁灭!美国人在发明电脑的时候,压根就没想过要使用把汉字输入法。 咱都知道,1945 年美国宾夕法尼亚大学的莫奇利和埃克特搞出了第一台计算机,还敲出了第一套代码,当时他们肯定想不到,这套以英语为主的数字体系,以后会被咱东方的汉字狠狠挑战一番。 那时候,计算机刚诞生就带着浓浓的英语味儿,1963 年美国出了个 ASCII 编码,用 7 位二进制数定义了 128 个字符,刚好能把英语字母、数字和基础标点都涵盖进去。 到了 1968 年,美国总统林登・约翰逊还下命令,让联邦政府的计算机都得支持 ASCII,这一下子,这套标准就成了全球计算机的通用语言。 可那会儿计算机内存和处理能力都差得要命,单字节存储的设计全围着英语的特点来,汉字字符又多、结构又复杂,计算机根本就没考虑过它,也没那技术去处理。 西方世界靠着计算机技术一路狂奔的时候,中国却面临着个大难题:“汉字到底能不能进入数字时代,”甚至有人觉得方块字肯定跟不上信息时代,主张搞汉语拼音化。 不过,汉字的生命力那可不是盖的,咱中国人又特别会变通,还特别坚守,国家一看这情况,立马出手了。 1974 年 8 月,在周恩来总理的关心下,“748 工程”这个国家重点科技攻关项目正式启动,目标就是研发汉字信息处理系统,这可是汉字数字化的第一次国家级大行动。 在这场突围里,有两个关键人物特别厉害,一个是 1975 年 38 岁的北京大学教师王选,他眼光超前,直接跳过二代、三代技术,去搞第四代激光照排系统。 他这技术可太牛了,实现了印刷体汉字的数字化存储和输出,新中国成了世界上第一个把印刷体汉字存进计算机还能成功输出的国家。 这技术让中国出版行业告别了“铅与火”,迎来了“光与电”,后来还被评为“二十世纪我国重大工程技术成就”第二名,就比“两弹一星”差一点。 另一个是王永民,1983 年 8 月 28 日,他发明的《二十六键五笔字型汉字编码方案》出来了,以前输入汉字得用那种笨重的整字键盘、主辅键盘,他这发明直接在计算机原装的标准键盘上就能输入汉字。 9 月 27 日《光明日报》头版头条一报道,这发明一下子就传遍全国了,五笔字型是根据字形分解的,把汉字拆成字根,按横、竖、撇、点、折分成 5 区 5 位,让复杂的汉字输入变得有规律又高效,解决了计算机普及的最大障碍,简直就是计算机汉字输入技术的奇迹。 除了形码,拼音输入法也在不断升级,靠着汉语拼音体系,让更多普通人能轻松输入汉字,形码和音码一起用,汉字输入就有了自己的技术体系。 编码标准也很重要,有了它,汉字在数字世界就有了“通用身份证”,1980 年,我国制定了 GB2312 - 80 编码汉字标准,收了 6763 个常用汉字,给中文信息化打下了基础。 但那时候两岸三地编码标准不统一,日本、韩国也有自己的汉字编码,乱码就成了汉字数字传播的新问题,1984 年起,我国牵头,联合台湾、香港地区还有日本、韩国专家,成立了“东亚汉字工作组”,进了 ISO/IEC 体系。 经过 8 年讨论,1992 年 ISO/IEC 正式通过了中、日、韩汉字统一编码提案,1993 年《信息技术 -- 通用多八位编码字符集》发布,把 20902 个东亚汉字都纳入了国际标准编码体系。 现在 UTF - 8 编码成了全球通用标准,汉字在里面也有专属编码,中易字库还成了 ISO/IEC 和 Unicode 协会的标准字库,被微软、IBM、三星这些大企业采用,全世界每天都有好多用户在电子设备上用汉字,汉字真正在全球数字领域畅通无阻了。 其实,汉字数字化突围不是个例,计算机刚发展的时候,阿拉伯文、西里尔文这些非拉丁语系文字,也和汉字一样,遇到了编码难题,被以英语为核心的数字体系限制,得在“语言数字化”和“数字化语言”之间做选择。 不过这些文字大多靠拉丁语系的编码框架来适配,汉字却走了一条独特的技术路,既保留了自己的字形、语义,又和数字体系融合得很好,成了非拉丁语系文字数字化的榜样。 这不仅是技术上的创新,更是对文明的坚守,汉字是形音义结合的文字,承载着中华文明的基因,数字化过程其实就是中华文明在数字时代的传承。 现在,汉字早就从数字困境里走出来了,成了数字世界里最有活力的文字之一,2025 年 3 月,教育部、国家语委、中央网信办联合发布了《关于加强数字中文建设 推进语言文字信息化发展的意见》,说要到 2035 年让中文在全球数字空间、网络空间的使用占比大幅提高,整体水平排在世界前列。 从激光照排到五笔字型,从 GB2312 到 UTF - 8,从电脑输入到手机手写、语音输入,汉字的数字化之路每一步都走得稳稳当当。
