中华字库完成3000个生僻汉字编码

2016-12-10


在由国家资助的最大编码项目推动下,许多此前无法在电子格式中实现的汉字编码于10月完成。

约3000个生僻字根据全国标准实现了编码。它们既可以在中国使用,也可以支持汉字软件的东亚地区使用。

然而,想要在全球范围内使用,这些汉字需要获得国际标准化组织颁发的证书后,通过统一码Unicode发布。国际标准化组织位于日内瓦,与各国合作,建立专利、行业和商业标准。中国也是成员之一。

新闻出版总署官员表示,这个汉字项目于2011年推出,旨在未来几年中为30万个汉字、10万少数民族文字以及10万多个如甲骨文这种不常见的古代书写文字编码,

研究学者称,这项名为“中华字库”的项目意在国内外人士提供更多语言学资源。

这一项目由28个部分组成,除了政府部门外,还有几所国内几所大学和公司参与其中。目前政府在这一项目上投入了约4.8亿元。

国际标准化组织目前已通过8万汉字的编码。

负责这个项目的新闻出版总署通过中国电子技术标准化研究所向国际标准化组织提交了包括中国南方的少数民族文字在内的新编码汉字。

“这一批文字已经按国际标准化组织相关象形文字部分归档。”新闻出版总署的一位官员说道。

他还提到,一旦讨论结束,这些汉字就可以由国际标准化组织收录,在全球范围内使用,而这一过程通常要两到三年。

另外一批2000个人名和地名用字将于6月提交。这些汉字过去由于结构复杂没能实现广泛编码,给中国人在银行、机场和其他依赖国际计算机编码的场所办理业务带来了不便。

为了解决这一问题,中国政府于2013年发布了8105个标准汉字清单,呼吁家长在给孩子起名时从中挑选。

字库计划已确定需要编码的20万个字。

这位官员表示,最终目标是建立一个计算机编码和字体的数据库,以推动中华传统文化的继承和推广。

自1980年,国家就开始了许多简体字的编码。不过,几乎没有收录早期书写体系,如封建时期的文字。

“这样,更多学者可以研究古代中国各朝各代的作品了。”北京师范大学语言教授李国英说道。

该校在项目中的任务是为字典编码,目前已完成了300部。

一些古代语言是在石器,甲骨,铜器和丝绸上的文字与绘画。此外,少数民族的文字更是各不相同。

中国通用语言,普通话虽然在不断进化,但依旧保留了传统中文的影响。

“英文字母表中只有26个字母,所以某种程度上来看它是一个闭合的系统。不过,汉字数量众多,所以我们需要升级,并且将其纳入编码,”北大方正电子有限公司字库部门总经理张建国说。

北大方正是一家制作中文、藏文和清代书法等字体的公司,于2014年加入了这一项目。