相关知识

目前,汉字有繁体中文(繁体字)和简体中文(简体字或简化字)之分。繁体中文主要在台湾、香港与澳门地区,及北美等绝大部分海外华人社区中使用。简体中文主要在中国大陆,马来西亚、新加坡,以及东南亚一些国家的华人社区中使用。使用繁体中文和简体中文的人们,在学习、沟通、交往和文化交流过程中,时常需要将繁体中文转换为简体中文,或将简体中文转换成繁体中文。此外,中国加入世贸后,很多国际性公司和机构都需要将重要的外文文字同时翻译为“简体中文”和“繁体中文”,许多重要中文文件往往需要同时发布“简体中文版”和“繁体中文版”。

随着计算机技术、互联网技术和人工智能的研究深入和不断发展发展,计算机在处理各类问题时几乎无所不能。然而它在处理“繁简字转换”和“繁简中文信息交流”事情上还存在很大的问题。其中的主要原因之一是计算机处理转换的规则是“一对一”的转换,而在简化字(或简体字)与繁体字之间存在“一简对多繁”的情况。例如:

(1)“轻松”(繁体:輕鬆)的“鬆”被简化为“松”,“松树”(繁体:松樹)的“松”简体和繁体皆为“松”,这样,一个简化字“松”对应着“轻松”的“松”和“松树”的“松”,我们把这种情况叫“同音替代一简对二繁”。

(2)“发展”(繁体:發展)的“发”,对应着“发展”、“发财”(繁体:發財)的“發”和“头发”(繁体:頭髮)的“髮”,这样,一个简化字“发”对应着“發”和“發”二个繁体字,我们把这种情况叫“近音替代一简对二繁”。

(3)“台”,在繁体中文里仍然为“台”(浙江省“台州市”繁体仍作“台州市”,“台湾”繁体为“臺灣”,时常也用作“台灣”),作为简化字的“台”对应着“台”、“臺”、“檯”、“颱”4个繁体字,我们把这种情况叫“近音替代一简对多繁”。

“一简对多繁”的情况存在,使得计算机处理“无法实现完全的自动化”。华东师范大学詹鄞鑫教授在《关于简化字整理的几个问题》的论文中指出:“由于简化字中采用了同音替代(注:包括近音替代),造成在计算机繁简字转换时无法实现完全的自动化。”他还说,“这个因同音替代造成的问题如果不解决,计算机处理和中文信息交流的完全自动化就永远不可能彻底实现。”所谓同音替代,是1950年代中国汉字简化时,采用的用一个笔画较少的同(近)音字来替代某一个笔画较多的繁体字,或者用一个简化字来代替两个甚至多于两个的音同(近)的繁体字的方法(汉字简化方法之一)进行汉字简化。形成了今天一些简化字对应2个或多个繁体字的状况。《海峡繁简中文转换系统》软件就是要在“同音(近)替代”情况还没有改变或者不变的情况下实现繁简字转换计算机处理“完全自动化”。

什么是简体字? 什么是简化字? 什么是繁体字? 什么是正体字? 什么是传承字?