繁简处理指引 · 地区词处理指引 · 字词转换指引 申请增加繁简体转换 · 申请增加地区词全局转换 · 提报错误转换 |
现在繁简体、地区词转换的程序已经初具雏形。本页将用来对已投入的转换进行检验,对过度转换的情况可以在此报请修复。请大家热心参与!
一对多转换原理及错误原因[]
由于简体中文以单一简体字来取代多个繁体字,因此必须有额外的数据来补足原先丢失的信息。举例说明:例如在繁体中的-{“髮”或“發”}-,在简体下都是“-{发}-”。在程序里,我们有一个预设的对应,比如说“-{發}-”。那么一般情况下要从简体转换成繁体时,程序遇到“-{发}-”就会先将其转换成“-{發}-”。那么什么时候对应成“-{髮}-”呢? 这个就要看词库内而定。比如词库中有“-{头发=>頭髮}-”的关系,这样“-{头发}-”就会被转换成“-{頭髮}-”。如果没有这一关联,那“-{头发}-”就会被错误地转换成“-{頭發}-”。
那词库是如何建立的呢? 我们先有每个字的预设对应,比如“-{发}-”转换成“-{發}-”。然后我们在一个现有的繁体词库中寻找包含(繁体)“-{發}-”的的词,再转换成简体。这样得到一个从简体到繁体的词汇对应关系。所以,我们先要确定一个多对应字的预设对应关系。
修复过度转换也是由上述的方法来处理。
下面的请求处理后,如有必要,处理者应将之完善到哈利·波特维基:简繁一多对应校验表、哈利·波特维基:繁简一多对应校验表。