FYI<br><br>---------- Forwarded message ----------<br><span class="gmail_quote">From: <b class="gmail_sendername">Xie Yanbo</b> <<a href="mailto:xieyanbo@gmail.com">xieyanbo@gmail.com</a>><br>Date: 2008-1-11 18:34<br>
Subject: [CPyUG:38184] 中文繁简转换<br>To: python-cn <<a href="mailto:python-cn@googlegroups.com">python-cn@googlegroups.com</a>>, <a href="mailto:python-chinese@lists.python.cn">python-chinese@lists.python.cn</a><br><br>
</span>最近在开发中文繁简转换的python模块,已经初步完成了一个纯python的原型[1],<br>可以实现unicode字符串转换成简体或繁体的功能。繁简映射表来自于维基百科的<br>mediawiki代码。<br><br>[1] <a href="http://pyswim.googlecode.com/files/langconv-0.0.1dev.tgz">http://pyswim.googlecode.com/files/langconv-0.0.1dev.tgz</a><br>
<br>一个使用的例子:<br>>>> from langconv import *<br>>>> c=Converter('zh-hant')<br>>>> c.convert(u'汉字')<br>u'\u6f22\u5b57'<br>>>> print c.convert(u'汉字')<br>漢字<br>
>>> print c.convert(u'中文繁简转换')<br>中文繁簡轉換<br>>>> print Converter('zh-hans').convert(u'中文繁簡轉換')<br>中文繁简转换<br><br>代码核心是一个状态机,基于最大长度匹配的算法。<br><br>可以优化的地方还有很多,项目目标是能提供一个c语言的lib,以及对应的python、<br>
php等包装。但由于最近私人事情比较多,暂时无法继续,先放出来请大家指点,<br>欢迎各种讨论。<br><br>--~--~---------~--~----~------------~-------~--~----~<br>'''邮件来自Groups "python-cn"--China Py User Group<br>详情: <a href="http://groups-beta.google.com/group/python-cn">http://groups-beta.google.com/group/python-cn</a><br>
发言: <a href="mailto:python-cn@googlegroups.com">python-cn@googlegroups.com</a><br>退订: <a href="mailto:python-cn-unsubscribe@googlegroups.com">python-cn-unsubscribe@googlegroups.com</a><br>维基: <a href="http://wiki.woodpecker.org.cn/moin/CPUG">http://wiki.woodpecker.org.cn/moin/CPUG</a><br>
珠江事务: <a href="http://groups.google.com/group/zpug">http://groups.google.com/group/zpug</a><br>东南事务: <a href="http://groups.google.com/group/cpug-eastchina">http://groups.google.com/group/cpug-eastchina</a><br>北京事务: <a href="http://groups.google.com/group/bpug">http://groups.google.com/group/bpug</a><br>
中国事务: <a href="http://groups.google.com/group/CPUG">http://groups.google.com/group/CPUG</a><br>同质列表: <a href="http://python.cn/mailman/listinfo/python-chinese">http://python.cn/mailman/listinfo/python-chinese</a><br>'''<br>
-~----------~----~----~----~------~----~------~--~---<br><br>