FYI<br><br>---------- Forwarded message ----------<br><span class="gmail_quote">From: <b class="gmail_sendername">Xie Yanbo</b> &lt;<a href="mailto:xieyanbo@gmail.com">xieyanbo@gmail.com</a>&gt;<br>Date: 2008-1-11 18:34<br>
Subject: [CPyUG:38184] 中文繁简转换<br>To: python-cn &lt;<a href="mailto:python-cn@googlegroups.com">python-cn@googlegroups.com</a>&gt;, <a href="mailto:python-chinese@lists.python.cn">python-chinese@lists.python.cn</a><br><br>
</span>最近在开发中文繁简转换的python模块,已经初步完成了一个纯python的原型[1],<br>可以实现unicode字符串转换成简体或繁体的功能。繁简映射表来自于维基百科的<br>mediawiki代码。<br><br>[1] <a href="http://pyswim.googlecode.com/files/langconv-0.0.1dev.tgz">http://pyswim.googlecode.com/files/langconv-0.0.1dev.tgz</a><br>
<br>一个使用的例子:<br>&gt;&gt;&gt; from langconv import *<br>&gt;&gt;&gt; c=Converter(&#39;zh-hant&#39;)<br>&gt;&gt;&gt; c.convert(u&#39;汉字&#39;)<br>u&#39;\u6f22\u5b57&#39;<br>&gt;&gt;&gt; print c.convert(u&#39;汉字&#39;)<br>漢字<br>
&gt;&gt;&gt; print c.convert(u&#39;中文繁简转换&#39;)<br>中文繁簡轉換<br>&gt;&gt;&gt; print Converter(&#39;zh-hans&#39;).convert(u&#39;中文繁簡轉換&#39;)<br>中文繁简转换<br><br>代码核心是一个状态机,基于最大长度匹配的算法。<br><br>可以优化的地方还有很多,项目目标是能提供一个c语言的lib,以及对应的python、<br>
php等包装。但由于最近私人事情比较多,暂时无法继续,先放出来请大家指点,<br>欢迎各种讨论。<br><br>--~--~---------~--~----~------------~-------~--~----~<br>&#39;&#39;&#39;邮件来自Groups &quot;python-cn&quot;--China Py User Group<br>详情: <a href="http://groups-beta.google.com/group/python-cn">http://groups-beta.google.com/group/python-cn</a><br>
发言: <a href="mailto:python-cn@googlegroups.com">python-cn@googlegroups.com</a><br>退订: <a href="mailto:python-cn-unsubscribe@googlegroups.com">python-cn-unsubscribe@googlegroups.com</a><br>维基: <a href="http://wiki.woodpecker.org.cn/moin/CPUG">http://wiki.woodpecker.org.cn/moin/CPUG</a><br>
珠江事务: <a href="http://groups.google.com/group/zpug">http://groups.google.com/group/zpug</a><br>东南事务: <a href="http://groups.google.com/group/cpug-eastchina">http://groups.google.com/group/cpug-eastchina</a><br>北京事务: <a href="http://groups.google.com/group/bpug">http://groups.google.com/group/bpug</a><br>
中国事务: <a href="http://groups.google.com/group/CPUG">http://groups.google.com/group/CPUG</a><br>同质列表: <a href="http://python.cn/mailman/listinfo/python-chinese">http://python.cn/mailman/listinfo/python-chinese</a><br>&#39;&#39;&#39;<br>
-~----------~----~----~----~------~----~------~--~---<br><br>