借鉴 php 的简化方法就可以了,80-ff 全部认为是合法的标示符。这样虽然连中文标 点符号也成为字符,但是总比完全不支持中文要好得多。 -- Sincerely, Pan, Shi Zhu. yarco <yarco.w在gmail.com> 写于 2008-12-03 19:39:05: > 2) 中文utf8是3个字节长, 在正则里需要表示为类似: > ([\xe0-\xef][\x80-\xdf][\x80-\xdf])