解决方法
一个)
是. unicode中表示的所有字符都有一个称为代码点的唯一数字索引.
是. unicode中表示的所有字符都有一个称为代码点的唯一数字索引.
如果你知道简体中文的代码点范围,并且你知道如何获得给定字符的unicode代码点,那么简单的比较将告诉你给定的字符是否在简体中文范围内.
现有问题有一个解决方案,用于获取PHP中字符的unicode代码点:
How to get code point number for a given character in a utf-8 string?
在Java中,静态java.lang.Character::codePointAt()方法将为您提供所需的内容.
B)
将简体中文字符或字符串转换为拼音很可能需要某种形式的映射,其中unicode代码点作为键,相应的拼音作为值.
PHP的一个例子显示在http://kingphp.com/108.html.
一个简单的谷歌搜索[java拼音]揭示了一系列选项,其中两个是http://kiang.org/jordan/software/pinyinime/和http://pinyin4j.sourceforge.net/拼音库的中文.