A)
是的.unicode中表示的所有字符都有一个称为代码点的唯一数字索引.
如果你知道简体中文的代码点范围,并且你知道如何获得给定字符的unicode代码点,那么简单的比较将告诉你给定的字符是否在简体中文范围内.
现有问题有一个解决方案,用于获取PHP中字符的unicode代码点:
如何获取utf-8字符串中给定字符的代码点编号?
在Java中,静态java.lang.Character :: codePointAt()方法将为您提供所需的功能.
B)
将简体中文字符或字符串转换为拼音很可能需要某种形式的映射,其中unicode代码点作为键,相应的拼音作为值.
PHP中的一个示例显示在http://kingphp.com/108.html.
一个简单的谷歌搜索[java拼音]揭示了一系列选项,其中两个是中文拼音库http://kiang.org/jordan/software/pinyinime/和http://pinyin4j.sourceforge.net/.