我在网上找到了一些地方,比如http://www.chinesetopinyin.com/,将汉字转换为拼音(罗马字母).有谁知道如何做到这一点,或者有一个可以解析的数据库?
编辑:我正在使用C#,但实际上更喜欢数据库/平面文件.
使用可能的解决方案的Python:
我认为Unicode数据库包含汉字的拼音罗马字母,但这些不包括在unicodedata
模块数据中.
但是,您可以使用一些外部库,例如cjklib,例如:
# coding: UTF-8
import cjklib
from cjklib.characterlookup import CharacterLookup
c = u'?'
cjk = CharacterLookup('T')
readings = cjk.getReadingForCharacter(c, 'Pinyin')
for r in readings:
print r
Run Code Online (Sandbox Code Playgroud)
输出:
h?o
h?o
hào
Run Code Online (Sandbox Code Playgroud)
UPDATE
cjklib附带一个独立的cjknife
实用程序,可以提供帮助.这里描述了一些用法