将中文转换为拼音

Mas*_*ass 6 parsing cjk

我在网上找到了一些地方,比如http://www.chinesetopinyin.com/,将汉字转换为拼音(罗马字母).有谁知道如何做到这一点,或者有一个可以解析的数据库?

编辑:我正在使用C#,但实际上更喜欢数据库/平面文件.

myk*_*hal 6

使用可能的解决方案的Python:

我认为Unicode数据库包含汉字的拼音罗马字母,但这些不包括在unicodedata模块数据中.

但是,您可以使用一些外部库,例如cjklib,例如:

# coding: UTF-8
import cjklib
from cjklib.characterlookup import CharacterLookup

c = u'?'

cjk = CharacterLookup('T')
readings = cjk.getReadingForCharacter(c, 'Pinyin')
for r in readings:
    print r
Run Code Online (Sandbox Code Playgroud)

输出:

h?o
h?o
hào
Run Code Online (Sandbox Code Playgroud)

UPDATE

cjklib附带一个独立的cjknife实用程序,可以提供帮助.这里描述一些用法