Por*_*man 36 resources open-source phonetics
我想以结构化格式(如TXT,XML或SQL)下载英语词典 - 而不仅仅是单词列表.
具体来说,我需要语音发音和词性(不需要定义).
令人惊讶的是,我无法在任何地方找到这个.维基词典可供下载,但它本身只是MediaWiki文章.抓取所有文章并提取语音和词性将是一项巨大的练习.
这有可用吗?我不介意付钱.
编辑:有几个人问过我想做什么.我的迫切需要只是好奇心,例如"最常见的双音节动词是什么?".最终,我的希望是一个可以帮助您找到可用域名的工具,并通过配对正确的词性,以及语音匹配的奖励积分来实现.
注意:交叉发布英语语言和用法.
mat*_*ins 17
访问http://www.speech.cs.cmu.edu/cgi-bin/cmudict,您可以在https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/trunk找到发音词典的下载页面./ cmudict /
最新版本目前是cmudict.0.7a.
这就是我目前用来实现http://www.haikuvillage.com的音节计数器.它是在Ruby中,如果有帮助的话,我很乐意为你开源.
小智 8
具有高度结构化格式的公共领域的词性词典:http://icon.shef.ac.uk/Moby/mpos.html
每行是一个条目,用×分隔,左边是单词值,右边是词性值(动词等).简单的文本文件.
Portman,当我使用DevExpress 的 SpellChecker 工具时,我知道存在OpenOffice 词典,我很确定它们有定义良好的数据结构。我建议您将其与任何免费/付费文本转语音工具结合使用。
希望有帮助,