我在哪里可以获得带有结构化数据的英语词典?

Por*_*man 36 resources open-source phonetics

我想以结构化格式(如TXT,XML或SQL)下载英语词典 - 而不仅仅是单词列表.

具体来说,我需要语音发音词性(不需要定义).

令人惊讶的是,我无法在任何地方找到这个.维基词典可供下载,但它本身只是MediaWiki文章.抓取所有文章并提取语音和词性将是一项巨大的练习.

这有可用吗?我不介意付钱.

编辑:有几个人问过我想做什么.我的迫切需要只是好奇心,例如"最常见的双音节动词是什么?".最终,我的希望是一个可以帮助您找到可用域名的工具,并通过配对正确的词性,以及语音匹配的奖励积分来实现.

注意:交叉发布英语语言和用法.

mat*_*ins 17

访问http://www.speech.cs.cmu.edu/cgi-bin/cmudict,您可以在https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/trunk找到发音词典的下载页面./ cmudict /

最新版本目前是cmudict.0.7a.

这就是我目前用来实现http://www.haikuvillage.com的音节计数器.它是在Ruby中,如果有帮助的话,我很乐意为你开源.


小智 8

具有高度结构化格式的公共领域的词性词典:http://icon.shef.ac.uk/Moby/mpos.html

每行是一个条目,用×分隔,左边是单词值,右边是词性值(动词等).简单的文本文件.

  • 链接已损坏。 (2认同)

chr*_*ris 6

Wordnet是我所知道的最好的词典之一.也许你会在那里找到一些东西:http: //wordnet.princeton.edu/wordnet/related-projects/


Ram*_*ujo 2

Portman,当我使用DevExpress 的 SpellChecker 工具时,我知道存在OpenOffice 词典,我很确定它们有定义良好的数据结构。我建议您将其与任何免费/付费文本转语音工具结合使用。

希望有帮助,