如何获得英语单词数据库?

136 database words

我需要一个英文每个有效单词的数据库.我检查了/usr/share/dict/words文件,它包含不到100k的单词.维基百科说英语有475k字.我在哪里可以获得完整列表(美式拼写)?

此外,是否还有一个网站可以为其他语言提供单词,包括亚洲语言和欧洲语言?

编辑:忘记添加,我不需要姓名等,只是有效的英文单词.

use*_*803 68

WordNet数据库可能会有所帮助.我曾经在一个Firefox插件上工作,它处理单词和各种简单到复杂的关联.看起来WordNet对您非常有用.

这是MySQL格式.而这一个(网站存档链接)使用Wordnet v3.0数据,而不是较旧的Wordnet 2.0数据.


dan*_*ben 31

你可以在infochimps.org上找到你需要的东西.

他们有350,000个简单(即非复合)单词的列表可供免费下载.

单词列表 - 350,000+简单英语单词

关于其他语言,您可能想要了解维基词典.以下是所有数据库备份的链接- 信息不是很有可能组织的,但如果它们有语言,您可以下载SQL格式的数据.

  • 令人讨厌的是,infochimps文件是**.xls**(一个excel文件,其中的单词分为6个工作表!)...我已将所有**354986个单词**解压缩为**txt文件**:https:/ /github.com/nelsonic/english-words (32认同)
  • 下载链接已更改 - http://www.infochimps.com/datasets/word-list-350000-simple-english-words-excel-readable (6认同)
  • 看起来他们包含拼写错误的单词,比如_tecnology_ - 大概是因为他们收集了网络上出现的所有内容.因此它对密码破解/验证有好处,但对于需要真实单词的应用程序(如拼写检查程序等)则不好. (5认同)

rdm*_*rdm 11

我没有看到这里提到的http://wordlist.sourceforge.net/,但如果我正在寻找这样的东西,那就是我要开始的地方(当我偶然发现这个问题时,我就是这样).

如果你找不到你想要的东西,你想要的是一个英文单词列表,那么你应该花一些额外的时间来描述如何识别你想要的东西.


JW.*_*JW. 8

没有"完整"列表这样的东西.不同的人有测量不同的方式-例如,他们可能包括俚语,新词,多字词组,进攻方面,外来词,动词的变化,等等.有些人甚至算了一百万字!所以你必须在单词列表中决定你想要什么.

  • 谢谢你的链接.一个非常有启发性的读物,关于英语中有多少单词,以及试图确定它们的最终数量是徒劳的.有关更简洁和最新的阅读,还有以下内容:https://en.oxforddictionaries.com/explore/language-questions/how-many-words-are-there-in-the-english-language. (3认同)