词表来源

war*_*ren 12 language

我正在寻找多种语言的名词、副词、形容词和动词的来源。

我希望这些列表已经分开,而不必通过手动重新创建所述列表来通过OED(和非英语等效项)。

我并不真正关心定义,我知道有些词可以是多个词类——这很好——像“many”这样的词可以是名词或形容词,并且可以出现在两个列表中。

这里有人知道这样的来源吗?如果没有,有人能指出我正确的方向吗?

我可以接受以下任何一种格式(或类似的,如果人们有想法):

  • CSV: <word>, noun (y/n), verb (y/n), adverb (y/n), adjective (y/n)
  • 纯文本文件,如“名词”、“动词”等
  • 一个mysql表
  • 等等

小智 9

我在一些项目中使用了普林斯顿大学的WordNet。这是一个英文词汇数据库。Global WordNet是该项目的扩展,试图对所有语言执行相同的操作。

您可能还对http://wordnet.princeton.edu/wordnet/related-projects/ 上的相关项目感兴趣


Mat*_*ine 5

这可能根本没有帮助,我不知道。但是 MediaWiki 有一个api用于列出属于某个类别的所有页面。您可以尝试在 Wiktionary.org 上使用它。

笔记:

  • 每个查询只返回 500 个结果。但是,最后,它还指定了一个参数以在另一个查询中使用以获取接下来的 500 个结果。
  • 它包括指定类别中的所有内容,甚至其他子类别。
  • 结果似乎按字母顺序排列,尽管以大写字母开头的所有内容都在小写字母之前。

例子:

希望这会有所帮助,这是我能想到的。