use*_*286 4 python nltk wordnet python-2.7 nltk-book
我正在使用专门针对阿拉伯语的(OMW)wordnet 来开发python/nltk。所有功能都可以在英语中正常工作,但当我使用“arb”标签时,我似乎无法执行其中任何功能。唯一有效的方法是lemma_names
从给定的阿拉伯语同义词集中提取 the 。
下面的代码可以与 u'arb' 配合使用:\n输出是阿拉伯语引理列表。
\n\nfor synset in wn.synsets(u'\xd8\xb9\xd8\xa7\xd9\x85',lang=('arb')):\n for lemma in synset.lemma_names(u'arb'):\n print lemma\n
Run Code Online (Sandbox Code Playgroud)\n\n当我尝试使用同义词、定义、示例、上位词执行与上面的代码相同的逻辑时,我收到一条错误消息:
\n\nTypeError: hyponyms() takes exactly 1 argument (2 given)\n
Run Code Online (Sandbox Code Playgroud)\n\n(如果我提供'arb'
标志)或
KeyError: u'arb'\n
Run Code Online (Sandbox Code Playgroud)\n\n如果我编写以下代码,这是不起作用的代码之一 synset.hyponyms(u'arb')
:
for synset in wn.synsets(u'\xd8\xb9\xd8\xa7\xd9\x85',lang=('arb')):\n for hypo in synset.hyponyms(): #print the hyponyms in English not Arabic\n print hypo\n
Run Code Online (Sandbox Code Playgroud)\n\n这是否意味着我无法使用 wn.all_synsets 和其他内置函数来提取所有阿拉伯语同义词集、上位词等?
\nnltk 的开放多语言 Wordnet 的所有同义词集都有英文名称,因为它是一个以原始英语 Wordnet 为中心的多语言数据库。同义词集模型含义,因此它们与语言无关,并且不能以特定语言请求。但每个同义词集都与 OMW 涵盖的语言的引理相关联。一旦你有了一些同义词集(原文、下位词等),只需再次询问阿拉伯语引理即可:
\n\n>>> for synset in wn.synsets(u\'\xd8\xb9\xd8\xa7\xd9\x85\',lang=(\'arb\')):\n... for hypo in synset.hyponyms():\n... for lemma in hypo.lemmas("arb"):\n... print(lemma)\n... \nLemma(\'waft.v.01.\xd8\xa5\xd9\x90\xd9\x86\xd9\x92\xd8\xa8\xd8\xb9\xd8\xab\')\nLemma(\'waft.v.01.\xd8\xa7\xd9\x86\xd8\xa8\xd8\xb9\xd8\xab\')\nLemma(\'waft.v.01.\xd8\xa5\xd9\x86\xd8\xa8\xd8\xb9\xd8\xab_\xd9\x83\xd8\xa7\xd9\x84\xd8\xb1\xd8\xa7\xd8\xa6\xd8\xad\xd8\xa9_\xd8\xa7\xd9\x84\xd8\xb9\xd8\xb7\xd8\xb1\xd8\xa9\')\nLemma(\'waft.v.01.\xd8\xa5\xd9\x90\xd9\x86\xd9\x92\xd8\xaf\xd9\x81\xd8\xb9\')\nLemma(\'waft.v.01.\xd8\xa5\xd9\x90\xd9\x86\xd9\x92\xd8\xb7\xd9\x84\xd9\x82\')\nLemma(\'waft.v.01.\xd8\xa7\xd9\x86\xd8\xb7\xd9\x84\xd9\x82\')\nLemma(\'waft.v.01.\xd8\xad\xd9\x85\xd9\x84_\xd8\xa8\xd8\xae\xd9\x81\xd8\xa9\')\nLemma(\'waft.v.01.\xd8\xaf\xd9\x81\xd8\xb9\')\nLemma(\'calendar_year.n.01.\xd8\xb3\xd9\x86\xd8\xa9_\xd8\xb4\xd9\x85\xd9\x92\xd8\xb3\xd9\x90\xd9\x8a\xd9\x91\xd8\xa9\')\nLemma(\'calendar_year.n.01.\xd8\xb3\xd9\x86\xd8\xa9_\xd9\x85\xd8\xaf\xd9\x86\xd9\x90\xd9\x8a\xd9\x91\xd8\xa9\')\nLemma(\'fiscal_year.n.01.\xd8\xb3\xd9\x86\xd8\xa9_\xd8\xb6\xd8\xb1\xd9\x90\xd9\x8a\xd8\xa8\xd9\x90\xd9\x8a\xd9\x91\xd8\xa9\')\nLemma(\'fiscal_year.n.01.\xd8\xb3\xd9\x86\xd8\xa9_\xd9\x85\xd8\xa7\xd9\x84\xd9\x90\xd9\x8a\xd9\x91\xd8\xa9\')\n
Run Code Online (Sandbox Code Playgroud)\n\n换句话说,引理是多语言的,而同义词集则不是。
\n 归档时间: |
|
查看次数: |
2103 次 |
最近记录: |