相关疑难解决方法(0)

一些NLP与Python中的语法,标记,词干和词义消歧有关

背景(TLDR;为完成而提供)

寻求针对奇怪要求的最佳解决方案的建议. 我是大学四年级的(文学)学生,只有我自己的编程指导.我对Python有足够的能力,我不会在实现我发现的解决方案(大部分时间)和开发它们时遇到麻烦,但是由于我的新意,我正在寻找有关解决这个特殊问题的最佳方法的建议.

已经使用NLTK,但与NLTK书中的示例不同.我已经在使用NLTK的很多东西了,特别是WordNet,所以这些材料对我来说并不陌生.我读过大部分的NLTK书.我更懂得如何处理,如果我试图分析现有的文本,或者目标文本是散文般的-但我的应用程序是专注于诗歌,特别是对即时构建诗意文本的基础上,不可预见的输入来自用户.

我正在使用零碎的原子语言.我的应用程序逐字移动:每轮,几个用户输入单词(每个用户一个单词).我的程序试图统一或组合这些输入词以产生单个输出词.我已经开发了字选择算法 - 它利用WordNet的各种功能来提出单字结果.结果是WordNet synset的形式 - 一个未反射的单词(剥离多个和紧张).结果被附加到"诗"的文本中(在一些空格之后).添加所产生的字会影响用户对什么词来扔进锅里下一个选择,那就是如何这个游戏/程序一起运动,在每次添加一个机器演变字的诗句.

问题:如何以语法合理的方式影响结果?没有任何语法处理,结果只是一个字典可搜索的单词列表,没有单词之间的协议.第一步是我的应用程序根据上下文来阻止/复数/共轭/变形根词.(我所说的"根词"是来自WordNet和/或其人类可读等同物的同义词.)想象一下,诗中已经有一些语法敏感的文本开始,我的应用程序需要反映一个新的结果 - 同意现有序列的词.如果它只是像一个3字的窗口或其他东西一样工作,这很好,但我正在寻找有关最佳操作顺序的建议.我希望有人可以给我一些指示(我希望它很难实现,但我想确保我从正确的想法开始).

示例场景(更少上下文更多问题)

让我们假设我们已经有了一首诗,用户正在向其中添加新的输入.新结果需要以语法合理的方式进行变换.

The river bears no empty bottles, sandwich papers,   
Silk handkerchiefs, cardboard boxes, cigarette ends  
Or other testimony of summer nights. The nymphs
Run Code Online (Sandbox Code Playgroud)

比方说,我的算法已经采取了一批从输入的用户,现在需要打印的4个可能接下来的话1 /同义集(非正式代表): ['departure', 'to have', 'blue', 'quick'].在我看来'blue'应该被抛弃; 'The nymphs blue'似乎语法奇怪/不太可能.从那里它可以使用这些动词中的任何一个.

如果它选择'to have'的结果可以被合理地活用为'had','have','having','will have','would have',等(但不包括'has').(由此产生的结果将是类似的'The nymphs have',明智的结果将为未来的结果提供更好的背景......)

'depature'在这种情况下,我希望成为一个有效的可能性; …

python tagging grammar nlp nltk

10
推荐指数
1
解决办法
2404
查看次数

安装pylinkgrammar时缺少文件

http://pypi.python.org/pypi/pylinkgrammar

我在尝试安装pylinkgrammar时遇到错误:

Running setup.py egg_info for package pylinkgrammar

Installing collected packages: pylinkgrammar
  Running setup.py install for pylinkgrammar
...
running build_ext

building 'pylinkgrammar/_clinkgrammar' extension

swigging pylinkgrammar/link_grammar.i to pylinkgrammar/link_grammar_wrap.c

swig -python -o pylinkgrammar/link_grammar_wrap.c pylinkgrammar/link_grammar.i

gcc -pthread -fno-strict-aliasing -DNDEBUG -g -fwrapv -O2 -Wall -Wstrict-prototypes -fPIC -I/usr/include/python2.7 -c pylinkgrammar/link_grammar_wrap.c -o build/temp.linux-x86_64-2.7/pylinkgrammar/link_grammar_wrap.o

pylinkgrammar/link_grammar_wrap.c:2973:40: fatal error: link-grammar/link-includes.h: No such file or directory

compilation terminated.

error: command 'gcc' failed with exit status 1
Run Code Online (Sandbox Code Playgroud)

c python gcc

9
推荐指数
3
解决办法
899
查看次数

标签 统计

python ×2

c ×1

gcc ×1

grammar ×1

nlp ×1

nltk ×1

tagging ×1