小编Jay*_*raj的帖子

e = net.train(input_part1, output_part1, show=1, epochs=100, goal=0.0001)
e = net.train(input_part2, output_part2, show=1, epochs=100, goal=0.0001)
e = net.train(input_part3, output_part3, show=1, epochs=100, goal=0.0001)

Run Code Online (Sandbox Code Playgroud)

将前两部分的火车呼叫将有效预测神经网络参数 - 或者 - 这只会使用最后的训练数据吗？

python neural-network

Jay*_*raj

2012 10-21

5
推荐指数

1
解决办法

1225
查看次数

哪里可以获得新闻摘要语料库？

是否有任何公开的新闻+摘要语料库可用于自动摘要.如果是的话,请你提供方法来获得它吗？

nlp text-mining

Jay*_*raj

lucky-day

5
推荐指数

1
解决办法

1086
查看次数

词性标注:标记未知单词

在词性标注器中,使用HMM by确定给定句子的最佳可能标签

    P(T*) = argmax P(Word/Tag)*P(Tag/TagPrev)
              T

Run Code Online (Sandbox Code Playgroud)

但是当"Word"没有出现在训练语料库中时,P(Word/Tag)在给定所有可能的标签时产生ZERO,这就没有留下选择最佳标签的空间.

我尝试过几种方法,

1)为所有未知单词分配少量概率,P(UnknownWord/AnyTag)~Epsilon ...意味着通过分配常数概率完全忽略未知单词的P(字/标记).因此对未知单词做出决策是先验概率..正如预期的那样,它没有产生好的结果.

拉普拉斯平滑我很困惑.我不知道(1)和这之间有什么区别.我理解拉普拉斯平滑的方法为所有未知和已知单词添加了常数概率(lambda).因此,所有未知单词将获得恒定概率(lambda的分数),并且已知单词概率将相对相同,因为所有单词的概率增加了LAMBDA.拉普拉斯平滑是否与前一个相同？

*)有没有更好的处理未知单词的方法？

nlp pos-tagger oov

Jay*_*raj

2013 05-29

4
推荐指数

1
解决办法

5319
查看次数

标签统计

nlp ×3

machine-learning ×2

text-mining ×2

classification ×1

information-extraction ×1

information-retrieval ×1

neural-network ×1

oov ×1

pos-tagger ×1

python ×1

svm ×1

信息提取和文本挖掘有什么区别？

为什么偏差项在岭回归中没有正则化？

SVM分类是否始终产生独特的解决方案？

python neurolab - 我们可以用许多输入部分逐步训练吗？

哪里可以获得新闻摘要语料库？

词性标注:标记未知单词

标签 统计

小编Jay_raj的帖子

标签统计