相关疑难解决方法(0)

FileReader fileReader = new FileReader("train.txt");
ObjectStream fileStream = new PlainTextByLineStream(fileReader);
ObjectStream sampleStream = new NameSampleDataStream(fileStream);
TokenNameFinderModel model = NameFinderME.train("pt-br", "train", sampleStream, Collections.<String, Object>emptyMap());
nfm = new NameFinderME(model);

Run Code Online (Sandbox Code Playgroud)

我不知道如果缺少某些东西我是否做错了,但分类不起作用.我假设train.txt错了.

发生的错误是所有令牌都只分类为一种类型.

我的train.txt数据类似于以下示例,但具有更多的条目变化和数量.另一件事是我每次都是从文本中逐字逐句地分类,而不是所有的标记.

<START:distance> 8000m <END>
<START:temperature> 100ºC <END>
<START:weight> 50kg <END>
<START:name> Renato <END>

Run Code Online (Sandbox Code Playgroud)

有人可以证明我做错了吗？

java nlp named-entity-recognition opennlp

Ren*_*ani

2013 07-26

9
推荐指数

1
解决办法

9780
查看次数

使用Java命名实体识别

我想使用命名实体识别(NER)来为数据库中的文本找到足够的标签.我没有使用像NLTK或Lingpipe这样的工具,而是想构建自己的工具.

所以我的问题是:

我应该使用哪种算法？
构建这个工具有多难？

java tags nlp semantics

ani*_*aba

2011 04-07

5
推荐指数

2
解决办法

2348
查看次数

实体提取库

我正在寻找一个进行文本分析和提取实体的库.

实体的类型/分类并不重要,它是对值得关键的东西的识别.在这种情况下,实体Universe是无限的,它不受固定字典的限制.

似乎有几个Web服务可以做到这一点(NERD让你比较这些Web服务的结果:http://nerd.eurecom.fr/documentation非常有用),但我正在寻找一个本地库而不是远程托管服务.我更喜欢Java或.NET,但如果它是一个好的库,我将学习它所写的任何语言.

类似主题上的旧线程很少,我希望在这个领域找到新的开发,和/或在低级NLP库之上构建的库:

有谁知道一个好的图书馆做得体的工作？

nlp named-entity-recognition named-entity-extraction semantics

hi1*_*695

2017 05-23

5
推荐指数

1
解决办法

2084
查看次数

标签统计

nlp ×6

java ×4

named-entity-recognition ×3

semantics ×3

named-entity-extraction ×2

algorithm ×1

dbpedia ×1

lexical-analysis ×1

opennlp ×1

python ×1

tags ×1

标签 统计

标签统计