标签: gate

C++中的自然语言处理

我正在开发一个已经拥有C++基础的项目.我想有一个插件用于一些自然语言处理.我非常喜欢GATE,但我不确定是否值得启动JVM并将项目拆分为C++和Java部分.我注意到UIMA有一个C++框架,但没有尝试过,但似乎比GATE少了.

有没有人知道比在C++中以某种方式包装GATE更好的选择(例如,在C++中更好的NLP库)?如果我用C++包装GATE,最好的方法是什么?SOA?

谢谢

c++ java nlp gate uima

2
推荐指数
1
解决办法
6381
查看次数

本体和地名词典之间的区别?

根据gate.ac.uk,地名词典是:

地名词典由一组列表组成,这些列表包含诸如城市,组织,星期几等实体的名称。这些列表用于查找文本中这些名称的出现,例如,用于命名实体的识别任务。“地名词典”一词通常既可用于实体列表集,又可用于处理资源,该资源使用这些列表来查找文本中名称的出现。

这与“本体论”有何不同?

semantic-web ontology gate

2
推荐指数
1
解决办法
203
查看次数

Gate - 从注释集中提取单个带注释的文本

我正在尝试提取由默认ANNIE处理资源生成的注释集的各个文本值.

当我遍历注释集时,每个条目仅给出注释引用但不提供.value()方法的开始和结束位置.是否有一种简单的方法来获取值,或者我是否需要使用FileWriter或某些等效项来直接从我使用注释的开始和结束位置处理的语料库中提取值?

annotTypesRequired.add("Location");

Set<Annotation> organization = new HashSet<Annotation>(
                defaultAnnotSet.get(annotTypesRequired));
Run Code Online (Sandbox Code Playgroud)

java filewriter gate

1
推荐指数
1
解决办法
1801
查看次数

在GATE中多行注释句子

我在GATE中的句子拆分器模块有问题。我的文字是这样的:

Social history. He drank a lot in his young age. He did
not attend a school. He was depressed of his condition.
Run Code Online (Sandbox Code Playgroud)

虽然我们确定句子应该像

Sentence 1: Social history.
Sentence 2: He drank a lot in his young age.
Sentence 3: He did not attend a school.
Sentence 4: He was depressed of his condition.
Run Code Online (Sandbox Code Playgroud)

ANNIE句子拆分器认识到,不同行中的文本应分组在不同的句子中,因此得出以下结果:

Sentence 1: Social history.
Sentence 2: He drank a lot in his young age.
Sentence 3: He did 
Sentence 4: not attend a school.
Sentence …
Run Code Online (Sandbox Code Playgroud)

nlp gate java-annotations

1
推荐指数
1
解决办法
190
查看次数

在groovy中将for循环的结果写入csv

当前,我正在使用Groovy创建嵌套的for循环,该循环将对象的内容打印到旨在作为分隔数据行的字符串中。我想将这些字符串输出到一个csv文件,而不是打印它们。

这是代码:

for (doc in docs) {
    AnnotationSet row = doc.getAnnotations("Final").get("Row")
    AnnotationSet BondCounsel = doc.getAnnotations("Final").get("Bond_Counsel")
    AnnotationSet PurchasePrice = doc.getAnnotations("Final").get("PurchasePrice")
    AnnotationSet DiscountRate = doc.getAnnotations("Final").get("DiscountRate")
    for (b in BondCounsel) {
        for (d in DiscountRate) {
            for (r in row) {
                for (p in PurchasePrice) {
    println(doc.getFeatures().get("gate.SourceURL") + "|"
    + "mat_amount|" + r.getFeatures().get("MatAmount") + "|"
    + "orig_price|" + p.getFeatures().get("VAL") + "|"
    + "orig_yield|" + r.getFeatures().get("Yield") + "|"
    + "orig_discount_rate|" + d.getFeatures().get("rate")+ "|"
    + "CUSIP|" + r.getFeatures().get("CUSIPVAL1") + r.getFeatures().get("CUSIPVAL2") + r.getFeatures().get("CUSIPVAL3") + "|"
    + …
Run Code Online (Sandbox Code Playgroud)

java groovy gate

1
推荐指数
1
解决办法
2724
查看次数

使用maven时向GATE添加新的ANNIE规则

如果我使用Ant构建脚本,那么如果我将它们放在正确的文件夹中,它将包含我创建的JAPE文件.但是如果我想从maven使用GATE,我如何包含我自己的JAPE文件?

nlp maven gate

0
推荐指数
1
解决办法
1078
查看次数

在大型数据集上使用GATE时获取OOM

我对NLP很新,我正在使用GATE.如果我运行大数据集(包含7K +记录)的代码,我会收到OOM异常.下面是发生异常的代码.

    /**
 * Run ANNIE
 * 
 * @param controller
 * @throws GateException
 */
public void execute(SerialAnalyserController controller)
        throws GateException {
    TestLogger.info("Running ANNIE...");
    controller.execute();     /**** GateProcessor.java:217 ***/

    // controller.cleanup();
    TestLogger.info("...ANNIE complete");
}
Run Code Online (Sandbox Code Playgroud)

这是日志:

    Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
at java.util.HashMap.addEntry(Unknown Source)
at java.util.HashMap.put(Unknown Source)
at java.util.HashMap.putAll(Unknown Source)
at gate.annotation.AnnotationSetImpl.<init>(AnnotationSetImpl.java:111)
at gate.jape.SinglePhaseTransducer.attemptAdvance(SinglePhaseTransducer.java:448)
at gate.jape.SinglePhaseTransducer.transduce(SinglePhaseTransducer.java:287)
at gate.jape.MultiPhaseTransducer.transduce(MultiPhaseTransducer.java:168)
at gate.jape.Batch.transduce(Batch.java:352)
at gate.creole.Transducer.execute(Transducer.java:116)
at gate.creole.SerialController.runComponent(SerialController.java:177)
at gate.creole.SerialController.executeImpl(SerialController.java:136)
at gate.creole.SerialAnalyserController.executeImpl(SerialAnalyserController.java:67)
at gate.creole.AbstractController.execute(AbstractController.java:42)
at in.co.test.GateProcessor.execute(GateProcessor.java:217)
Run Code Online (Sandbox Code Playgroud)

我想知道执行函数究竟发生了什么以及如何解决它.谢谢.

java nlp gate

0
推荐指数
1
解决办法
989
查看次数

句子分类(分类)

我一直在阅读有关文本分类的文章,并发现了几种可用于分类的Java工具,但我仍然想知道:文本分类是否与句子分类相同!

有没有专注于句子分类的工具?

java nlp weka gate

-1
推荐指数
1
解决办法
1948
查看次数

标签 统计

gate ×8

java ×5

nlp ×5

c++ ×1

filewriter ×1

groovy ×1

java-annotations ×1

maven ×1

ontology ×1

semantic-web ×1

uima ×1

weka ×1