小编Mik*_*ike的帖子

通过斯坦福解析器提取所有名词,形容词形式和文本

我试图通过斯坦福解析器从给定的文本中提取所有名词和形容词.

我目前的尝试是在Tree-Object的getChildrenAsList()中使用模式匹配来定位如下内容:

(NN paper), (NN algorithm), (NN information), ...      
Run Code Online (Sandbox Code Playgroud)

并将它们保存在一个数组中.

输入句子:

在本文中,我们提出了一种从任意文本中提取语义信息的算法.

结果 - 字符串:

[(S (PP (IN In) (NP (DT this) (NN paper))) (NP (PRP we)) (VP (VBP present) (NP (NP (DT an) (NN algorithm)) (SBAR (WHNP (WDT that)) (S (VP (VBD extracts) (NP (JJ semantic) (NN information)) (PP (IN from) (NP (DT an) (ADJP (JJ arbitrary)) (NN text)))))))) (. .))]
Run Code Online (Sandbox Code Playgroud)

我尝试使用模式匹配,因为我无法在斯坦福解析器中找到返回所有单词类的方法,例如名词.

有没有更好的方法来提取这些单词类或解析器提供特定的方法?

public static void main(String[] args) {
    String str = "In this paper we present an algorithm …
Run Code Online (Sandbox Code Playgroud)

java parsing stanford-nlp

3
推荐指数
1
解决办法
4097
查看次数

标签 统计

java ×1

parsing ×1

stanford-nlp ×1