相关疑难解决方法(0)

如何使用nltk正则表达式模式来提取特定的短语块?

我写了以下正则表达式来标记某些短语模式

pattern = """
        P2: {<JJ>+ <RB>? <JJ>* <NN>+ <VB>* <JJ>*}
        P1: {<JJ>? <NN>+ <CC>? <NN>* <VB>? <RB>* <JJ>+}
        P3: {<NP1><IN><NP2>}
        P4: {<NP2><IN><NP1>}

    """
Run Code Online (Sandbox Code Playgroud)

此模式将正确标记短语,例如:

a = 'The pizza was good but pasta was bad'
Run Code Online (Sandbox Code Playgroud)

并提供2个短语的所需输出:

  1. 披萨很好吃
  2. 面食很糟糕

但是,如果我的句子是这样的:

a = 'The pizza was awesome and brilliant'
Run Code Online (Sandbox Code Playgroud)

仅匹配短语:

'pizza was awesome' 
Run Code Online (Sandbox Code Playgroud)

而不是所期望的:

'pizza was awesome and brilliant'
Run Code Online (Sandbox Code Playgroud)

如何在我的第二个例子中加入正则表达式模式?

python regex nlp nltk text-chunking

9
推荐指数
1
解决办法
7179
查看次数

标签 统计

nlp ×1

nltk ×1

python ×1

regex ×1

text-chunking ×1