标签: context-free-grammar

S      ::= add
add    ::= mul | add + mul
mul    ::= term | mul * term
term   ::= number | ( S )
number ::= digit | digit number
digit  ::= 0 | 1 | ... | 9

Run Code Online (Sandbox Code Playgroud)

您可以枚举这样的术语:

0
1
0+0
0*0
0+1
(0)
1+0
0*1
0+0*0
00
... etc

Run Code Online (Sandbox Code Playgroud)

我的问题是:有没有办法做相反的事情？也就是说,采用该语法的有效术语,比如说0+0*0,并在这样的枚举中找到它的位置 - 在这种情况下,9？

algorithm grammar haskell context-free-grammar

Mai*_*tor

lucky-day

12
推荐指数

1
解决办法

447
查看次数

如何确定语言是递归还是递归可枚举？

我必须确定一种语言(例如L = {a ^ nb ^ mc ^ s | 0 <= n <= m <= s})是否是常规的,无上下文的,递归的,递归可枚举的或者都不是.

我知道如何确定一个语言是正规(找到DFA或正则表达式的工作)或上下文(找到一个PDA或上下文无关文法的作品); 我知道递归语言有一个总是停止的图灵机器,并且一个递归可枚举的语言有一个可能不会停止的图灵机.

所以问题是:是否有一个快速的标准来确定语言是递归还是递归可枚举或两者都没有？例如,我不需要构建一个PDA来理解语言是无上下文的,我不能通过它需要一个堆栈来看待它; 有没有类似的快速解决问题的方法(希望能省去构建图灵机的麻烦)？

recursion computer-science turing-machines context-free-grammar

Jac*_*cob

lucky-day

11
推荐指数

2
解决办法

1万
查看次数

如何证明乔姆斯基范式中的推导需要2n-1步？

我试图证明以下内容:

如果G是乔姆斯基范式中的无上下文语法,那么对于任何字符串w属于长度n≥1的L(G),它需要恰好2n-1步才能得出w的任何推导.

我该如何证明这一点？

theory grammar context-free-grammar chomsky-normal-form

Chr*_*gro

2015 05-26

11
推荐指数

1
解决办法

7012
查看次数

Drop-in,便携式解析

我每天都会看到关于"如何用regexen做X"的帖子.而对他们中的大多数人的最佳反应似乎就是老实说,"你为什么要用锤子开螺丝？" 但regexen无处不在,语法大多是可移植的,特别是如果你远离花哨的位.

有没有相当于regexen但在功能和可配置性方面更上一层楼的东西？一个"你可以在任何地方使用它"解析各种各样的库,最好用一个光彩照人的简洁DSL作为它的界面？

我有点使用Ragel,但由于预处理步骤,我会毫不犹豫地推荐给某人"使用这个而不是一些毛茸茸的正则表达式".从Obj-C中使用它很尴尬,我认为从一个没有编译链接运行的语言来看它将是非常尴尬的,因为它是标准操作过程的一部分.

我正在寻找的东西将通过"内联在线通用"测试.

(内联)您可以使用其他代码内联编写符号,就像使用正则表达式一样.
(在线)您可以像运行其他代码一样运行生成的解析器,这意味着在Python之类的情况下输入到REPL之后.
(通用)您可以移动到不同的语言/平台,并为解析器使用几乎相同的代码,模数方差.实际上,我对使用Python,Ruby,C,Java和Haskell的东西感到满意.

我所知道的大多数工具都是"在线".他们离线预处理语法并用目标语言(C,Python,Java,C++ ......)吐出代码.它们是独立的工具,它们本身并没有集成到语言环境中.

我有PEG解析器和lex/yacc组合的建议.解析器组合库也可能是一个很好的选择.无论你提出什么建议,我都希望看到它能够满足这些测试要求.您的答案应该通过在Python,C和Haskell中提供可用的演示解析器来证明所提出的解决方案符合内联在线通用要求.演示示例由作者决定,但使用正则表达式应该是痛苦的,但使用适当的解析器则是微不足道的.

regex api dsl parsing context-free-grammar

Jer*_*man

2012 10-13

11
推荐指数

1
解决办法

466
查看次数

NLTK ViterbiParser无法解析不在PCFG规则中的单词

import nltk
from nltk.parse import ViterbiParser

def pcfg_chartparser(grammarfile):
    f=open(grammarfile)
    grammar=f.read()
    f.close()
    return nltk.PCFG.fromstring(grammar)

grammarp = pcfg_chartparser("wsjp.cfg")

VP = ViterbiParser(grammarp)
print VP
for w in sent:
    for tree in VP.parse(nltk.word_tokenize(w)):
        print tree

Run Code Online (Sandbox Code Playgroud)

当我运行上面的代码时,它为句子产生以下输出,"关灯" -

(S(VP(VB转)(PRT(RP关))(NP(DT)(NNS灯))))(p = 2.53851e-14)

但是,它会引起句子的以下错误,"请关掉灯" -

ValueError:语法不包含一些输入词:u"'please'"

我正在通过提供概率上下文无关语法来构建ViterbiParser.它适用于解析具有已经在语法规则中的单词的句子.它无法解析Parser在语法规则中没有看到单词的句子.如何解决这个限制？
我指的是这个任务.

python nlp viterbi nltk context-free-grammar

Kau*_*hal

2016 01-31

11
推荐指数

1
解决办法

1323
查看次数

是否有工具可以在ANTLR和其他形式的BNF之间进行转换？

是否有任何工具可以将ANTLR语法语法转换为其他BNF语法？Backus-Naur形式(BNF,EBNF,ABNF,W3C-BNF,XBNF ......)有几种形式,有规格,例如见此列表.ANTLR语法语法似乎只是通过示例来描述.我知道ANTLR语法文件包含的不仅仅是无上下文语法的规范,但你应该能够至少转换公共子集 - 有人自动完成吗？

antlr bnf context-free-grammar

Jak*_*kob

lucky-day

10
推荐指数

3
解决办法

3214
查看次数

将语法转换为乔姆斯基范式？

将下面的语法转换为乔姆斯基范式.给出所有中间步骤.

S -> AB | aB
A -> aab|lambda
B -> bbA

Run Code Online (Sandbox Code Playgroud)

好的,我做的第一件事就是添加一个新的起始变量 S0

所以现在我有

S0 -> S
S -> AB | aB
A -> aab|lambda
B -> bbA

Run Code Online (Sandbox Code Playgroud)

然后我删除了所有的lambda规则:

S0 -> S
S -> AB | aB | B
A -> aab
B -> bbA | bb

Run Code Online (Sandbox Code Playgroud)

然后我检查S->S并A->B输入不存在的规则.这就是我提出的答案,我是否需要做更多的事情或者我做错了什么？

grammar context-free-grammar chomsky-normal-form

teh*_*man

2015 05-26

10
推荐指数

2
解决办法

2万
查看次数

标签统计

context-free-grammar ×10

grammar ×4

chomsky-normal-form ×2

parsing ×2

algorithm ×1

antlr ×1

api ×1

bnf ×1

computation-theory ×1

computer-science ×1

dsl ×1

formal-languages ×1

haskell ×1

left-recursion ×1

lexical-analysis ×1

nlp ×1

nltk ×1

python ×1

recursion ×1

regex ×1

theory ×1

turing-machines ×1

viterbi ×1

标签 统计

标签统计