在 Haskell 中使用 Alex 制作一个解析骰子卷的词法分析器

Question

在 Haskell 中使用 Alex 制作一个解析骰子卷的词法分析器

Zeb*_*Zeb 7 dsl parsing haskell lexer alex

我正在使用 Alex + Happy 为 Haskell 中的 DSL 制作解析器。我的 DSL 使用掷骰子作为可能表达式的一部分。

有时我有一个我想解析的表达式，如下所示：

[some code...]  3D6  [... rest of the code]

Run Code Online (Sandbox Code Playgroud)

这应该大致翻译为：

TokenInt {... value = 3}, TokenD, TokenInt {... value = 6}

Run Code Online (Sandbox Code Playgroud)

我的 DSL 也使用变量（基本上是字符串），所以我有一个特殊的标记来处理变量名。所以，有了这个令牌：

"D"                                 { \pos str -> TokenD pos }
$alpha [$alpha $digit \_ \']*       { \pos str -> TokenName pos str}
$digit+                             { \pos str -> TokenInt pos (read str) }

Run Code Online (Sandbox Code Playgroud)

我现在使用解析时得到的结果是：

TokenInt {... value = 3}, TokenName { ... , name = "D6"}

Run Code Online (Sandbox Code Playgroud)

这意味着我的词法分析器“读取”了一个整数和一个名为“D6”的变量。

我尝试了很多东西，例如，我将令牌D更改为：

$digit "D" $digit                   { \pos str -> TokenD pos }

Run Code Online (Sandbox Code Playgroud)

但这只会消耗数字:(

我可以用数字解析骰子吗？
或者至少解析 TokenInt-TokenD-TokenInt？

PS：我使用 PosN 作为包装器，不确定是否相关。

Answer 1

小智 1

我的方法是将类型扩展TokenD为这样，为了方便起见，我会TokenD Int Int使用包装器basic

$digit+ D $digit+ { dice }
...
dice :: String -> Token
dice s = TokenD (read $ head ls) (read $ last ls)
  where ls = split 'D' s

Run Code Online (Sandbox Code Playgroud)

split可以在这里找到。

这是一个额外的步骤，通常在句法分析过程中完成，但在这里并没有太大影响。

另外，我无法让 Alex 解析$alpha为TokenD而不是TokenName。如果我们有Di而不是D那就没问题了。来自亚历克斯的文档：

当输入流匹配多个规则时，匹配输入流最长前缀的规则获胜。如果仍有多个规则匹配相同数量的字符，则文件中最早出现的规则获胜。

但是这样你的代码应该可以工作。我不知道这是否是亚历克斯的问题。

归档时间：	5 年，7 月前
查看次数：	257 次
最近记录：	5 年，7 月前