ocamlyacc的详细错误

oso*_*maz 2 ocaml yacc

在野牛中,添加就足够了

%verbose-error 
Run Code Online (Sandbox Code Playgroud)

到文件,使解析器错误更详细.有没有办法获得与ocamlyacc类似的功能?

是一个类似问题的答案,但我无法做出任何改变.这就是我调用词法分析器和解析器函数的方法:

let rec foo () =
    try
    let line = input_line stdin in
    (try
       let _ = (Parser.latexstatement lexer_token_safe (Lexing.from_string line)) in
         print_string ("SUCCESS\n")
     with
           LexerException s          -> print_string ("$L" ^ line ^ "\n")
         | Parsing.Parse_error       -> print_string ("$P" ^ line ^ "\n")
         | _                         -> print_string ("$S " ^ line ^ "\n"));
    flush stdout;
    foo ();
    with
    End_of_file -> ()
;;
foo ();;
Run Code Online (Sandbox Code Playgroud)

did*_*erc 9

我不认为ocamlyacc中有一个选项可以自动执行您想要的操作,所以让我尝试在下面提供一些说明,说明可以采取哪些措施来处理语法错误并获得更多有用的消息.也许这不是你问的.

实际上,错误必须在词法和解析错误中分开,具体取决于错误发生在解析过程的哪个阶段.

  • mll文件中,Failure如果出现意外模式,将引发异常
  • mly文件中,它是一个Parsing.Parse_error将生成的异常

所以你有几个解决方案:

  • 让词法分析器和解析器代码引发异常,并在调用它们的代码中捕获它们
  • 用它们中的任何一个来实现错误的具体情况
    • 捕获词法分析器的所有规则(或者必要时更一些特定的模式)
    • 使用error解析器规则中的特殊终端来捕获特定位置的错误

在任何情况下,您都必须创建函数以获取有关错误在源中的位置的信息. Lexing并且Parsing都使用以下字段location定义的记录Lexing:

  • pos_fname:当前处理的文件的名称
  • pos_lnum:文件中的行号
  • pos_bol:行开头的文件开头的字符编号
  • pos_cnum:当前位置的字符编号

lexbuf词法分析器使用的变量有这样的两个值跟踪被lexed当前标记(lexeme_start_plexeme_curr_pLexing让你访问这些数据).解析器有四个跟踪即将合成的当前符号(或非终端),以及当前规则项,可以使用Parsing函数(rhs_start_pos以及rhs_end_pos,symbol_start_possymbol_end_pos)来检索.

这里有一些函数可以生成更详细的异常:

exception LexErr of string
exception ParseErr of string

let error msg start finish  = 
    Printf.sprintf "(line %d: char %d..%d): %s" start.pos_lnum 
          (start.pos_cnum -start.pos_bol) (finish.pos_cnum - finish.pos_bol) msg

let lex_error lexbuf = 
    raise ( LexErr (error (lexeme lexbuf) (lexeme_start_p lexbuf) (lexeme_end_p lexbuf)))

let parse_error msg nterm =
    raise ( ParseErr (error msg (rhs_start_p nterm) (rhs_end_p nterm)))
Run Code Online (Sandbox Code Playgroud)

和一些基本用例:

解析器:%令牌ERR

/* ... */

wsorword:
    WS                 { $1 }
  | WORD            { $1 }
  | error             { parse_error "wsorword" 1; ERR "" } /* a token needed for typecheck */
;
Run Code Online (Sandbox Code Playgroud)

词法分析器:

rule lexer = parse
(*  ... *)
(* catch all pattern *)
| _                      { lex_error lexbuf }
Run Code Online (Sandbox Code Playgroud)

剩下要做的就是修改顶级函数以捕获异常并处理它们.

最后,出于调试目的,有一个set_trace函数可Parsing用于启用解析引擎使用的状态机的显示消息:它跟踪自动机的所有内部状态更改.