我正在尝试制作一个Bison解析器来处理UTF-8字符.我不希望解析器实际解释Unicode字符值,但我希望它将UTF-8字符串解析为字节序列.
现在,Bison生成以下代码,这是有问题的:
if (yychar <= YYEOF)
{
yychar = yytoken = YYEOF;
YYDPRINTF ((stderr, "Now at end of input.\n"));
}
Run Code Online (Sandbox Code Playgroud)
问题是UTF-8字符串的许多字节将具有负值,并且Bison将负值解释为EOF,并停止.
有没有解决的办法?