语言解析器和字符转义

Question

语言解析器和字符转义

我还没有找到一个例子 - 如何处理字符转义。我找到了一个代码示例：

static void Main(string[] args)
{
    string text = "'test \\\' text'";
    var result = Grammar.QuotedText.End().Parse(text);
}

public static class Grammar
{
    private static readonly Parser<char> QuoteEscape = Parse.Char('\\');
    private static Parser<T> Escaped<T>(Parser<T> following)
    {
        return from escape in QuoteEscape
               from f in following
               select f;
    }

    private static readonly Parser<char> QuotedTextDelimiter = Parse.Char('\'');

      private static readonly Parser<char> QuotedContent =
          Parse.AnyChar.Except(QuotedTextDelimiter).Or(Escaped(QuotedTextDelimiter));

    public static Parser<string> QuotedText = (
        from lquot in QuotedTextDelimiter
        from content in QuotedContent.Many().Text()
        from rquot in QuotedTextDelimiter
        select content
        ).Token();
}

Run Code Online (Sandbox Code Playgroud)

如果文本不包含转义，它会成功解析文本，但不会解析带有转义字符的文本。

Answer 1

jas*_*per 6

我有一个类似的问题，使用"分隔符和\转义字符解析字符串。我为此编写了一个简单的解析器（可能不是最优雅的解决方案），它似乎运行良好。

您应该能够适应它，因为唯一的区别似乎是分隔符。

var escapedDelimiter = Parse.String("\\\"").Text().Named("Escaped delimiter");
var singleEscape = Parse.String("\\").Text().Named("Single escape character");
var doubleEscape = Parse.String("\\\\").Text().Named("Escaped escape character");
var delimiter = Parse.Char('"').Named("Delimiter");
var simpleLiteral = Parse.AnyChar.Except(singleEscape).Except(delimiter).Many().Text().Named("Literal without escape/delimiter character");

var stringLiteral = (from start in delimiter
            from v in escapedDelimiter.Or(doubleEscape).Or(singleEscape).Or(simpleLiteral).Many()
            from end in delimiter
            select string.Concat(start) + string.Concat(v) + string.Concat(end));

Run Code Online (Sandbox Code Playgroud)

关键部分是from v in ...。它首先搜索转义分隔符，然后搜索双转义字符，然后搜索单个转义字符，然后尝试将其解析为没有任何转义或分隔符的“simpleLiteral”。更改此处的顺序会导致解析错误（例如，如果您尝试在转义分隔符之前解析单个转义符，您将永远找不到后者，双转义符和单转义符也是如此）。此步骤重复多次，直到出现from v in ...未转义的定界符（不处理未转义的定界符，但from end in delimiter当然会处理）。

归档时间：	10 年，4 月前
查看次数：	1686 次
最近记录：	9 年，8 月前