将解析器组合器应用于案例类

adl*_*son 4 scala parser-combinators

我正在使用Scala的Parser Combinators来解析一个字符串(没有新行,人为的例子).

字符串由许多不同的部分组成,我想分别提取并填充案例类.

case class MyRecord(foo: String, bar: String, baz: String, bam: String, bat: String)

object MyParser extends scala.util.parsing.combinator.RegexParsers {

  val foo: Parser[String] = "foo"
  val bar: Parser[String] = "bar"
  val baz: Parser[String] = "baz"
  val bam: Parser[String] = "bam"
  val bat: Parser[String] = "bat"

  val expression: Parser[MyRecord] =
    foo ~ bar ~ baz ~ bam ~ bat ^^ {
      case foo ~ bar ~ baz ~ bam ~ bat => MyRecord(foo, bar, baz, bam, bat)
    }

}
Run Code Online (Sandbox Code Playgroud)

这非常有效,但是有没有办法将匹配结果的各个部分直接应用到案例类而不解构?

val expression: Parser[MyRecord] =
  foo ~ bar ~ baz ~ bam ~ bat ^^ MyRecord
Run Code Online (Sandbox Code Playgroud)

进一步的信息:我正在解析的字符串非常冗长和复杂(实际上,它是一个完整的文件,包含很长的复杂字符串),因此更改为regexp是不可能的.

dk1*_*k14 5

Shapeless2库可以实现.对于给定的:

 object MyParser extends scala.util.parsing.combinator.RegexParsers   
 import MyParser._     

 val foo: Parser[String] = "foo"
 val bar: Parser[String] = "bar"
 val car: Parser[String] = "car"

 case class Record(f: String, b: String, c: String)
Run Code Online (Sandbox Code Playgroud)

您可以使用以下的通用foldRightintead 组合解析器~:

 import shapeless._
 object f extends Poly2 { 
  implicit def parser[T, U <: HList] = 
   at[Parser[T], Parser[U]]{(a, b) => 
     for {aa <- a; bb <- b} yield aa :: bb  
   }
 }

 val p: Parser[Record] = (foo :: bar :: car :: HNil)
    .foldRight(success(HNil))(f).map(Generic[Record].from)
Run Code Online (Sandbox Code Playgroud)

结果:

 scala> parseAll(p, "foo bar car").get
 res50: Record = Record(foo,bar,car)
Run Code Online (Sandbox Code Playgroud)

PS内置scala功能的问题在于它们构建了~基于类型的二叉树,这种树难以遍历并变平为元组.Shapeless解决了这个问题 - 它有自己::的二叉树叫做HList,它是相似的但是有一些有趣的操作,比如转换为元组或case类(可能是基于宏的).在这个例子中,我使用foldLeft构建Shapeless-hlist和for-comprehension(扩展到flatMap解析器)来组合解析器,因为它们具有monadic性质.在无形状中,您必须将foldLeft处理程序定义为通用含义集,可以处理通用输入(如TU).

您可以重用我的f对象以类型安全的方式组合任何解析器(您可以在这里组合甚至不同的类型 - 这很好).


第二,不那么通用,方式是:

implicit class as2[A, B](t: Parser[A ~ B]){ def ^^^^[T] (co: (A, B) => T) = t map {tt => val (a ~ b) = tt; co(a, b)} }
implicit class as3[A, B, C](t: Parser[A ~ B ~ C]){ def ^^^^[T] (co: (A, B, C) => T) = t map {tt => val (a ~ b ~ c) = tt; co(a, b, c)} }
...
implicit class as21 ...
Run Code Online (Sandbox Code Playgroud)

用法:

scala> val p = foo ~ bar ~ car ^^^^ Record
p: MyParser.Parser[Record] = Parser ()

scala> parseAll(p, "foo bar car").get
res53: Record = Record(foo,bar,car)
Run Code Online (Sandbox Code Playgroud)

它不是那么酷,但不需要外部库.