如何从命令行或火花壳显示镶木地板文件的方案(包括类型)?

sam*_*est 5 scala apache-spark parquet

我已经确定了如何使用spark-shell来显示字段名称,但它很难看并且不包括类型

val sqlContext = new org.apache.spark.sql.SQLContext(sc)

println(sqlContext.parquetFile(path))
Run Code Online (Sandbox Code Playgroud)

打印:

ParquetTableScan [cust_id#114,blar_field#115,blar_field2#116], (ParquetRelation /blar/blar), None
Run Code Online (Sandbox Code Playgroud)

BAR*_*BAR 8

你应该能够做到这一点:

sqlContext.read.parquet(path).printSchema()
Run Code Online (Sandbox Code Playgroud)

来自Spark文档:

// Print the schema in a tree format
df.printSchema()
// root
// |-- age: long (nullable = true)
// |-- name: string (nullable = true)
Run Code Online (Sandbox Code Playgroud)