Lil*_*yAZ 2 ddl apache-spark pyspark
我正在使用该printSchema函数来推断 Json 文件的架构。我想将此函数调用的结果保存在一个变量中,以便逐行解析它,以便我可以提取模式结构并将其转换为 DDL 模式,以便在 hive 中创建表。
如何才能做到这一点?
如果您检查 的源代码printSchema(),您将看到该函数仅执行以下操作:
print(self._jdf.schema().treeString())
Run Code Online (Sandbox Code Playgroud)
因此,您可以按如下方式保存输出:
printSchemaString = df._jdf.schema().treeString()
Run Code Online (Sandbox Code Playgroud)
其他参考:
| 归档时间: |
|
| 查看次数: |
4486 次 |
| 最近记录: |