我想在pyspark.lf中读取json或xml文件,我的文件被分成多行
rdd= sc.textFIle(json or xml)
Run Code Online (Sandbox Code Playgroud)
输入
{
" employees":
[
{
"firstName":"John",
"lastName":"Doe"
},
{
"firstName":"Anna"
]
}
Run Code Online (Sandbox Code Playgroud)
输入分布在多条线上.
预期产出 {"employees:[{"firstName:"John",......]}
如何使用pyspark在一行中获取完整的文件?
请帮助我,我是新来的火花.