LUZ*_*UZO 2 python apache-spark pyspark
我有输入
{'A':'1','B':'1'}
Run Code Online (Sandbox Code Playgroud)
我需要的输出
+----+----+
|A |B |
+----+----+
| 1| 2|
+----+----+
Run Code Online (Sandbox Code Playgroud)
我试过的代码如下。这不起作用
v = {'A': '1','B':'2'}
rdd = sc.parallelize(v.values())
df = spark.createDataFrame(rdd, list(v.keys()))
df.show()
Run Code Online (Sandbox Code Playgroud)
我找到了一种使用 json 解析器的简单方法。
spark = SparkSession.builder.appName('abc').enableHiveSupport().getOrCreate()
sc = spark.sparkContext
dict_lst = {'A': '1','B':'2'}
rdd = sc.parallelize([dict_lst])
print(type(rdd))
df = spark.read.json(rdd)
df.show()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
10153 次 |
| 最近记录: |