如何在 PySpark 中将字典转换为数据框

LUZ*_*UZO 2 python apache-spark pyspark

我有输入

{'A':'1','B':'1'}
Run Code Online (Sandbox Code Playgroud)

我需要的输出

+----+----+
|A   |B   |
+----+----+
|   1|   2|
+----+----+
Run Code Online (Sandbox Code Playgroud)

我试过的代码如下。这不起作用

v = {'A': '1','B':'2'}

rdd = sc.parallelize(v.values())

df = spark.createDataFrame(rdd, list(v.keys()))
df.show()
Run Code Online (Sandbox Code Playgroud)

LUZ*_*UZO 5

我找到了一种使用 json 解析器的简单方法。

spark = SparkSession.builder.appName('abc').enableHiveSupport().getOrCreate()
sc = spark.sparkContext
dict_lst = {'A': '1','B':'2'}

rdd = sc.parallelize([dict_lst])
print(type(rdd))
df = spark.read.json(rdd)

df.show()
Run Code Online (Sandbox Code Playgroud)