1 scala dataframe apache-spark
wordsDF = sqlContext.createDataFrame([('cat',), ('elephant',), ('rat',), ('rat',), ('cat', )], ['word'])
Run Code Online (Sandbox Code Playgroud)
这是一种从python中的元组列表创建数据框的方法。如何在Scala中做到这一点?我是Scala的新手,在解决它时遇到了问题。
任何帮助将不胜感激!
一种简单的方法
val df = sc.parallelize(List( (1,"a"), (2,"b") )).toDF("key","value")
Run Code Online (Sandbox Code Playgroud)
所以 df.show
+---+-----+
|key|value|
+---+-----+
| 1| a|
| 2| b|
+---+-----+
Run Code Online (Sandbox Code Playgroud)
请参阅“以编程方式指定架构”中的工作示例以构建DataFramewith createDataFrame。