在Scala中创建数据框

1 scala dataframe apache-spark

wordsDF = sqlContext.createDataFrame([('cat',), ('elephant',), ('rat',), ('rat',), ('cat', )], ['word'])
Run Code Online (Sandbox Code Playgroud)

这是一种从python中的元组列表创建数据框的方法。如何在Scala中做到这一点?我是Scala的新手,在解决它时遇到了问题。

任何帮助将不胜感激!

elm*_*elm 5

一种简单的方法

val df = sc.parallelize(List( (1,"a"), (2,"b") )).toDF("key","value")
Run Code Online (Sandbox Code Playgroud)

所以 df.show

+---+-----+
|key|value|
+---+-----+
|  1|    a|
|  2|    b|
+---+-----+
Run Code Online (Sandbox Code Playgroud)

请参阅“以编程方式指定架构”中的工作示例以构建DataFramewith createDataFrame