小编Bha*_*th 的帖子

将spark数据帧转换为Array [String]

可以告诉我如何在Scala中将Spark数据帧转换为Array [String].

我使用了以下内容.

x =df.select(columns.head, columns.tail: _*).collect()

Run Code Online (Sandbox Code Playgroud)

上面的代码片段给了我一个数组[Row]而不是Array [String]

scala apache-spark spark-dataframe

Bha*_*th

2017 09-10

9
推荐指数

2
解决办法

2万
查看次数

在Intellij 14.1.3中运行Spark应用程序

我试图在Intellij 14.1.3中运行用Scala编写的Spark应用程序.scala sdk是scala-sdk-2.11.6.执行代码时出现以下错误:

Exception in thread "main" java.lang.NoSuchMethodError: scala.collection.immutable.HashSet$.empty()Lscala/collection/immutable/HashSet;
at akka.actor.ActorCell$.<init>(ActorCell.scala:336)
at akka.actor.ActorCell$.<clinit>(ActorCell.scala)
at akka.actor.RootActorPath.$div(ActorPath.scala:159)
at akka.actor.LocalActorRefProvider.<init>(ActorRefProvider.scala:464)
at akka.remote.RemoteActorRefProvider.<init>(RemoteActorRefProvider.scala:124)
at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:62)
at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)
at java.lang.reflect.Constructor.newInstance(Constructor.java:422)
at akka.actor.ReflectiveDynamicAccess$$anonfun$createInstanceFor$2.apply(DynamicAccess.scala:78)
at scala.util.Try$.apply(Try.scala:191)
at akka.actor.ReflectiveDynamicAccess.createInstanceFor(DynamicAccess.scala:73)
at akka.actor.ReflectiveDynamicAccess$$anonfun$createInstanceFor$3.apply(DynamicAccess.scala:84)
at akka.actor.ReflectiveDynamicAccess$$anonfun$createInstanceFor$3.apply(DynamicAccess.scala:84)
at scala.util.Success.flatMap(Try.scala:230)
at akka.actor.ReflectiveDynamicAccess.createInstanceFor(DynamicAccess.scala:84)
at akka.actor.ActorSystemImpl.liftedTree1$1(ActorSystem.scala:584)
at akka.actor.ActorSystemImpl.<init>(ActorSystem.scala:577)
at akka.actor.ActorSystem$.apply(ActorSystem.scala:141)
at akka.actor.ActorSystem$.apply(ActorSystem.scala:118)
at org.apache.spark.util.AkkaUtils$.org$apache$spark$util$AkkaUtils$$doCreateActorSystem(AkkaUtils.scala:122)
at org.apache.spark.util.AkkaUtils$$anonfun$1.apply(AkkaUtils.scala:55)
at org.apache.spark.util.AkkaUtils$$anonfun$1.apply(AkkaUtils.scala:54)
at org.apache.spark.util.Utils$$anonfun$startServiceOnPort$1.apply$mcVI$sp(Utils.scala:1837)
at scala.collection.immutable.Range.foreach$mVc$sp(Range.scala:166)
at org.apache.spark.util.Utils$.startServiceOnPort(Utils.scala:1828)
at org.apache.spark.util.AkkaUtils$.createActorSystem(AkkaUtils.scala:57)
at org.apache.spark.SparkEnv$.create(SparkEnv.scala:223)
at org.apache.spark.SparkEnv$.createDriverEnv(SparkEnv.scala:163)
at org.apache.spark.SparkContext.createSparkEnv(SparkContext.scala:269)
at org.apache.spark.SparkContext.<init>(SparkContext.scala:272)
at LRParquetProcess$.main(LRParquetProcess.scala:9)
at LRParquetProcess.main(LRParquetProcess.scala)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at …

Run Code Online (Sandbox Code Playgroud)

scala apache-spark intellij-14

Bha*_*th

lucky-day

5
推荐指数

2
解决办法

3949
查看次数

在 Spark Streaming 中更改输出文件名

我正在运行一个 Spark 作业，就逻辑而言，它的性能非常好。但是，当我使用 saveAsTextFile 将文件保存在 s3 存储桶中时，我的输出文件的名称采用 part-00000、part-00001 等格式。有没有办法更改输出文件名？

谢谢你。

hadoop apache-spark spark-streaming spark-dataframe

Bha*_*th

2016 06-23

4
推荐指数

1
解决办法

6066
查看次数

检查 Spark 数据框中的每一列是否具有特定值

我们可以使用 Spark-SQL 或 scala 检查 Spark 数据帧中的每一列是否都包含某个字符串（例如“Y”）吗？

我已经尝试过以下方法，但认为它不能正常工作。

df.select(df.col("*")).filter("'*' =='Y'")

Run Code Online (Sandbox Code Playgroud)

谢谢，赛

scala dataframe apache-spark apache-spark-sql

Bha*_*th

2017 09-09

4
推荐指数

1
解决办法

1万
查看次数

标签统计

apache-spark ×4

scala ×3

spark-dataframe ×2

apache-spark-sql ×1

dataframe ×1

hadoop ×1

intellij-14 ×1

spark-streaming ×1

将spark数据帧转换为Array [String]

在Intellij 14.1.3中运行Spark应用程序

在 Spark Streaming 中更改输出文件名

检查 Spark 数据框中的每一列是否具有特定值

标签 统计

小编Bha_th 的帖子

标签统计