小编Ish*_*mar的帖子

在Dataframes中将日期从String转换为Date格式

我试图使用to_date函数将一个String格式的列转换为Date格式,但是它返回的Null值.

df.createOrReplaceTempView("incidents")
spark.sql("select Date from incidents").show()

+----------+
|      Date|
+----------+
|08/26/2016|
|08/26/2016|
|08/26/2016|
|06/14/2016|

spark.sql("select to_date(Date) from incidents").show()

+---------------------------+
|to_date(CAST(Date AS DATE))|
 +---------------------------+
|                       null|
|                       null|
|                       null|
|                       null|
Run Code Online (Sandbox Code Playgroud)

Date列采用String格式:

 |-- Date: string (nullable = true)
Run Code Online (Sandbox Code Playgroud)

apache-spark apache-spark-sql

35
推荐指数
5
解决办法
12万
查看次数

如何在不使用Scala案例类的情况下指定CSV文件的架构?

我正在将CSV文件加载到DataFrame中,如下所示.

val conf=new SparkConf().setAppName("dataframes").setMaster("local")
val sc=new SparkContext(conf)
val spark=SparkSession.builder().getOrCreate()
import spark.implicits._

val df = spark.
  read.  
  format("org.apache.spark.csv").
  option("header", true).
  csv("/home/cloudera/Book1.csv")
scala> df.printSchema()
root
 |-- name: string (nullable = true)
 |-- address: string (nullable = true)
 |-- age: string (nullable = true)
Run Code Online (Sandbox Code Playgroud)

如何将age列更改为类型Int

scala apache-spark apache-spark-sql

15
推荐指数
2
解决办法
2万
查看次数

标签 统计

apache-spark ×2

apache-spark-sql ×2

scala ×1