小编Ais*_*afi的帖子

使用Scala将字符串转换为Spark的时间戳

我有一个名为的数据帧train,他有以下架构:

root
|-- date_time: string (nullable = true)
|-- site_name: integer (nullable = true)
|-- posa_continent: integer (nullable = true)
Run Code Online (Sandbox Code Playgroud)

我想将date_time列转换为timestamp并使用yeardate_time列中提取的值创建一个新列.

为了清楚起见,我有以下数据框:

+-------------------+---------+--------------+
|          date_time|site_name|posa_continent|
+-------------------+---------+--------------+
|2014-08-11 07:46:59|        2|             3|
|2014-08-11 08:22:12|        2|             3|
|2015-08-11 08:24:33|        2|             3|
|2016-08-09 18:05:16|        2|             3|
|2011-08-09 18:08:18|        2|             3|
|2009-08-09 18:13:12|        2|             3|
|2014-07-16 09:42:23|        2|             3|
+-------------------+---------+--------------+
Run Code Online (Sandbox Code Playgroud)

我想获得以下数据帧:

+-------------------+---------+--------------+--------+
|          date_time|site_name|posa_continent|year    |
+-------------------+---------+--------------+--------+
|2014-08-11 07:46:59|        2|             3|2014    |
|2014-08-11 08:22:12|        2|             3|2014 …
Run Code Online (Sandbox Code Playgroud)

timestamp scala apache-spark apache-spark-sql

7
推荐指数
1
解决办法
1万
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

scala ×1

timestamp ×1