我有一个输入数据框(ip_df),此数据框中的数据如下所示:
id timestamp_value
1 2017-08-01T14:30:00+05:30
2 2017-08-01T14:30:00+06:30
3 2017-08-01T14:30:00+07:30
Run Code Online (Sandbox Code Playgroud)
我需要创建一个新的dataframe(op_df),其中我需要将时间戳值转换为UTC格式。因此最终输出数据帧将如下所示:
id timestamp_value
1 2017-08-01T09:00:00+00:00
2 2017-08-01T08:00:00+00:00
3 2017-08-01T07:00:00+00:00
Run Code Online (Sandbox Code Playgroud)
我想使用PySpark实现它。有人可以帮我吗?任何帮助将是适当的。