小编Mar*_*tal的帖子

如何计算pyspark的日期差异?

我有这样的数据:

df = sqlContext.createDataFrame([
    ('1986/10/15', 'z', 'null'), 
    ('1986/10/15', 'z', 'null'),
    ('1986/10/15', 'c', 'null'),
    ('1986/10/15', 'null', 'null'),
    ('1986/10/16', 'null', '4.0')],
    ('low', 'high', 'normal'))
Run Code Online (Sandbox Code Playgroud)

我想计算low列之间的日期差异,2017-05-02并用low差异替换列.我已经在stackoverflow上尝试了相关的解决方案,但它们都不起作用.

python dataframe apache-spark apache-spark-sql pyspark

13
推荐指数
2
解决办法
3万
查看次数

为什么ImportError:没有名为lightgbm的模块

我的操作系统是Ubuntu,我按照官方安装指南安装了lightgbm.但是,当我导入它时,会引发此错误:

ImportError:没有名为lightgbm的模块

我怎么解决这个问题?

运行这些linux命令行后,是否还需要转到/ python-package文件夹运行setup.py?

python ubuntu machine-learning lightgbm

5
推荐指数
2
解决办法
1万
查看次数

无法将 Spark 数据帧写入 gcs 存储桶

作业已提交并成功运行。但桶里根本就没有数据。我该如何解决呢?

df = spark.createDataFrame([["Amy", "lily", 12], ["john", "tom", 34]]).toDF(*["first_name", "last_name", "age"])
df.write.format("parquet").partitionBy("age").option("path", "gs://my_bucket/my_table")
Run Code Online (Sandbox Code Playgroud)

google-cloud-storage apache-spark google-cloud-platform

3
推荐指数
1
解决办法
5324
查看次数