小编vin*_*ham的帖子

如何在PySpark中检查空的RDD

tweetStream.foreachRDD((rdd, time) => {
  val count = rdd.count()
  if (count > 0) {
    var fileName =  outputDirectory + "/tweets_" + time.milliseconds.toString    
    val outputRDD = rdd.repartition(partitionsEachInterval) 
    outputRDD.saveAsTextFile(fileName) 
}
Run Code Online (Sandbox Code Playgroud)

我正在尝试以python方式检查流数据中的计数值或空RDD,很难找到方法,还尝试了以下链接中的示例。 http://spark.apache.org/docs/latest/streaming-programming-guide.html

apache-spark spark-streaming rdd pyspark

3
推荐指数
1
解决办法
4871
查看次数

雅典娜日期格式无法将字符串转换为日期格式

尝试了以下语法,它们都没有帮助将字符串类型列转换为日期

select INVC_,APIDT,APDDT from APAPP100 limit 10
select current_date, APIDT,APDDT from APAPP100 limit 10
select date_format( b.APIDT, '%Y-%m-%d') from APAPP100 b
select CAST( b.APIDT AS date) from APAPP100 b
select date(b.APIDT) from APAPP100 b
select convert(datetime, b.APIDT) from APAPP100 b
select date_parse(b.APIDT, '%Y-%m-%d') from APAPP100 b
select str_to_date(b.APIDT) from APAPP100 b
Run Code Online (Sandbox Code Playgroud)

date presto amazon-athena

2
推荐指数
3
解决办法
2万
查看次数