小编Jay*_*ree的帖子

如何解决 Pyspark 数据帧查询错误关键字不能是表达式

我有两个名为 tweetsDF 和 HashtagsDF 的数据帧。两个数据帧的 tweet_status_id 相等,我想检索单个推文的主题标签计数。这是我正在使用的查询,它会抛出

ERROR : SyntaxError: keyword can't be an expression

tweet_hashtags_count_DF = tweetsDF.join(HashtagsDF,sum('tweetsDF.*'),tweetsDF.tweet_status_id == HashtagsDF.tweet_status_id & tweetsDF.tweet_status_id='636984052600274944').show()
Run Code Online (Sandbox Code Playgroud)

我在查询中哪里错了?

python spark-dataframe pyspark-sql

4
推荐指数
1
解决办法
5111
查看次数

标签 统计

pyspark-sql ×1

python ×1

spark-dataframe ×1