如何解决 Pyspark 数据帧查询错误关键字不能是表达式

Jay*_*ree 4 python spark-dataframe pyspark-sql

我有两个名为 tweetsDF 和 HashtagsDF 的数据帧。两个数据帧的 tweet_status_id 相等,我想检索单个推文的主题标签计数。这是我正在使用的查询,它会抛出

ERROR : SyntaxError: keyword can't be an expression

tweet_hashtags_count_DF = tweetsDF.join(HashtagsDF,sum('tweetsDF.*'),tweetsDF.tweet_status_id == HashtagsDF.tweet_status_id & tweetsDF.tweet_status_id='636984052600274944').show()
Run Code Online (Sandbox Code Playgroud)

我在查询中哪里错了?

and*_*ece 11

尝试tweetsDF.tweet_status_id == '636984052600274944'==而不是=)。