我想加入或更新以下两个表,并添加df现有单词。因此,如果第一个表中不存在该单词endeavor,则应将其值相加,或者如果两个表中都存在df该单词,则应将其相加。hellodf
仅供参考,我正在使用 MariaDB 和 PySpark 对文档进行字数统计并计算 tf、df 和 tfidf 值。
表名:df
+--------+----+
| word| df|
+--------+----+
|vicinity| 5|
| hallo| 2|
| admire| 3|
| settled| 1|
+--------+----+
Run Code Online (Sandbox Code Playgroud)
表名:word_list
| word| df|
+----------+---+
| hallo| 1|
| settled| 1|
| endeavor| 1|
+----------+---+
Run Code Online (Sandbox Code Playgroud)
所以最后更新/组合的表应该如下所示:
| word| df|
+----------+---+
| vicinity| 5|
| hallo| 3|
| admire| 3|
| settled| 2|
| endeavor| 1|
+----------+---+
Run Code Online (Sandbox Code Playgroud)
到目前为止我尝试做的事情如下:
SELECT df.word, df.df + word_list.df FROM df …Run Code Online (Sandbox Code Playgroud)