小编Ahm*_*mad的帖子

如何计算spark sqlContext中的数据类型为double的列的中位数

我给了样本表.我想从每个组"源"列的"值"列中获取中值.其中source列的String DataType值列为double DataType

scala> sqlContext.sql("SELECT * from tTab order by source").show

+---------------+-----+                                                         
|         Source|value|
+---------------+-----+
|131.183.222.110|  1.0|
| 131.183.222.85|  1.0|
| 131.183.222.85|  0.0|
| 131.183.222.85|  0.5|
| 131.183.222.85|  1.0|
| 131.183.222.85|  1.0|
|   43.230.146.7|  0.0|
|   43.230.146.7|  1.0|
|   43.230.146.7|  1.0|
|   43.230.146.8|  1.0|
|   43.230.146.8|  1.0| 
+---------------+-----+

scala> tTab.printSchema

root
 |-- Source: string (nullable = true)
 |-- value: double (nullable = true)
Run Code Online (Sandbox Code Playgroud)

预期答案:

+---------------+-----+
|         Source|value|
+---------------+-----+
|131.183.222.110|  1.0|
| 131.183.222.85|  1.0|
|   43.230.146.7|  1.0|
|   43.230.146.8|  1.0|
+---------------+-----+ …
Run Code Online (Sandbox Code Playgroud)

hive apache-spark apache-spark-sql

5
推荐指数
1
解决办法
2万
查看次数

C++ 中 .dfm 文件的用途是什么

我在 Unix 中使用过 C++,并且知道 .h 和 .cpp 文件,但我从未使用过 C++ 构建器,现在我有一个包含 .cpp、.h 和 .dfm 文件的项目。那么.dfm 文件的用途是什么以及我们如何使用它?

提前致谢。

c++builder

4
推荐指数
1
解决办法
4928
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

c++builder ×1

hive ×1