相关疑难解决方法(0)

Spark SQL更改格式的编号

show命令火花打印如下:

+-----------------------+---------------------------+
|NameColumn             |NumberColumn               |
+-----------------------+---------------------------+
|name                   |4.3E-5                     |
+-----------------------+---------------------------+
Run Code Online (Sandbox Code Playgroud)

有没有办法将NumberColumn格式改为类似的东西0.000043

scala apache-spark apache-spark-sql

10
推荐指数
2
解决办法
2万
查看次数

类型错误:类型列没有定义 __round__ 方法

我的数据如下所示:

+-------+-------+------+----------+
|book_id|user_id|rating|prediction|
+-------+-------+------+----------+
|    148|    588|     4|  3.953999|
|    148|  28767|     3| 2.5816362|
|    148|  41282|     3|  4.185532|
|    148|  18313|     4| 3.6297297|
|    148|  11272|     3| 3.0962112|
+-------+-------+------+----------+
Run Code Online (Sandbox Code Playgroud)

我想通过四舍五入预测列中的值来创建一个新的列名“pred_class”。我运行这个代码:

results.withColumn('pred_class',round(results['prediction']))
Run Code Online (Sandbox Code Playgroud)

它给了我这样的错误:

类型错误:类型列没有定义圆形方法

任何人都可以帮助我吗?谢谢!

apache-spark-sql pyspark

1
推荐指数
1
解决办法
2620
查看次数

标签 统计

apache-spark-sql ×2

apache-spark ×1

pyspark ×1

scala ×1