小编pra*_*ady的帖子

5
推荐指数
1
解决办法
1403
查看次数

将 spark 数据框中的两列转换为 Map 类型?

例如,我有两列

 Code   Department
    E.          ECE
    C.          CSE
Run Code Online (Sandbox Code Playgroud)

我想将其转换为地图类型,如下所示

Map( E -> ECE, C -> CSE) 
Run Code Online (Sandbox Code Playgroud)

注意 - 当前使用带有 Scala 的 spark 2.2。

apache-spark apache-spark-sql

3
推荐指数
1
解决办法
5672
查看次数

如何为python数据框中的选定列着色?

我正在使用下面的代码将我的 df 导出到 excel,我需要为输出 excel 中的特定列着色。

# DF TO EXCEL
from pandas import ExcelWriter
writer = ExcelWriter('Output.xlsx')
df.to_excel(writer,'sheet1')
writer.save()
Run Code Online (Sandbox Code Playgroud)

请建议我一种方法。

python excel dataframe pandas

2
推荐指数
1
解决办法
8065
查看次数

如何使用spark DF或DS读取“ .gz”压缩文件?

我有一个.gz格式的压缩文件,是否可以使用spark DF / DS直接读取文件?

详细信息:文件是带有制表符分隔的csv。

gzip apache-spark apache-spark-sql spark-dataframe apache-spark-dataset

2
推荐指数
1
解决办法
5239
查看次数