小编Bry*_*ker的帖子

Pyspark,按一列中的唯一值对另一列中的某个值进行分组

这个标题,太可怕了,对不起。这是我的意思:这是起始数据集

C1   C2
AA   H
AB   M
AC   M
AA   H
AA   L
AC   L
Run Code Online (Sandbox Code Playgroud)

然后它将变成一个包含4列的新数据集:

C1   CH   CM   CL
AA   2    0    1
AB   0    1    0
AC   0    1    1
Run Code Online (Sandbox Code Playgroud)

apache-spark pyspark

4
推荐指数
1
解决办法
3284
查看次数

Pyspark,在字符串中间添加一个字符

假设我有一个像这样的字符串列

Hour
0045
2322
Run Code Online (Sandbox Code Playgroud)

我希望它变成这样:

Hour
00:45
23:22   
Run Code Online (Sandbox Code Playgroud)

为了变成时间戳之后.我该怎么办呢?

python split apache-spark pyspark

3
推荐指数
1
解决办法
987
查看次数

如何在Python中将完整的ascii字符串转换为十六进制?

我有这个字符串: string = '{'id':'other_aud1_aud2','kW':15}'

简而言之,我希望我的字符串变成这样的十六进制字符串:'7b276964273a276f746865725f617564315f61756432272c276b57273a31357d'

一直在尝试binascii.hexlify(string),但它不断返回:

类型错误:需要类似字节的对象,而不是“str”

此外,它只是让它与以下方法一起工作:bytearray.fromhex(data['string_hex']).decode()

对于这里的整个代码来说,它是:

string_data = "{'id':'"+self.id+"','kW':"+str(value)+"}"
print(string_data)
string_data_hex = hexlify(string_data)
get_json = bytearray.fromhex(data['string_hex']).decode()
Run Code Online (Sandbox Code Playgroud)

这也是Python 3.6

python hex ascii

0
推荐指数
1
解决办法
1万
查看次数

标签 统计

apache-spark ×2

pyspark ×2

python ×2

ascii ×1

hex ×1

split ×1