小编Tac*_*o22的帖子

将包含列表的列表二值化

我正在尝试对列表进行二值化(将 0 保留为 0,并将任何其他数字转换为 1),例如(格式示例,实际列表更长):

d = [[0,0,192],[0,0,0,0,56],[...],...]

With len(d) = 23473 and len(d[n])=300, so kind of a lot of data

Run Code Online (Sandbox Code Playgroud)

有没有办法不用两个循环来做到这一点?我试过了,它需要很多时间并将列表转换为长度>>23473

#for i in np.linspace(0,len(d)-1,len(d),dtype=int):
#    for k in np.linspace(0,len(d[i])-1,len(d[i]),dtype=int):
#        if d[i][k] != 0:
#            d[i][k] = 1
#        else:
#            d[i][k] = 0
Run Code Online (Sandbox Code Playgroud)

非常感谢!

python numpy list python-3.x

2
推荐指数
1
解决办法
75
查看次数

将二进制 Pandas Dataframe 折叠为一列

我有一个如下形式的数据框:

  a b c d e
0 0 1 0 1 0
1 0 0 0 1 1
2 1 1 0 0 0
Run Code Online (Sandbox Code Playgroud)

我想折叠它,只将其中的一个折叠到一行,例如:

   x 
0 'bd' 
1 'de' 
2 'ab'
Run Code Online (Sandbox Code Playgroud)

提前致谢

python python-3.x pandas

2
推荐指数
1
解决办法
62
查看次数

根据两列的条件删除重复项

我有这张桌子:

一种 C
你好 一种 C
你好 C
你好 C C

我想删除基于 A 列的重复项,但只保留第三行,其中 B 列和 C 列具有相同的字符串:

一种 C
你好 C C

我该怎么做?

提前致谢!

python duplicates dataframe python-3.x pandas

1
推荐指数
1
解决办法
42
查看次数

计算一列是否在另一列中具有特定值

我有一列 (user_id) 有数千个 user_id(也重复),另一列(字符串)有几个不同的字符串。我想检查一个唯一的 user_id 是否有一个特定的字符串,并将用户 id 和 1 存储在一个新的数据帧中。如果 user_id 没有字符串,那么我想存储 user_id 和 0。在这种情况下,我想给字符串“good”一个 1,给任何其他字符串一个 0。

如果不无限循环,我似乎找不到这样做的好方法。

初始 Pandas 数据框

用户身份 细绳
1 好的
1 更好的
1 好的
2 好的
2 更差
3 更差
3 甚至更糟

所需的 Pandas 数据框

用户身份 是字符串
1 1
2 1
3 0

提前致谢!

python dataframe python-3.x pandas pandas-groupby

0
推荐指数
1
解决办法
49
查看次数