小编Tac*_*o22的帖子

将包含列表的列表二值化

我正在尝试对列表进行二值化（将 0 保留为 0，并将任何其他数字转换为 1），例如（格式示例，实际列表更长）：

d = [[0,0,192],[0,0,0,0,56],[...],...]

With len(d) = 23473 and len(d[n])=300, so kind of a lot of data

Run Code Online (Sandbox Code Playgroud)

有没有办法不用两个循环来做到这一点？我试过了，它需要很多时间并将列表转换为长度>>23473

#for i in np.linspace(0,len(d)-1,len(d),dtype=int):
#    for k in np.linspace(0,len(d[i])-1,len(d[i]),dtype=int):
#        if d[i][k] != 0:
#            d[i][k] = 1
#        else:
#            d[i][k] = 0

Run Code Online (Sandbox Code Playgroud)

非常感谢！

python numpy list python-3.x

Tac*_*o22

2019 07-08

2
推荐指数

1
解决办法

75
查看次数

将二进制 Pandas Dataframe 折叠为一列

我有一个如下形式的数据框：

  a b c d e
0 0 1 0 1 0
1 0 0 0 1 1
2 1 1 0 0 0

Run Code Online (Sandbox Code Playgroud)

我想折叠它，只将其中的一个折叠到一行，例如：

   x 
0 'bd' 
1 'de' 
2 'ab'

Run Code Online (Sandbox Code Playgroud)

提前致谢

python python-3.x pandas

Tac*_*o22

2020 07-03

2
推荐指数

1
解决办法

62
查看次数

根据两列的条件删除重复项

我有这张桌子：

一种	乙	C
你好	一种	C
你好	乙	C
你好	C	C

我想删除基于 A 列的重复项，但只保留第三行，其中 B 列和 C 列具有相同的字符串：

一种	乙	C
你好	C	C

我该怎么做？

提前致谢！

python duplicates dataframe python-3.x pandas

Tac*_*o22

lucky-day

1
推荐指数

1
解决办法

42
查看次数

计算一列是否在另一列中具有特定值

我有一列 (user_id) 有数千个 user_id（也重复），另一列（字符串）有几个不同的字符串。我想检查一个唯一的 user_id 是否有一个特定的字符串，并将用户 id 和 1 存储在一个新的数据帧中。如果 user_id 没有字符串，那么我想存储 user_id 和 0。在这种情况下，我想给字符串“good”一个 1，给任何其他字符串一个 0。

如果不无限循环，我似乎找不到这样做的好方法。

初始 Pandas 数据框