我正在尝试对列表进行二值化(将 0 保留为 0,并将任何其他数字转换为 1),例如(格式示例,实际列表更长):
d = [[0,0,192],[0,0,0,0,56],[...],...]
With len(d) = 23473 and len(d[n])=300, so kind of a lot of data
Run Code Online (Sandbox Code Playgroud)
有没有办法不用两个循环来做到这一点?我试过了,它需要很多时间并将列表转换为长度>>23473
#for i in np.linspace(0,len(d)-1,len(d),dtype=int):
# for k in np.linspace(0,len(d[i])-1,len(d[i]),dtype=int):
# if d[i][k] != 0:
# d[i][k] = 1
# else:
# d[i][k] = 0
Run Code Online (Sandbox Code Playgroud)
非常感谢!
我有一个如下形式的数据框:
a b c d e
0 0 1 0 1 0
1 0 0 0 1 1
2 1 1 0 0 0
Run Code Online (Sandbox Code Playgroud)
我想折叠它,只将其中的一个折叠到一行,例如:
x
0 'bd'
1 'de'
2 'ab'
Run Code Online (Sandbox Code Playgroud)
提前致谢
我有这张桌子:
| 一种 | 乙 | C |
|---|---|---|
| 你好 | 一种 | C |
| 你好 | 乙 | C |
| 你好 | C | C |
我想删除基于 A 列的重复项,但只保留第三行,其中 B 列和 C 列具有相同的字符串:
| 一种 | 乙 | C |
|---|---|---|
| 你好 | C | C |
我该怎么做?
提前致谢!
我有一列 (user_id) 有数千个 user_id(也重复),另一列(字符串)有几个不同的字符串。我想检查一个唯一的 user_id 是否有一个特定的字符串,并将用户 id 和 1 存储在一个新的数据帧中。如果 user_id 没有字符串,那么我想存储 user_id 和 0。在这种情况下,我想给字符串“good”一个 1,给任何其他字符串一个 0。
如果不无限循环,我似乎找不到这样做的好方法。
初始 Pandas 数据框
| 用户身份 | 细绳 |
|---|---|
| 1 | 好的 |
| 1 | 更好的 |
| 1 | 好的 |
| 2 | 好的 |
| 2 | 更差 |
| 3 | 更差 |
| 3 | 甚至更糟 |
所需的 Pandas 数据框
| 用户身份 | 是字符串 |
|---|---|
| 1 | 1 |
| 2 | 1 |
| 3 | 0 |
提前致谢!