我很新,我希望它不是太明显,但我似乎无法找到以下问题的简短而准确的答案.
我有两个清单:
a = [2,3,5,2,5,6,7,2]
b = [2,5,6]
Run Code Online (Sandbox Code Playgroud)
我想找到第二个list(b)的所有索引都在第一个list(a)中,这样我得到这样的东西:
a中的b的索引:3, 4, 5或b = a[3:6]
我有一个如下所示的 pandas DataFrame:
df = pd.DataFrame(np.random.randint(0,2,size=(5, 4)),
columns=list('ABCD'))
A B C D
0 1 1 1 1
1 0 1 0 0
2 1 1 1 1
3 1 0 0 1
4 0 1 0 1
Run Code Online (Sandbox Code Playgroud)
我想找到每列与 DataFrame 中所有其他列相比的 1 计数重叠百分比。
例如,A 列与 B 列有 2 个共享 1,总共包含 3 个 1。这意味着 66% 的重叠。B 包含 4 个 1,并且与 A 列有 2 个共享 1。这意味着 50% 的重叠。
因此,我想获得一个新的 DataFrame,其中包含所有列对的百分比值:
A B C D
A 100 50 43 31
B 66 100 91 …Run Code Online (Sandbox Code Playgroud)