我有两个需要验证的数据集。所有记录都应该匹配。我无法确定如何遍历每个不同的列。
import pandas as pd
import numpy as np
df = pd.DataFrame([['charlie', 'charlie', 'beta', 'cappa'], ['charlie', 'charlie', 'beta', 'delta'], ['charlie', 'charlie', 'beta', 'beta']], columns=['A_1', 'A_2','B_1','B_2'])
df.head()
Out[83]:
A_1 A_2 B_1 B_2
0 charlie charlie beta cappa
1 charlie charlie beta delta
2 charlie charlie beta beta
Run Code Online (Sandbox Code Playgroud)
例如,在上面的代码中,我想将 A_1 与 A_2 和 B_1 与 B_2 进行比较,以分别返回一个新列 A_check 和 B_check,如果 A_1 与 A_2 匹配作为 A_Check,则返回 True。
像这样的东西:
df['B_check'] = np.where((df['B_1'] == df['B_2']), 'True', 'False')
df_subset = df[df['B_check']=='False']
Run Code Online (Sandbox Code Playgroud)
但是可以遍历任何给定的列名,其中需要检查的列在下划线之前始终具有相同的名称,并且在下划线之后始终具有 1 或 2。
最终,实际任务有多个数据框,要检查的列数不同,要检查的列数也不同。我最终想要的输出是一个数据框,它显示了任何特定列检查的所有错误记录。
我正在尝试将个别列表项目轮流分配给个人.
这基本上是我想要做的:
姓名:Bob S Joe B Emily R.
在SharePoint列表中,如果某个用户(在这三个人之外或包括这三个人)将一个项目添加到列表中,则会向bob发送警报,并且仅向bob发送警报,该列表项行中的单元格也会有希望填充将Bob的名称分配给该项目.如果添加了一个新的列表项,也会发生同样的事情,但会将其分配给Joe,然后分配给Emily,然后再分配给bob,依此类推.
有没有办法做到这一点:工作流设置或其他方式?