Pandas/Python相当于R中复杂的ifelse匹配

And*_*ell 3 python if-statement match pandas

我的目标是让熊猫等同于以下R代码:

df1$String_1_check = ifelse(df1$String_1 == df2[match(df1$String_2, df2$String_2), 1], TRUE, FALSE)
Run Code Online (Sandbox Code Playgroud)

如果df1列String_1的第n行中的值等于df2的第一列,其中df1的列String_2的第n行与df2的String_2匹配,则在新列String_1_check中为True,否则在String_1_check中为False.

df1在String_1和String_2中有许多相同值的实例,而df2在String_1中只有每个可能值的一个实例.String_3不是唯一的.使用这些示例数据帧:

df1 = pd.DataFrame({'String_1': ['string 1', 'string 1', 'string 2', 'string 3', 'string 1'], 'String_2': ['string a', 'string a', 'string b', 'string a', 'string c']})
df2 = pd.DataFrame({'String_3': ['string 1', 'string 2', 'string 3'], 'String_2': ['string a', 'string b', 'string c']})

   String_1  String_2
0  string 1  string a
1  string 1  string a
2  string 2  string b
3  string 3  string a
4  string 1  string c

   String_3  String_2
0  string 1  string a
1  string 2  string b
2  string 3  string c
Run Code Online (Sandbox Code Playgroud)

期望的输出是:

   String_1  String_2  String_1_check
0  string 1  string a  True
1  string 1  string a  True
2  string 2  string b  True
3  string 3  string a  False
4  string 1  string c  False
Run Code Online (Sandbox Code Playgroud)

我已经试过np.where,isin,pd.match(现在已废弃),但还没有找到一个解决方案.

ACh*_*ion 5

将值重新分配给您可以执行df1的原始R操作:

In []:
df1['String_1_check'] = df1.merge(df2, how='left')['String_3'] == df1['String_1']
df1

Out:
   String_1  String_2  String_1_check
0  string 1  string a            True
1  string 1  string a            True
2  string 2  string b            True
3  string 3  string a           False
4  string 1  string c           False
Run Code Online (Sandbox Code Playgroud)