python pandas-应用具有两个列参数的函数

Mar*_*ria 17 python function dataframe pandas

你能用两个不同的列作为参数创建一个python pandas函数吗?

我有一个函数,如果两列的值在同一范围内,则返回1.否则返回0:

def segmentMatch(RealTime, ResponseTime):
    if RealTime <= 566 and ResponseTime <= 566:
        matchVar = 1
    elif 566 < RealTime <= 1132 and 566 < ResponseTime <= 1132:
        matchVar = 1
    elif 1132 < RealTime <= 1698 and 1132 < ResponseTime <= 1698:
        matchVar = 1
    else:
        matchVar = 0
    return matchVar
Run Code Online (Sandbox Code Playgroud)

我希望第一个参数,RealTime是我的数据框中的一列,这样该函数将获取该列中每行的值.例如RealTimedf['TimeCol'],第二个参数是df ['ResponseCol']`.我希望结果成为数据框中的新列.我遇到了几个 已回答类似问题的线程,但看起来这些参数是变量,而不是数据帧行中的值.

我尝试了以下但它不起作用:

df['NewCol'] = df.apply(segmentMatch, args=(df['TimeCol'], df['ResponseCol']), axis=1)
Run Code Online (Sandbox Code Playgroud)

N. *_*uda 31

为什么不这样做呢?

df['NewCol'] = df.apply(lambda x: segmentMatch(x['TimeCol'], x['ResponseCol']), axis=1)
Run Code Online (Sandbox Code Playgroud)

我们现在只是将每行中的相应条目作为参数传递,而不是尝试将列作为参数传递,而是将结果存储在中'NewCol'.

  • ... axis=1 ... 我把头撞在桌子上 45 分钟,直到我看到那个!谢谢! (4认同)
  • 谢谢你!我什至可以将其与参数一起使用!尝试在没有 lambda 函数的情况下执行此操作,但无法找到解决方法:) (2认同)

rah*_*hul 7

如果要在外部定义函数,则实际上不需要lambda函数:

def segmentMatch(vec):
    RealTime = vec[0]
    ResponseTime = vec[1]
    if RealTime <= 566 and ResponseTime <= 566:
        matchVar = 1
    elif 566 < RealTime <= 1132 and 566 < ResponseTime <= 1132:
        matchVar = 1
    elif 1132 < RealTime <= 1698 and 1132 < ResponseTime <= 1698:
        matchVar = 1
    else:
        matchVar = 0
    return matchVar

df['NewCol'] = df[['TimeCol', 'ResponseCol']].apply(segmentMatch, axis=1)
Run Code Online (Sandbox Code Playgroud)

如果“ segmentMatch”将返回两个值的向量,则可以执行以下操作:

def segmentMatch(vec):
    ......
    return pd.Series((matchVar1, matchVar2)) 

df[['NewCol', 'NewCol2']] = df[['TimeCol','ResponseCol']].apply(segmentMatch, axis=1)
Run Code Online (Sandbox Code Playgroud)