Python在数据框列上测试true/false条件并在新列中返回输出

Sar*_*rah 4 python dataframe pandas

我对Python编码很陌生,所以我试图掌握一些基础知识 - 任何输入都值得赞赏.

我有一个每周日期的列表,并且我试图在日期运行'if'语句,即如果日期数小于7,则创建一个具有因子x的列,或者创建一个因子y - 如同下表:

    week        day check       factor
0   2017-01-08  8   False       x
1   2017-01-15  15  False       x
2   2017-01-22  22  False       x
3   2017-01-29  29  False       x
4   2017-02-05  5   True        y
Run Code Online (Sandbox Code Playgroud)

我试过下面的代码:

if df['day'] <7 :
    factor=weeks['day']/7
else:
    ....
Run Code Online (Sandbox Code Playgroud)

并得到一个错误:

ValueError: The truth value of a Series is ambiguous
Run Code Online (Sandbox Code Playgroud)

我已经研究过,并且理解上面的代码试图测试整个列,因此不能有明确的真/假响应.我已经看到了关于所有/任何的一些评论,但这些也没有给我我正在寻找的答案.有没有办法测试列中的每个项目并根据值返回不同的输出?

EdC*_*ica 6

如果需要转换'周'列datetimedtype使用to_datetime那么你可以比较使用的day属性dt.day并将其用作以下条件np.where:

In [47]:
df['week'] = pd.to_datetime(df['week'])
df['factor'] = np.where(df['week'].dt.day < 7, 'y', 'x')
df

Out[47]:
        week  day  check factor
0 2017-01-08    8  False      x
1 2017-01-15   15  False      x
2 2017-01-22   22  False      x
3 2017-01-29   29  False      x
4 2017-02-05    5   True      y
Run Code Online (Sandbox Code Playgroud)