我有一个包含两列的DataFrame,一个日期和一个类别.我想根据规则创建一个新的日期列:如果类别是B工作日最接近日期的值(仅来自过去或日本身),否则它是日期列本身的值.
我将工作日定义为不在周末的任何一天,也不存在于holidays下面的最小示例中定义的列表中.
请考虑以下DataFrame df:
import datetime as dt
import pandas as pd
from IPython.display import display
holidays = [dt.datetime(2018, 10, 11)]
df = pd.DataFrame({"day": ["2018-10-10", "2018-10-11", "2018-10-12",
"2018-10-13", "2018-10-14", "2018-10-15"
],
"category":["A", "B", "C", "B", "C", "A"]
}
)
df["day"] = pd.to_datetime(df.day, format="%Y-%m-%d")
display(df)
day category
0 2018-10-10 A
1 2018-10-11 B
2 2018-10-12 C
3 2018-10-13 B
4 2018-10-14 C
5 2018-10-15 A
Run Code Online (Sandbox Code Playgroud)
如何获得第三列,其值如下所示?
2018-10-10
2018-10-10
2018-10-12
2018-10-12
2018-10-14
2018-10-15
Run Code Online (Sandbox Code Playgroud)
我有一个创建的函数,可以查找使用列表的最后一个工作日,如果有任何帮助的话.
# creates a …Run Code Online (Sandbox Code Playgroud)