MRJ*_*J17 4 python strftime pandas python-3.6
我在减去日期列的一部分时遇到问题。我的目标是建立一个群组分析表。为了实现这一点,我想在我的 Pandas 数据框中获取任何客户的订购月份。
OrderDate ConsumerId Orders
0 2017-09-01 5555555 4
1 2017-09-01 66666666666 2
2 2017-09-01 88888888888 4
3 2017-09-01 9999999999 3
4 2017-09-01 45858888 3
Run Code Online (Sandbox Code Playgroud)
我使用下面的代码来做到这一点。
import pandas as pd
pd.set_option('max_columns', 50)
mpl.rcParams['lines.linewidth'] = 2
df = pd.read_csv("C:/Users/***/****/salesdata.csv")
df.head()
df['OrderPeriod'] = df.OrderDate.apply(lambda x: x.strftime('%Y-%m'))
Run Code Online (Sandbox Code Playgroud)
Unfurtantely 我在尝试减去订购月份时收到以下错误。
df['OrderPeriod'] = df.OrderDate.apply(lambda x: x.strftime('%Y-%m'))
AttributeError: 'str' object has no attribute 'strftime'
Run Code Online (Sandbox Code Playgroud)
我的熊猫数据框如下所示:
OrderDate ConsumerId Orders
0 2017-09-01 5555555 4
1 2017-09-01 66666666666 2
2 2017-09-01 88888888888 4
3 2017-09-01 9999999999 3
4 2017-09-01 45858888 3
Run Code Online (Sandbox Code Playgroud)
我的目标是添加一个包含消费者订购月份的新列。像下面。
OrderDate ConsumerId Orders OrderPeriod
0 2017-09-01 5555555 4 2017-09
1 2017-09-01 66666666666 2 2017-09
2 2017-09-01 88888888888 4 2017-09
3 2017-09-01 9999999999 3 2017-09
4 2017-09-01 45858888 3 2017-09
Run Code Online (Sandbox Code Playgroud)
我想知道为什么我会收到 AttributeError 以及如何解决这个问题。
使用 vectorized dt.strftime,但首先read_csv通过参数将列转换为日期时间parse_dates:
df = pd.read_csv("C:/Users/***/****/salesdata.csv", parse_dates=['OrderDate'])
df['OrderPeriod'] = df.OrderDate.dt.strftime('%Y-%m')
print (df)
OrderDate ConsumerId Orders OrderPeriod
0 2017-09-01 5555555 4 2017-09
1 2017-09-01 66666666666 2 2017-09
2 2017-09-01 88888888888 4 2017-09
3 2017-09-01 9999999999 3 2017-09
4 2017-09-01 45858888 3 2017-09
Run Code Online (Sandbox Code Playgroud)