我将包含150,000行的csv文件读入pandas数据帧.此数据框有一个字段"日期",日期格式为yyyy-mm-dd.我想从中提取月,日和年,并分别复制到数据框的列,'月','日'和'年'.对于几百条记录,以下两种方法都可以正常工作,但对于150,000条记录,这两种方法都需要花费很长的时间来执行.对于100,000多条记录,有更快的方法吗?
第一种方法:
df = pandas.read_csv(filename)
for i in xrange(len(df)):
df.loc[i,'Day'] = int(df.loc[i,'Date'].split('-')[2])
Run Code Online (Sandbox Code Playgroud)
第二种方法:
df = pandas.read_csv(filename)
for i in xrange(len(df)):
df.loc[i,'Day'] = datetime.strptime(df.loc[i,'Date'], '%Y-%m-%d').day
Run Code Online (Sandbox Code Playgroud)
谢谢.