Rus*_*ord 1 python python-3.x pandas
我有 df 看起来像这样
df:
id dob
1 7/31/2018
2 6/1992
Run Code Online (Sandbox Code Playgroud)
我想生成 88799 个随机日期以进入dob数据框中的列,在1960-01-01to的日期之间,1990-12-31同时保持格式mm/dd/yyyy没有时间戳。
我该怎么做?
我试过:
date1 = (1960,01,01)
date2 = (1990,12,31)
for i range(date1,date2):
df.dob = i
Run Code Online (Sandbox Code Playgroud)
我会计算出您的日期范围内有多少天,然后在该范围内选择 88799 个随机整数,最后将其添加为unit='d'您的最小日期的时间增量:
min_date = pd.to_datetime('1960-01-01')
max_date = pd.to_datetime('1990-12-31')
d = (max_date - min_date).days + 1
df['dob'] = min_date + pd.to_timedelta(pd.np.random.randint(d,size=88799), unit='d')
>>> df.head()
dob
0 1963-03-05
1 1973-06-07
2 1970-08-24
3 1970-05-03
4 1971-07-03
>>> df.tail()
dob
88794 1965-12-10
88795 1968-08-09
88796 1988-04-29
88797 1971-07-27
88798 1980-08-03
Run Code Online (Sandbox Code Playgroud)
编辑您可以使用.strftime('%m/%d/%Y'),但请注意,这会显着减慢执行速度:
df['dob'] = (min_date + pd.to_timedelta(pd.np.random.randint(d,size=88799), unit='d')).strftime('%m/%d/%Y')
>>> df.head()
dob
0 02/26/1969
1 04/09/1963
2 08/29/1984
3 02/12/1961
4 08/02/1988
>>> df.tail()
dob
88794 02/13/1968
88795 02/05/1982
88796 07/03/1964
88797 06/11/1976
88798 11/17/1965
Run Code Online (Sandbox Code Playgroud)