如果数据如下:
Store,Dept,Date,Weekly_Sales,IsHoliday
1,1,2010-02-05,24924.5,FALSE
1,1,2010-02-12,46039.49,TRUE
1,1,2010-02-19,41595.55,FALSE
1,1,2010-02-26,19403.54,FALSE
1,1,2010-03-05,21827.9,FALSE
1,1,2010-03-12,21043.39,FALSE
1,1,2010-03-19,22136.64,FALSE
1,1,2010-03-26,26229.21,FALSE
1,1,2010-04-02,57258.43,FALSE
Run Code Online (Sandbox Code Playgroud)
我想复制IsHoliday等于TRUE的行,我可以这样做:
is_hol = df['IsHoliday'] == True
df_try = df[is_hol]
df=df.append(df_try*10)
Run Code Online (Sandbox Code Playgroud)
但有没有更好的方法来做到这一点因为我需要将假日行复制5次,如果使用上述方法我必须追加5次.
我想复制Pandas Dataframe中的行.每行应重复n次,其中n是每行的一个字段.
import pandas as pd
what_i_have = pd.DataFrame(data={
'id': ['A', 'B', 'C'],
'n' : [ 1, 2, 3],
'v' : [ 10, 13, 8]
})
what_i_want = pd.DataFrame(data={
'id': ['A', 'B', 'B', 'C', 'C', 'C'],
'v' : [ 10, 13, 13, 8, 8, 8]
})
Run Code Online (Sandbox Code Playgroud)
这可能吗?
我有pandas.DataFrame如下:
df1 =
a b
0 1 2
1 3 4
Run Code Online (Sandbox Code Playgroud)
我想这三次成为:
df2 =
a b
0 1 2
0 1 2
0 1 2
1 3 4
1 3 4
1 3 4
Run Code Online (Sandbox Code Playgroud)
df2 是一个循环,但效率不高.
我怎样才能df2从df1使用矩阵方式这是更快?