小编ina*_*ute的帖子

为什么 groupby.apply 返回重复的级别

def afun(group):
  aa=len(group)
  group.sort_values(inplace=True)

  return pandas.DataFrame({'score':numpy.arange(aa),'price':group})



df = pandas.DataFrame({
              'stock':numpy.repeat( ['AAPL','GOOG','YHOO'], 3 ),
              'date':numpy.tile( pandas.date_range('5/5/2015', periods=3, freq='D'), 3 ),
              'price':(numpy.random.randn(9).cumsum() + 10) ,
              'price2':(numpy.random.randn(9).cumsum() + 10)})
df = df.set_index(['stock','date'])
agroupDf=df.groupby(level='date') 



tt=agroupDf['price'].apply(afun)

Run Code Online (Sandbox Code Playgroud)

变量tt的值如图所示

我的问题是为什么 tt 有两列“日期”，以及如何避免第二列“日期”？

pandas

ina*_*ute

2016 08-15

9
推荐指数

1
解决办法

5004
查看次数

将数据帧写入 .xlsx 太慢

我有一个 40MB 的数据帧“dfScore”，我正在写入 .xlsx？代码如下，

writer = pandas.ExcelWriter('test.xlsx', engine='xlsxwriter')
dfScore.to_excel(writer,sheet_name='Sheet1')
writer.save()

Run Code Online (Sandbox Code Playgroud)

代码dfScore.to_excel 需要将近一个小时，再the code writer.save() 需要一个小时。这是正常的吗？有什么好方法可以花不到 10 分钟的时间吗？

我已经在 stackoverflow 中搜索过，但似乎有些建议无法解决我的问题。

pandas

ina*_*ute

lucky-day

6
推荐指数

2
解决办法

9577
查看次数

如何将数据框附加到现有的 csv 文件并删除重复数据

我有一个数据框数据和 csv 数据如下

我想将数据帧数据附加到 csv 文件中。但是，两个数据之间存在重复项。因此如何删除重复项并将新数据附加到 csv 文件中。

python csv duplicates dataframe pandas

ina*_*ute

2017 09-25

4
推荐指数

1
解决办法

2374
查看次数

标签统计

pandas ×3

csv ×1

dataframe ×1

duplicates ×1

python ×1

为什么 groupby.apply 返回重复的级别

将数据帧写入 .xlsx 太慢

如何将数据框附加到现有的 csv 文件并删除重复数据

标签 统计

小编ina_ute的帖子

标签统计