跑步时
pd.read_hdf('myfile.h5')
我收到以下回溯错误:
[[......一些较长的追溯]]
read_array中的〜/ .local/lib/python3.6/site-packages/pandas/io/pytables.py(self,key,start,stop)2487 2488 if isinstance(node,tables.VLArray): - > 2489 ret = node [0] [start:stop] 2490 else:2491 dtype = getattr(attrs,'value_type',None)
getitem中的〜/ .local/lib/python3.6/site-packages/tables / vlarray.py(self,key)
阅读中的〜/ .local/lib/python3.6/site-packages/tables/vlarray.py(自我,开始,停止,步骤)
tables.hdf5extension.VLArray._read_array()中的tables/hdf5extension.pyx
ValueError:无法将WRITEABLE标志设置为此数组的True
不知道发生了什么.我已经尝试重新安装tables,pandas一切基本上,但不想阅读它.
我有一个熊猫DataFrame,其中一些行对具有相同的ID但名称不同。我想要的是将行对减少为一行,并显示它们的两个名称。
输入:
ID NAME AGE
149 Bob 32
150 Tom 53
150 Roberts 53
151 Pamela 28
152 Andrew 23
Run Code Online (Sandbox Code Playgroud)
输出:
ID NAME AGE
149 Bob 32
150 Tom Roberts 53
151 Pamela 58
152 Andrew 23
Run Code Online (Sandbox Code Playgroud)
否则,我也可以执行['Tom','Roberts']或其他任何仍可捕获数据的方法。
我有一个熊猫数据框,其中有三列,即A(日期),B(分类值)和C(实际值)。
A | B | C
01-19 | 5 | 0.34
01-19 | 3 | 0.25
01-19 | 7 | 0.07
01-20 | 5 | 0.15
01-20 | 2 | 0.36
Run Code Online (Sandbox Code Playgroud)
等等。
我想要的是根据日期和特定阈值过滤行-类似于:
[(01-19, x<6), (01-20, x<3)]
在那种情况下那会给我
A | B | C
01-19 | 5 | 0.34
01-19 | 3 | 0.25
01-20 | 2 | 0.36
Run Code Online (Sandbox Code Playgroud)
我的解决方案是使用A和B设置多索引,但是我不完全确定如何过滤B。