小编cos*_*tot的帖子

Pandas Panel花式索引:如何根据每个df中多列的布尔值返回(索引)Panel中的所有DataFrame

我有一个Pandas面板,其中包含许多具有相同行/列标签的DataFrame.我想创建一个包含DataFrames的新面板,该面板基于几列来满足某些条件.

数据帧和行很容易:比如我有一个df,zHe_compare.我可以得到合适的行:

zHe_compare[(zHe_compare['zHe_calc'] > 100) & (zHe_compare['zHe_med'] > 100) | ((zHe_obs_lo_2s <=zHe_compare['zHe_calc']) & (zHe_compare['zHe_calc'] <= zHe_obs_hi_2s))]

Run Code Online (Sandbox Code Playgroud)

但我该怎么做(伪代码,简化布尔):

good_results_panel = results_panel[ all_dataframes[ sum ('zHe_calc' < 'zHe_obs') > min_num ] ]

Run Code Online (Sandbox Code Playgroud)

我知道内部布尔部分,但是如何为面板中的每个数据帧指定它？因为我需要每个df的多个列,所以我没有使用panel.minor_xs切片技术取得成功.

谢谢!

python indexing panel dataframe pandas

cos*_*tot

lucky-day

7
推荐指数

1
解决办法

2224
查看次数

将excel或csv文件转换为pandas多级数据帧

我已经获得了一个相当大的Excel文件(5k行),也是一个CSV,我想把它变成一个pandas多级DataFame.该文件的结构如下:

SampleID    OtherInfo    Measurements    Error    Notes
sample1     stuff                                 more stuff
                         36              6
                         26              7
                         37              8
sample2     newstuff                              lots of stuff
                         25              6
                         27              7

Run Code Online (Sandbox Code Playgroud)

其中测量数量是可变的(有时为零).任何信息之间没有完整的空行,并且"测量"和"错误"列在具有其他(字符串)数据的行上为空; 这可能会使解析更难(？).是否有一种简单的方法可以自动执行此转换？我最初的想法是首先使用Python解析文件,然后在循环中将内容提供到DataFrame插槽中,但我不确切知道如何实现它,或者它是否是最佳的行动方案.

提前致谢!

python csv excel dataframe pandas

cos*_*tot

lucky-day

5
推荐指数

1
解决办法

2074
查看次数