我有一个Pandas面板,其中包含许多具有相同行/列标签的DataFrame.我想创建一个包含DataFrames的新面板,该面板基于几列来满足某些条件.
数据帧和行很容易:比如我有一个df,zHe_compare.我可以得到合适的行:
zHe_compare[(zHe_compare['zHe_calc'] > 100) & (zHe_compare['zHe_med'] > 100) | ((zHe_obs_lo_2s <=zHe_compare['zHe_calc']) & (zHe_compare['zHe_calc'] <= zHe_obs_hi_2s))]
Run Code Online (Sandbox Code Playgroud)
但我该怎么做(伪代码,简化布尔):
good_results_panel = results_panel[ all_dataframes[ sum ('zHe_calc' < 'zHe_obs') > min_num ] ]
Run Code Online (Sandbox Code Playgroud)
我知道内部布尔部分,但是如何为面板中的每个数据帧指定它?因为我需要每个df的多个列,所以我没有使用panel.minor_xs切片技术取得成功.
谢谢!
我已经获得了一个相当大的Excel文件(5k行),也是一个CSV,我想把它变成一个pandas多级DataFame.该文件的结构如下:
SampleID OtherInfo Measurements Error Notes
sample1 stuff more stuff
36 6
26 7
37 8
sample2 newstuff lots of stuff
25 6
27 7
Run Code Online (Sandbox Code Playgroud)
其中测量数量是可变的(有时为零).任何信息之间没有完整的空行,并且"测量"和"错误"列在具有其他(字符串)数据的行上为空; 这可能会使解析更难(?).是否有一种简单的方法可以自动执行此转换?我最初的想法是首先使用Python解析文件,然后在循环中将内容提供到DataFrame插槽中,但我不确切知道如何实现它,或者它是否是最佳的行动方案.
提前致谢!