我想按给定列对数据进行排序,特别是p值.但是,问题是我无法将整个数据加载到内存中.因此,以下内容不起作用或者仅适用于小型数据集.
data = data.sort(columns=["P_VALUE"], ascending=True, axis=0)
Run Code Online (Sandbox Code Playgroud)
是否有一种快速方法可以按给定列对数据进行排序,该列只考虑块并且不需要在内存中加载整个数据集?
我正在使用系列,我想知道如何在写入文件时重命名该系列.例如,我的输出csv包含以下内容:
Gene_Name,0
A2ML1,15
AAK1,8
Run Code Online (Sandbox Code Playgroud)
我想要它如下:
Gene_Name,Count
A2ML1,15
AAK1,8
Run Code Online (Sandbox Code Playgroud)
注意:我不希望我的标题是"Gene_Name,0"而是"Gene_Name,Count".我怎么能做到这一点?