小编use*_*185的帖子

在大熊猫中为大型数据集排序

我想按给定列对数据进行排序,特别是p值.但是,问题是我无法将整个数据加载到内存中.因此,以下内容不起作用或者仅适用于小型数据集.

data = data.sort(columns=["P_VALUE"], ascending=True, axis=0)
Run Code Online (Sandbox Code Playgroud)

是否有一种快速方法可以按给定列对数据进行排序,该列只考虑块并且不需要在内存中加载整个数据集?

python pandas

19
推荐指数
2
解决办法
8164
查看次数

在熊猫中重命名系列

我正在使用系列,我想知道如何在写入文件时重命名该系列.例如,我的输出csv包含以下内容:

Gene_Name,0
A2ML1,15
AAK1,8
Run Code Online (Sandbox Code Playgroud)

我想要它如下:

Gene_Name,Count
A2ML1,15
AAK1,8
Run Code Online (Sandbox Code Playgroud)

注意:我不希望我的标题是"Gene_Name,0"而是"Gene_Name,Count".我怎么能做到这一点?

python pandas

7
推荐指数
1
解决办法
7843
查看次数

标签 统计

pandas ×2

python ×2