小编nov*_*her的帖子

使用iloc从数据框中切片多个列范围

我有32列的df

df.shape
(568285, 32)
Run Code Online (Sandbox Code Playgroud)

我正在尝试以特定方式重新排列列,并使用iloc删除第一列

 df = df.iloc[:,[31,[1:23],24,25,26,28,27,29,30]]
                         ^
SyntaxError: invalid syntax
Run Code Online (Sandbox Code Playgroud)

这是正确的方法吗?

python indexing dataframe pandas

7
推荐指数
2
解决办法
4010
查看次数

将多个分隔符列拆分为多个列

我有一个9列的文件.其中一列保持着这样的字符串

Unique
3:107912234-107912321(-)
4:107913333-107913322(+)
Y:222002110-221002100(+)
MT:34330044-343123232(-)
X:838377373-834121212(+)
Run Code Online (Sandbox Code Playgroud)

〜400,000行,不同的字符串.如何将它分成同一个df中的4个不同的列,df.str(",")如果只有一个分隔符我可以使用,但由于它有不同的分隔符,我迷路了.

预期产量:

chr  start  end  strand
3    107912234 107912321 -
4    107913333 107913322 + 
Y    222002110 221002100 + 
MT   34330044  343123232 -
X    838377373 834121212 +
Run Code Online (Sandbox Code Playgroud)

python pandas

4
推荐指数
1
解决办法
1214
查看次数

使用熊猫和情节进行相关

    geneid  fdr_new fdr_old
gene1   4.66E-05    1.45E-05
gene2   0.059650791 0.043799129
gene3   0.04405402  0.061581326
gene4   0.032286852 0.088522898
gene5   0.025672937 0.004911527
gene6   0.001094006 0.000229285
gene7   0.098444488 0.002132802
gene8   0.006079767 0.000230392
gene9   0.000117813 0.000894136
gene10  0.004925041 0.002640812
gene11  0.00036314  5.46E-05
gene12  0.026337682 0.018557193
gene13  0.001503366 0.004951799
gene14  3.05E-05    4.37E-06
gene15  0.001006888 0.009248765
gene16  8.11E-05    0.006124903
gene17  0.062408836 0.026734781
gene18  0.09637641  0.097559967
gene19  0.00405273  0.075971307
gene20  0.078261356 0.080722817
gene21  0.033206859 0.019133673
gene22  0.029851363 0.037940196
Run Code Online (Sandbox Code Playgroud)

如何使用pandas将fdr_old与fdr_new关联起来并得到这样的情节 在此输入图像描述

谢谢

编辑:

或类似的东西. 在此输入图像描述

python pandas

2
推荐指数
1
解决办法
1744
查看次数

如何在r中平滑ecdf图

我有一个df5变量,

头(DF,15)

               junc  N1.ir  N2.ir    W1.ir    W2.ir    W3.ir
1  pos$chr1:3197398  0.000000  0.000000  0.000000  0.000000  0.000000
2  pos$chr1:3207049  0.000000  0.000000  0.000000  0.000000  0.000000
3  pos$chr1:3411982  0.000000  0.000000  0.000000  0.000000  0.000000
4  pos$chr1:4342162  0.000000  0.000000  0.000000  0.000000  0.000000
5  pos$chr1:4342918  0.000000  0.000000  0.000000  0.000000  0.000000
6  pos$chr1:4767729 -4.369234 -5.123382 -4.738768 -4.643856 -5.034646
7  pos$chr1:4772814 -3.841302 -3.891419 -4.025029 -3.643856 -3.184425
8  pos$chr1:4798063 -5.038919 -4.847997 -5.497187 -4.035624 -7.543032
9  pos$chr1:4798567 -4.735325 -5.096862 -3.882643 -3.227069 -4.983808
10 pos$chr1:4818730 -8.366322 -7.118941 -8.280771 …
Run Code Online (Sandbox Code Playgroud)

r ggplot2 cdf ecdf

2
推荐指数
1
解决办法
2363
查看次数

groupby和过滤熊猫

DF:

    make    country other_columns   sale
honda   tokyo   data    1
honda   hirosima    data    0
toyota  tokyo   data    1
toyota  hirosima    data    0
suzuki  tokyo   data    0
suzuki  hirosima    data    0
ferrari tokyo   data    1
ferrari hirosima    data    0
nissan  tokyo   data    1
nissan  hirosima    data    0
Run Code Online (Sandbox Code Playgroud)

条件:保持对1,0

期望的输出

make    country other_columns   sale
honda   tokyo   data    1
honda   hirosima    data    0
toyota  tokyo   data    1
toyota  hirosima    data    0
ferrari tokyo   data    1
ferrari hirosima    data    0
nissan  tokyo   data    1
nissan …
Run Code Online (Sandbox Code Playgroud)

python dataframe python-2.7 pandas pandas-groupby

2
推荐指数
1
解决办法
1050
查看次数

标签 统计

pandas ×4

python ×4

dataframe ×2

cdf ×1

ecdf ×1

ggplot2 ×1

indexing ×1

pandas-groupby ×1

python-2.7 ×1

r ×1