小编taf*_*kje的帖子

数值排序包含数字和字符串的列(pandas / python)

我必须在第1列和第2列上对数据框进行排序;第1列包含数字和文本,应首先对其进行数字排序。在excel中,这是标准的排序方式,但在熊猫中却不是。.在熊猫手册中,我找不到更多有关如何执行此操作的信息。

所以这个数据帧:

Z   762320  296 1
Z   861349  297 0
1   865545  20  20
1   865584  297 0
22  865625  297 0
2   865628  292 5
10  865662  297 0
1   865665  296 0
11  865694  293 1
1   865700  297 0
10  866429  297 0
11  866438  297 0
Run Code Online (Sandbox Code Playgroud)

应该:

1   865545  20  20
1   865584  297 0
1   865665  296 0
1   865700  297 0
2   865628  292 5
10  865662  297 0
10  866429  297 0
11 …
Run Code Online (Sandbox Code Playgroud)

python sorting pandas

3
推荐指数
1
解决办法
5503
查看次数

unix:我可以并行写入同一个文件而不会丢失条目吗?

我写了一个并行执行命令的脚本.我让他们都写一个条目到同一个日志文件.如果订单错误或条目交错并不重要,但我注意到有些条目丢失了.我应该在写入之前锁定文件,但是,如果多个进程同时尝试写入文件,它会导致缺少条目吗?

unix parallel-processing logging

2
推荐指数
1
解决办法
5882
查看次数

在多个条件下合并pandas数据帧(python/pandas)

我有一个Python/Pandas数据帧(df1),由ID,Chr和位置组成.和由相同类型的数据(ID,Chr,位置),df2组成的数据帧.

我想获得第三个数据帧(df3),该数据帧仅保留基于df1和df2之间的Chr列的df1行,以及df2的pos-start和pos-end内的位置.另外,它需要添加匹配所源自的ID或行df2.

我发现这很困难,有没有人有想法?

请看下面的例子:

df1:

ID1 Chr pos
a   12  500
b   12  250
c   12  300
d   16  2000
e   16  1050
f   16  1075
d   16  1150
g   17  8000
h   17  550
i   17  500
Run Code Online (Sandbox Code Playgroud)

df2:

ID2 Chr pos-start   pos-end
x   12  200      400
y   16  1000    1100
z   16  1070    1200
Run Code Online (Sandbox Code Playgroud)

得到的df3:

ID2 ID1 Chr Pos
x   b   12  250
x   c   12  300
y   e …
Run Code Online (Sandbox Code Playgroud)

python merge data-manipulation dataframe pandas

2
推荐指数
1
解决办法
1982
查看次数

如何使用Awk或Bash在1个文件中组合具有相同标头的列

我想知道如何使用bash/sed/awk将列与重复标题组合在一起.

   x y  x  y
s1 3 4  6 10
s2 3 9 10  7
s3 7 1  3  2
Run Code Online (Sandbox Code Playgroud)

至 :

    x  y
s1  9 14
s2 13 16
s3 10  3
Run Code Online (Sandbox Code Playgroud)

bash awk

1
推荐指数
1
解决办法
581
查看次数