我必须在第1列和第2列上对数据框进行排序;第1列包含数字和文本,应首先对其进行数字排序。在excel中,这是标准的排序方式,但在熊猫中却不是。.在熊猫手册中,我找不到更多有关如何执行此操作的信息。
所以这个数据帧:
Z 762320 296 1
Z 861349 297 0
1 865545 20 20
1 865584 297 0
22 865625 297 0
2 865628 292 5
10 865662 297 0
1 865665 296 0
11 865694 293 1
1 865700 297 0
10 866429 297 0
11 866438 297 0
Run Code Online (Sandbox Code Playgroud)
应该:
1 865545 20 20
1 865584 297 0
1 865665 296 0
1 865700 297 0
2 865628 292 5
10 865662 297 0
10 866429 297 0
11 …Run Code Online (Sandbox Code Playgroud) 我写了一个并行执行命令的脚本.我让他们都写一个条目到同一个日志文件.如果订单错误或条目交错并不重要,但我注意到有些条目丢失了.我应该在写入之前锁定文件,但是,如果多个进程同时尝试写入文件,它会导致缺少条目吗?
我有一个Python/Pandas数据帧(df1),由ID,Chr和位置组成.和由相同类型的数据(ID,Chr,位置),df2组成的数据帧.
我想获得第三个数据帧(df3),该数据帧仅保留基于df1和df2之间的Chr列的df1行,以及df2的pos-start和pos-end内的位置.另外,它需要添加匹配所源自的ID或行df2.
我发现这很困难,有没有人有想法?
请看下面的例子:
df1:
ID1 Chr pos
a 12 500
b 12 250
c 12 300
d 16 2000
e 16 1050
f 16 1075
d 16 1150
g 17 8000
h 17 550
i 17 500
Run Code Online (Sandbox Code Playgroud)
df2:
ID2 Chr pos-start pos-end
x 12 200 400
y 16 1000 1100
z 16 1070 1200
Run Code Online (Sandbox Code Playgroud)
得到的df3:
ID2 ID1 Chr Pos
x b 12 250
x c 12 300
y e …Run Code Online (Sandbox Code Playgroud) 我想知道如何使用bash/sed/awk将列与重复标题组合在一起.
x y x y
s1 3 4 6 10
s2 3 9 10 7
s3 7 1 3 2
Run Code Online (Sandbox Code Playgroud)
至 :
x y
s1 9 14
s2 13 16
s3 10 3
Run Code Online (Sandbox Code Playgroud)