我在将文件与另一个文件连接之前对其进行排序,使用
sort -k1 file1 > file1_sort
Run Code Online (Sandbox Code Playgroud)
当我尝试加入第二个文件时,我收到一条错误消息,指出 file1 未排序。我认为这是由于以下条目而发生的:
chr6_32609371_I I2 D
chr6_32609371 T C
Run Code Online (Sandbox Code Playgroud)
在我的排序文件中,“chr6_32609371”行需要放在“chr6_32609371_I”之前。有没有我可以添加到 sort 命令中的参数来实现这一点?
我有一个包含基因型数据的文件。第二列将特定遗传变异的两个等位基因串联在一起,如下所示。
rs969931 CA 1.000 2.000 2.000 2.000 2.000 2.000 1.000 1.000
rs2745406 CT 0.000 2.000 2.000 1.000 1.000 2.000 1.000 1.000
rs6939431 AG 0.000 0.000 0.000 0.000 0.000 0.000 1.000 0.000
rs1233427 AG 1.000 2.000 2.000 2.000 2.000 1.000 1.000 1.000
rs1233426 AG 1.000 2.000 2.000 2.000 2.000 1.000 1.000 1.000
rs1233425 GC 1.000 1.999 1.999 2.000 2.000 2.000 1.000 1.000
rs362546 GA 1.000 2.000 2.000 2.000 2.000 1.000 1.000 1.000
rs909968 AG 0.000 2.000 2.000 1.000 1.000 1.000 1.000 …
Run Code Online (Sandbox Code Playgroud)