我在bash的"for"循环中有以下awk命令:
awk -v pdb="$pdb" 'BEGIN {file = 1; filename = pdb"_" file ".pdb"}
/ENDMDL/ {getline; file ++; filename = pdb"_" file ".pdb"}
{print $0 > filename}' < ${pdb}.pdb
Run Code Online (Sandbox Code Playgroud)
这将读取一系列名为$ pdb.pdb的文件,并将它们拆分为名为$ pdb_1.pdb,$ pdb_2.pdb,...,$ pdb_21.pdb等的文件.但是,我想生成带有名称的文件比如$ pdb_01.pdb,$ pdb_02.pdb,...,$ pdb_21.pdb,即将填充零添加到"file"变量.
我尝试过以不同的方式使用printf但没有成功.非常感谢帮助.
我有一个具有以下结构的 Pandas 数据框:
A B C
a b 1
a b 2
a b 3
c d 7
c d 8
c d 5
c d 6
c d 3
e b 4
e b 3
e b 2
e b 1
Run Code Online (Sandbox Code Playgroud)
我想把它改成这样:
A B C1 C2 C3 C4 C5
a b 1 2 3 NAN NAN
c d 7 8 5 6 3
e b 4 3 2 1 NAN
Run Code Online (Sandbox Code Playgroud)
换句话说,类似于对 A 和 B 进行分组并将 C 扩展到不同的列。
知道每组的长度是不同的。
C已经订购了 …