我有一个.txt文件,看起来像这样:
rs1 NC AB NC
rs2 AB NC AA
rs3 NC NC NC
...
Run Code Online (Sandbox Code Playgroud)
对于每一行,我想计算"NC"的频率,以便我的输出如下所示:
rs1 2
rs2 1
rs3 3
...
Run Code Online (Sandbox Code Playgroud)
有人能告诉我如何在R或Linux中执行此操作吗?非常感谢!
我试图用基于染色体perl将.bed文件分成多个文件.例如,我的输入文件是example.bed:
chr1 12190 12227
chr1 12595 12721
chr2 876522 876688
chr2 887378 887521
...
Run Code Online (Sandbox Code Playgroud)
我的理想输出是两个.bed文件:
chr1.bed
chr1 12190 12227
chr1 12595 12721
Run Code Online (Sandbox Code Playgroud)
chr2.bed
chr2 876522 876688
chr2 887378 887521
Run Code Online (Sandbox Code Playgroud)
我知道使用awk这样做更容易,但我希望能够弄清楚如何使用perl脚本来做到这一点.