我想折叠以下数据帧
DF
chr start stop gain loss pvalue_gain pvalue_loss
6 68838806 68857819 0 6 1.00000000 0.05105438
9 29779560 29788411 5 1 0.02320654 1.00000000
9 29788411 29809428 5 1 0.02320654 1.00000000
9 29809428 29831788 5 1 0.02320654 1.00000000
9 29831788 29899917 4 1 0.05145798 1.00000000
10 650294 727180 7 0 0.07759025 1.00000000
Run Code Online (Sandbox Code Playgroud)
我想为每个chr折叠,其中连续行上的gain,loss,pvalue_gain和pvalue_loss数字相同.但是,对于折叠数据帧时的这些连续行,我想使用这些连续行的第一行中的起始编号和这些连续行中的最后一个停止编号.
例如-
chr start stop gain loss pvalue_gain pvalue_loss
9 29779560 29788411 5 1 0.02320654 1.00000000
9 29788411 29809428 5 1 0.02320654 1.00000000
9 29809428 29831788 5 1 0.02320654 …Run Code Online (Sandbox Code Playgroud) 对于文件中的每一行,我想在第四个破折号之前打印该行上的所有内容。
输入:
TCGA-HC-8216-10A-11D-A323-01
TCGA-J4-8200-10A-11D-A323-01
TCGA-EJ-A65E-10A-11D-A323-01
Run Code Online (Sandbox Code Playgroud)
我想在第四个破折号“-”上分割每一行
输出:
TCGA-HC-8216-10A
TCGA-J4-8200-10A
TCGA-EJ-A65E-10A
Run Code Online (Sandbox Code Playgroud)
我知道我可以像这样在每个破折号上分开:
#!/usr/bin/env bash
IN="TCGA-HC-8216-01A-11D-A323-01
TCGA-J4-8200-10A-11D-A323-01
TCGA-EJ-A65E-10A-11D-A323-01"
arr=$(echo $IN | tr "-" "\n")
for x in $arr
do
echo "> [$x]"
done
Run Code Online (Sandbox Code Playgroud)
但这会在每个破折号之间分割并打印字符串的每个部分。
您将如何将点添加到多个不同长度的箱线图中?
boxplot(box1, box2, box3, box4, beside=T, col=c("grey100", "grey70", "grey50", "grey70"), names=c("box1", "box2", "box3", "box4"), main="all the boxes", las=2)
Run Code Online (Sandbox Code Playgroud)
如果我放入一些东西
points()
Run Code Online (Sandbox Code Playgroud)
功能我不能添加多个,如果我将它们分开放置,它们将被添加到所有箱线图中,我只想看到相应的点。