我有一个列的8个文件,每列有不统一的行数.我需要确定所有这8个文件中常见的元素.
我可以执行此任务来比较两个文件,但我无法在shell中编写可行的一个衬垫来执行相同的操作.
有任何想法吗.....
先感谢您.
文件1
Paul
pawan
文件2
拉曼
保罗
甜
巴鲁瓦
File 3
Sweet
barua
Paul
这三个文件的比较答案应该是保罗.
我有一个包含三列和n行的数据集.第1列包含name,第2列value1和第3列value2(rank2).
我想用显示名称的异常值绘制散点图.
R我使用的命令是:
tiff('scatterplot.tiff')
data<-read.table("scatterplot_data", header=T)
attach(data)
reg1<-lm(A~B)
plot(A,B,col="red")
abline(reg1)
outliers<-data[which(2^(data[,2]-data[,3]) >= 4 | 2^(data[,2]-data[,3]) <=0.25),]
text(outliers[,2], outliers[,3],labels=outliers[,1],cex=0.50)
dev.off()
Run Code Online (Sandbox Code Playgroud)
我得到一个这样的数字: 
我想要的是下半部分的标签应该是一种颜色,上半部分的标签应该是另一种颜色,分别是绿色和红色.
任何建议,或调整命令?
我有一个看起来像这样的文件:
('chr1', '1499102', '1500297')
('chr1', '1811177', '1812131')
('chr1', '2312420', '2313646')
('chr1', '6683999', '6684724')
Run Code Online (Sandbox Code Playgroud)
N行数.
我想像这样打印:
chr1 (tab) 1499102 (tab) 1500297
Run Code Online (Sandbox Code Playgroud)
任何一个衬里外壳或python或perl.
我有90乘90的矩阵,我试图得到一个数组相关矩阵.使用以下命令:
pdf('corr.pdf')
data <- read.table("test", header=T)
z <- cor(data)
levelplot(z)
dev.off()
Run Code Online (Sandbox Code Playgroud)
我得到这样的图像,我的标签变得污迹斑斑 
请提出改善图像的建议.
谢谢
我有两个文件file1是一个查询文件,file2是一种字典,每列1列.我想检查file1的元素是否存在于file2中,它应该给出1 else 0作为输出.
这就是我在做的事情:
#!/bin/bash
for i in `cat file1 `
do
cat file2 | awk '{ if ($1=="'$i'") print 1 ; else 0 }'>>output
done
Run Code Online (Sandbox Code Playgroud)
请提出改进命令的建议
谢谢
我有一个制表符分隔文件,如下所示:
ABCA2 chr9 139021506 139043195
ABCA2 chr9 139021506 139042561
ABCC1 chr16 15950934 16144431
ABCC1 chr16 15950934 16144431
ABCC1 chr16 15950934 16144431
ABCC1 chr16 15950934 16144431
Run Code Online (Sandbox Code Playgroud)
我想基于列提取值,如第ABCA22,3列中的值,并且4应该只提取一次,这是第一次在column1中出现名称.
理想的输出是:
ABCA2 chr9 139021506 139043195
ABCC1 chr16 15950934 16144431
Run Code Online (Sandbox Code Playgroud)
谢谢
我有4个文件,并且想知道与其他文件中的元素相比不重叠的元素(每个文件).
档案A.
Vincy
ruby
rome
Run Code Online (Sandbox Code Playgroud)
档案B.
Vincy
rome
Peter
Run Code Online (Sandbox Code Playgroud)
文件C.
Vincy
Paul
alex
Run Code Online (Sandbox Code Playgroud)
档案D.
Vincy
rocky
Willy
Run Code Online (Sandbox Code Playgroud)
任何关于perl,python,shell,bash中的一个衬垫的建议.预期的产出是:
文件:ruby,文件B: Peter,文件C: Paul,Alex文件d: ,.rockyWilly
有没有办法计算-log10值.
值非常小,即3*e-178或e-320.
我已尝试使用公式日志((1/value),10)打开办公室,它工作正常,但是当遇到非常小的值时,它会产生错误,如除零,这是不可能的.
我想当我使用perl或python或R时会发生同样的情况.
请帮助将这些值转换为-log10value
谢谢
注意:我想用基数10计算减去日志值
我有这样的数据文件:
chr1 762440 762981 SAMD11
chr1 858932 859148 KLHL17 SAMD11 NOC2L
chr1 859786 860145 KLHL17 SAMD11 NOC2L
chr1 890663 891747 KLHL17 NOC2L SAMD11 HES4
Run Code Online (Sandbox Code Playgroud)
我想的是用前三列中的值排列所有名字一个在另一个之下.
像这样的东西
chr1 762440 762981 SAMD11
chr1 858932 859148 KLHL17
chr1 858932 859148 SAMD11
chr1 858932 859148 NOC2L
chr1 859786 860145 KLHL17
chr1 859786 860145 SAMD11
chr1 859786 860145 NOC2L
Run Code Online (Sandbox Code Playgroud)
此输出用于前三行,但对于整个集合是期望的.
每行中的名称数量不固定,请记住这一点(可以是1或5或10或20个名称)
What I thought
Run Code Online (Sandbox Code Playgroud)
使用sed -i .bak将名称一个放在另一个下面以及前三列中的值.
但最终变得过于复杂.
你能想到一个更简单的解决方法吗?
谢谢
我有一个0和1的二进制数据集,其中0表示缺席,1表示存在事件.
数据集的示例如下所示:
events germany Italy
Rain 0 1
hail 1 0
sunny 0 0
Run Code Online (Sandbox Code Playgroud)
我想通过从文件中读取数据,以热图的形式获得这些数据的红白图片.