小编Ang*_*elo的帖子

识别多个文件中的公共元素

我有一个列的8个文件,每列有不统一的行数.我需要确定所有这8个文件中常见的元素.

我可以执行此任务来比较两个文件,但我无法在shell中编写可行的一个衬垫来执行相同的操作.

有任何想法吗.....

先感谢您.

文件1
Paul
pawan

文件2
拉曼
保罗

巴鲁瓦

File 3
Sweet
barua
Paul

这三个文件的比较答案应该是保罗.

python shell perl

3
推荐指数
2
解决办法
1687
查看次数

R或python中的双色散点图

我有一个包含三列和n行的数据集.第1列包含name,第2列value1和第3列value2(rank2).

我想用显示名称的异常值绘制散点图.

R我使用的命令是:

tiff('scatterplot.tiff')
data<-read.table("scatterplot_data", header=T)
attach(data)
reg1<-lm(A~B)
plot(A,B,col="red")
abline(reg1)
outliers<-data[which(2^(data[,2]-data[,3]) >= 4 | 2^(data[,2]-data[,3]) <=0.25),]

text(outliers[,2], outliers[,3],labels=outliers[,1],cex=0.50)

dev.off()
Run Code Online (Sandbox Code Playgroud)

我得到一个这样的数字: 在此输入图像描述

我想要的是下半部分的标签应该是一种颜色,上半部分的标签应该是另一种颜色,分别是绿色和红色.

任何建议,或调整命令?

python r scatter-plot

3
推荐指数
1
解决办法
2271
查看次数

删除分隔符

我有一个看起来像这样的文件:

('chr1', '1499102', '1500297')
('chr1', '1811177', '1812131')
('chr1', '2312420', '2313646')
('chr1', '6683999', '6684724')
Run Code Online (Sandbox Code Playgroud)

N行数.

我想像这样打印:

chr1 (tab) 1499102 (tab) 1500297
Run Code Online (Sandbox Code Playgroud)

任何一个衬里外壳或python或perl.

python shell perl

2
推荐指数
1
解决办法
260
查看次数

在R中的levelplot函数中调整轴标签的字体大小

我有90乘90的矩阵,我试图得到一个数组相关矩阵.使用以下命令:

pdf('corr.pdf')
data <- read.table("test", header=T) 
z <- cor(data)
levelplot(z)
dev.off() 
Run Code Online (Sandbox Code Playgroud)

我得到这样的图像,我的标签变得污迹斑斑 在此输入图像描述

请提出改善图像的建议.

谢谢

r levelplot

2
推荐指数
1
解决办法
1万
查看次数

if else和awk ...在我的命令中需要修正

我有两个文件file1是一个查询文件,file2是一种字典,每列1列.我想检查file1的元素是否存在于file2中,它应该给出1 else 0作为输出.

这就是我在做的事情:

#!/bin/bash
for i in `cat file1 `
   do
     cat file2 | awk '{ if ($1=="'$i'") print 1 ; else 0 }'>>output
   done 
Run Code Online (Sandbox Code Playgroud)

请提出改进​​命令的建议

谢谢

bash awk

2
推荐指数
1
解决办法
1163
查看次数

Uniq元素提取

我有一个制表符分隔文件,如下所示:

ABCA2   chr9    139021506   139043195
ABCA2   chr9    139021506   139042561
ABCC1   chr16   15950934    16144431
ABCC1   chr16   15950934    16144431
ABCC1   chr16   15950934    16144431
ABCC1   chr16   15950934    16144431
Run Code Online (Sandbox Code Playgroud)

我想基于列提取值,如第ABCA22,3列中的值,并且4应该只提取一次,这是第一次在column1中出现名称.

理想的输出是:

ABCA2   chr9    139021506   139043195
ABCC1   chr16   15950934    16144431
Run Code Online (Sandbox Code Playgroud)

谢谢

bash shell unique

2
推荐指数
2
解决办法
99
查看次数

每个文件中的唯一元素

我有4个文件,并且想知道与其他文件中的元素相比不重叠的元素(每个文件).

档案A.

Vincy
ruby
rome
Run Code Online (Sandbox Code Playgroud)

档案B.

Vincy
rome
Peter
Run Code Online (Sandbox Code Playgroud)

文件C.

Vincy
Paul
alex
Run Code Online (Sandbox Code Playgroud)

档案D.

Vincy
rocky
Willy
Run Code Online (Sandbox Code Playgroud)

任何关于perl,python,shell,bash中的一个衬垫的建议.预期的产出是:

文件:ruby,文件B: Peter,文件C: Paul,Alex文件d: ,.rockyWilly

python bash shell perl

2
推荐指数
1
解决办法
174
查看次数

计算-log10的非常小的值

有没有办法计算-log10值.

值非常小,即3*e-178或e-320.

我已尝试使用公式日志((1/value),10)打开办公室,它工作正常,但是当遇到非常小的值时,它会产生错误,如除零,这是不可能的.

我想当我使用perl或python或R时会发生同样的情况.

请帮助将这些值转换为-log10value

谢谢

注意:我想用基数10计算减去日志值

python perl openoffice.org r

2
推荐指数
1
解决办法
1117
查看次数

组织数据

我有这样的数据文件:

chr1 762440 762981 SAMD11 
chr1 858932 859148 KLHL17 SAMD11 NOC2L 
chr1 859786 860145 KLHL17 SAMD11 NOC2L
chr1 890663 891747 KLHL17 NOC2L  SAMD11  HES4 
Run Code Online (Sandbox Code Playgroud)

我想的是用前三列中的值排列所有名字一个在另一个之下.

像这样的东西

chr1 762440 762981 SAMD11 
chr1 858932 859148 KLHL17
chr1 858932 859148 SAMD11 
chr1 858932 859148 NOC2L 
chr1 859786 860145 KLHL17 
chr1 859786 860145 SAMD11 
chr1 859786 860145 NOC2L
Run Code Online (Sandbox Code Playgroud)

此输出用于前三行,但对于整个集合是期望的.

每行中的名称数量不固定,请记住这一点(可以是1或5或10或20个名称)

What I thought
Run Code Online (Sandbox Code Playgroud)

使用sed -i .bak将名称一个放在另一个下面以及前三列中的值.

但最终变得过于复杂.

你能想到一个更简单的解决方法吗?

谢谢

python bash perl sed

2
推荐指数
1
解决办法
127
查看次数

使用R或Python加热二进制数据图

我有一个0和1的二进制数据集,其中0表示缺席,1表示存在事件.

数据集的示例如下所示:

events    germany    Italy 
Rain      0          1
hail      1          0
sunny     0          0
Run Code Online (Sandbox Code Playgroud)

我想通过从文件中读取数据,以热图的形式获得这些数据的红白图片.

python r

1
推荐指数
1
解决办法
7025
查看次数

标签 统计

python ×7

perl ×5

bash ×4

r ×4

shell ×4

awk ×1

levelplot ×1

openoffice.org ×1

scatter-plot ×1

sed ×1

unique ×1