小编Ang*_*elo的帖子

基于文件的第二列对数据进行排序

我有一个包含两列和n多行的文件.

第1列包含names和column2 age.

我想根据age(在第二列)按升序对此文件的内容进行排序.

结果应该显示name最年轻的人name,然后是第二个最年轻的人,依此类推......

有关单线程shell或bash脚本的任何建议.

unix bash shell

Ang*_*elo

2018 03-20

184
推荐指数

4
解决办法

20万
查看次数

计算值发生的次数

我有一个变量(Var),它存储10000个值并且是整数性质的.

我想算一下,在此列表中出现1000次或高于1000次数值的次数.

R中的任何一个班轮？

先感谢您.

Ang*_*elo

2011 08-23

9
推荐指数

3
解决办法

4万
查看次数

R中的PCA多色谱

我有一个如下所示的数据集:

India   China   Brasil  Russia  SAfrica Kenya   States  Indonesia   States  Argentina   Chile   Netherlands HongKong
0.0854026763    0.1389383234    0.1244184371    0.0525460881    0.2945586244    0.0404562539    0.0491597968    0   0   0.0618342901    0.0174891774    0.0634064181    0
0.0519483159    0.0573851759    0.0756806292    0.0207164181    0.0409872092    0.0706355932    0.0664503936    0.0775285039    0.008545575 0.0365674701    0.026595575 0.064280902 0.0338135148
0   0   0   0   0   0   0   0   0   0   0   0   0
0.0943708876    0   0   0.0967733329    0   0.0745076688    0   0   0   0.0427047276    0   0.0583873189    0
0.0149521013    0.0067569437    0.0108914448    0.0229991162    0.0151678343    0.0413174214    0   0.0240999375    0   0.0608951432    0.0076549109    0   0.0291972756
0 …

Run Code Online (Sandbox Code Playgroud)

3d plot r cluster-analysis pca

Ang*_*elo

2018 10-08

9
推荐指数

1
解决办法

1万
查看次数

比较两个未分类的文件

我有两个制表符分隔文件(请参阅下面的示例):

档案1

Java    RAJ
PERL    ALEX
PYTHON  MAurice

Run Code Online (Sandbox Code Playgroud)

(等等)

档案2

ALEX    3.4
SAM     8.9
PEPPER  9.0

Run Code Online (Sandbox Code Playgroud)

现在,如果例如在文件2中也找到ALEX(不确定是否会找到ALEX),我应该有第三个文件,如下所示:

PERL ALEX 3.4

Run Code Online (Sandbox Code Playgroud)

代码应该检查file2中文件1的第2列中的所有值.

有关bash脚本的任何建议吗？

bash shell

Ang*_*elo

2011 07-15

7
推荐指数

2
解决办法

1245
查看次数

合并两个文件

我有两个文件(制表符分隔)一个文件有4列和n行,第二个文件有2列和n行.

第一个文件的第4列与第二个文件的第2列相同.

我想要一个第三个文件,其中包含文件1中的前四列和文件2中的第5列.

对一行bash脚本的任何建议.

unix bash shell

Ang*_*elo

lucky-day

6
推荐指数

1
解决办法

5818
查看次数

R语言中的特殊字符

我有一张桌子，看起来像这样：

1?              2?     
1.0199e-01        2.2545e-01       
2.5303e-01        6.5301e-01
1.2151e+00        1.1490e+00

Run Code Online (Sandbox Code Playgroud)

等等...

我想对此数据做一个箱线图。我正在使用的命令是这样的：

pdf('rtest.pdf')
 w1<-read.table("data_CMR",header=T)
 w2<-read.table("data_C",header=T)
boxplot(w1[,], w2[,], w3[,],outline=FALSE,names=c(colnames(w1),colnames(w2),colnames(w3)))
dev.off()

Run Code Online (Sandbox Code Playgroud)

问题是代替符号beta（？），我在输出中得到了两个点（..）。

任何建议，解决这个问题。

先感谢您。

Ang*_*elo

2012 02-06

5
推荐指数

1
解决办法

1486
查看次数

删除数据集中的空行

我需要一个使用sed,awk或perl的内衬来从我的数据文件中删除空行.我文件中的数据如下所示 -

Aamir
Ravi 

Arun


Rampaul
Pankaj

Amit

Bianca

Run Code Online (Sandbox Code Playgroud)

这些空白是在随机和任何地方出现在我的数据文件.有人可以建议使用单行从我的数据集中删除这些空白行.

shell perl awk sed

Ang*_*elo

2011 11-25

4
推荐指数

2
解决办法

6519
查看次数

庞大数据集的热图

我有一个制表符分隔的文件，其中包含区域以及在这些区域中找到的相应生物实体（我已经检查了 67 个，因此您说每个区域都检查了这 67 个实体的存在或不存在及其频率）。

我以表格格式保存了所有这些数据。

下面给出了示例数据

Region  ATF3    BCL3    BCLAF1  BDP1    BRF1    BRF2    Brg1    CCNT2   CEBPB   CHD2    CTCF    CTCFL   E2F6    ELF1
chr1:109102470:109102970    0   0   1   0   0   0   0   1   0   0   4   1   4   1
chr1:110526886:110527386    0   0   0   0   0   0   0   1   1   0   4   1   0   1
chr1:115300671:115301171    0   0   1   0   0   0   0   0   1   1   4   1   1   1
chr1:115323308:115323808    0   0   0   0   0   0   0   1   0   0   2   1 …

Run Code Online (Sandbox Code Playgroud)

python bioinformatics heatmap

Ang*_*elo

2013 01-14

4
推荐指数

1
解决办法

7976
查看次数

将两个饼图合二为一

我正在尝试使用R中的以下数据创建一个饼图:

    2009    2010
US  10  12
UK  13  14
Germany 18  11
China   9   8
Malaysia    7   15
Others  13  15

Run Code Online (Sandbox Code Playgroud)

我使用的命令是:

slices<-c(10,13,18,9,7,13,12,14,11,8,15,15)
 lbls <- c("US","UK","Germany","China", "Malaysia", "Others","US","UK","Germany","China", "Malaysia", "Others") 
 pct <- round(slices/sum(slices)*100)
 lbls <- paste(lbls,"%",sep="")
 lbls <- paste(lbls, pct)
 pie(slices,labels = lbls, col=rainbow(length(lbls)),  main="Pie Chart of Countries")

Run Code Online (Sandbox Code Playgroud)

我得到的数字

现在,我如何配置图表,以便国家/地区具有相同的配色方案？并且他们按照相同的顺序分两部分,首先它应该是美国和英国等等.

两个简化了我想在一个饼图中制作两个饼图的问题,其中一半的饼图代表2009年,另一半代表2010年.

善意的帮助.

谢谢

plot r pie-chart

Ang*_*elo

2017 12-22

4
推荐指数

2
解决办法

3189
查看次数

从热图中提取行名称

我使用 R 中的复杂热图库根据我的数据制作了热图。下面是我使用的代码以及示例数据。

数据

Gene    T1  T2  T3  T4
ARL2-SNX15  4.678845561 3.728158677 4.825892144 3.189954084
PALM    2.657130448 2.880786566 3.054500641 2.408040399
AC239800.3  4.190678312 4.226734964 2.701671155 4.745703221
HBG2    12.09275318 11.943057   12.54390598 11.97291386
ALDH3B2 1.599244728 1.533113992 0.97241763  1.595816246
IGKV1-39    4.67511509  5.139282438 4.79232686  4.853376044
RNU1-2  2.833601135 2.565489873 1.982653588 2.590228834
RNU1-27P    3.006656094 2.851094423 2.135404861 3.214987282
RPL9    9.716225455 9.438792748 9.843155568 9.620418751
HBB 15.00426572 14.86490879 14.9677195  14.97970035
RAP1GAP 5.886838373 5.792277665 7.195829067 5.255034813
HBA1    14.62993733 14.40249302 14.89753465 14.48068449
TUBB1   10.27923383 10.01917144 10.34000216 10.24278332
RNF182  3.44912724  3.949744939 3.511681562 3.971171624
RPL13AP5 …

Run Code Online (Sandbox Code Playgroud)

r heatmap complexheatmap

Ang*_*elo

lucky-day

3
推荐指数

1
解决办法

514
查看次数