我有一个包含两列和n多行的文件.
第1列包含names和column2 age.
我想根据age(在第二列)按升序对此文件的内容进行排序.
结果应该显示name最年轻的人name,然后是第二个最年轻的人,依此类推......
有关单线程shell或bash脚本的任何建议.
我有一个变量(Var),它存储10000个值并且是整数性质的.
我想算一下,在此列表中出现1000次或高于1000次数值的次数.
R中的任何一个班轮?
先感谢您.
我有一个如下所示的数据集:
India China Brasil Russia SAfrica Kenya States Indonesia States Argentina Chile Netherlands HongKong
0.0854026763 0.1389383234 0.1244184371 0.0525460881 0.2945586244 0.0404562539 0.0491597968 0 0 0.0618342901 0.0174891774 0.0634064181 0
0.0519483159 0.0573851759 0.0756806292 0.0207164181 0.0409872092 0.0706355932 0.0664503936 0.0775285039 0.008545575 0.0365674701 0.026595575 0.064280902 0.0338135148
0 0 0 0 0 0 0 0 0 0 0 0 0
0.0943708876 0 0 0.0967733329 0 0.0745076688 0 0 0 0.0427047276 0 0.0583873189 0
0.0149521013 0.0067569437 0.0108914448 0.0229991162 0.0151678343 0.0413174214 0 0.0240999375 0 0.0608951432 0.0076549109 0 0.0291972756
0 …Run Code Online (Sandbox Code Playgroud) 我有两个制表符分隔文件(请参阅下面的示例):
Java RAJ
PERL ALEX
PYTHON MAurice
Run Code Online (Sandbox Code Playgroud)
(等等)
ALEX 3.4
SAM 8.9
PEPPER 9.0
Run Code Online (Sandbox Code Playgroud)
现在,如果例如在文件2中也找到ALEX(不确定是否会找到ALEX),我应该有第三个文件,如下所示:
PERL ALEX 3.4
Run Code Online (Sandbox Code Playgroud)
代码应该检查file2中文件1的第2列中的所有值.
有关bash脚本的任何建议吗?
我有两个文件(制表符分隔)一个文件有4列和n行,第二个文件有2列和n行.
第一个文件的第4列与第二个文件的第2列相同.
我想要一个第三个文件,其中包含文件1中的前四列和文件2中的第5列.
对一行bash脚本的任何建议.
我有一张桌子,看起来像这样:
1? 2?
1.0199e-01 2.2545e-01
2.5303e-01 6.5301e-01
1.2151e+00 1.1490e+00
Run Code Online (Sandbox Code Playgroud)
等等...
我想对此数据做一个箱线图。我正在使用的命令是这样的:
pdf('rtest.pdf')
w1<-read.table("data_CMR",header=T)
w2<-read.table("data_C",header=T)
boxplot(w1[,], w2[,], w3[,],outline=FALSE,names=c(colnames(w1),colnames(w2),colnames(w3)))
dev.off()
Run Code Online (Sandbox Code Playgroud)
问题是代替符号beta(?),我在输出中得到了两个点(..)。
任何建议,解决这个问题。
先感谢您。
我需要一个使用sed,awk或perl的内衬来从我的数据文件中删除空行.我文件中的数据如下所示 -
Aamir
Ravi
Arun
Rampaul
Pankaj
Amit
Bianca
Run Code Online (Sandbox Code Playgroud)
这些空白是在随机和任何地方出现在我的数据文件.有人可以建议使用单行从我的数据集中删除这些空白行.
我有一个制表符分隔的文件,其中包含区域以及在这些区域中找到的相应生物实体(我已经检查了 67 个,因此您说每个区域都检查了这 67 个实体的存在或不存在及其频率)。
我以表格格式保存了所有这些数据。
下面给出了示例数据
Region ATF3 BCL3 BCLAF1 BDP1 BRF1 BRF2 Brg1 CCNT2 CEBPB CHD2 CTCF CTCFL E2F6 ELF1
chr1:109102470:109102970 0 0 1 0 0 0 0 1 0 0 4 1 4 1
chr1:110526886:110527386 0 0 0 0 0 0 0 1 1 0 4 1 0 1
chr1:115300671:115301171 0 0 1 0 0 0 0 0 1 1 4 1 1 1
chr1:115323308:115323808 0 0 0 0 0 0 0 1 0 0 2 1 …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用R中的以下数据创建一个饼图:
2009 2010
US 10 12
UK 13 14
Germany 18 11
China 9 8
Malaysia 7 15
Others 13 15
Run Code Online (Sandbox Code Playgroud)
我使用的命令是:
slices<-c(10,13,18,9,7,13,12,14,11,8,15,15)
lbls <- c("US","UK","Germany","China", "Malaysia", "Others","US","UK","Germany","China", "Malaysia", "Others")
pct <- round(slices/sum(slices)*100)
lbls <- paste(lbls,"%",sep="")
lbls <- paste(lbls, pct)
pie(slices,labels = lbls, col=rainbow(length(lbls)), main="Pie Chart of Countries")
Run Code Online (Sandbox Code Playgroud)
我得到的数字 
现在,我如何配置图表,以便国家/地区具有相同的配色方案?并且他们按照相同的顺序分两部分,首先它应该是美国和英国等等.
两个简化了我想在一个饼图中制作两个饼图的问题,其中一半的饼图代表2009年,另一半代表2010年.
善意的帮助.
谢谢
我使用 R 中的复杂热图库根据我的数据制作了热图。下面是我使用的代码以及示例数据。
数据
Gene T1 T2 T3 T4
ARL2-SNX15 4.678845561 3.728158677 4.825892144 3.189954084
PALM 2.657130448 2.880786566 3.054500641 2.408040399
AC239800.3 4.190678312 4.226734964 2.701671155 4.745703221
HBG2 12.09275318 11.943057 12.54390598 11.97291386
ALDH3B2 1.599244728 1.533113992 0.97241763 1.595816246
IGKV1-39 4.67511509 5.139282438 4.79232686 4.853376044
RNU1-2 2.833601135 2.565489873 1.982653588 2.590228834
RNU1-27P 3.006656094 2.851094423 2.135404861 3.214987282
RPL9 9.716225455 9.438792748 9.843155568 9.620418751
HBB 15.00426572 14.86490879 14.9677195 14.97970035
RAP1GAP 5.886838373 5.792277665 7.195829067 5.255034813
HBA1 14.62993733 14.40249302 14.89753465 14.48068449
TUBB1 10.27923383 10.01917144 10.34000216 10.24278332
RNF182 3.44912724 3.949744939 3.511681562 3.971171624
RPL13AP5 …Run Code Online (Sandbox Code Playgroud)