小编Jam*_*mes的帖子

正则表达式 - 在第二次出现之前返回所有内容

鉴于此字符串:

DNS000001320_309.0/121.0_t0
Run Code Online (Sandbox Code Playgroud)

如何在第二次出现"_"之前返回所有内容?

DNS000001320_309.0/121.0
Run Code Online (Sandbox Code Playgroud)

我在用R.

谢谢.

regex r

14
推荐指数
4
解决办法
1万
查看次数

通过查找更改列名称

我知道我可以通过以下方式更改data.frame列名:

colnames(df)[3] <- "newname"
Run Code Online (Sandbox Code Playgroud)

但是可能存在我想要更改的列不在第3位的情况.有没有办法按名称查找列并更改它?像这样...

colnames(df)[,"oldname"] <- "newname"
Run Code Online (Sandbox Code Playgroud)

顺便说一句,我已经尝试过这段代码而且我一直在努力incorrect number of subscripts on matrix.

谢谢.

r dataframe

13
推荐指数
3
解决办法
7396
查看次数

保留大量数字

我正在尝试读取第一列中包含条形码的CSV文件,但是当R将其转换为data.frame时,它将转换16655350046611.67E+12.

有没有办法以整数格式保存这个数字?我尝试分配一类"double",但是没有用,也没有分配一类"character".一旦它处于1.67E+12格式,任何将其转换回整数的尝试都会返回167000000000.

csv precision import r numeric

12
推荐指数
5
解决办法
2万
查看次数

从单个文本文件中读取多个表?

我有一个单独的.txt文件,其中包含许多表.有没有办法将每个这些读入自己的数据框?每个'table'前面都有一行标题,所以我可以搜索这些标题.

谢谢您的帮助.

r text-files

9
推荐指数
1
解决办法
1755
查看次数

将Y轴放在热图的左侧?

如何使用左侧的Y轴标签制作热图?它似乎默认为正确.我是否需要使用自定义轴axis()

graphics r heatmap

9
推荐指数
1
解决办法
9641
查看次数

如何ddply()没有排序?

我使用以下代码汇总我的数据,按复合,复制和质量分组.

summaryDataFrame <- ddply(reviewDataFrame, .(Compound, Replicate, Mass), 
  .fun = calculate_T60_Over_T0_Ratio)
Run Code Online (Sandbox Code Playgroud)

不幸的副作用是生成的数据框按这些字段排序.我想这样做并保持Compound,Replicate和Mass的顺序与原始数据框中的顺序相同.有任何想法吗?我尝试将顺序整数的"排序"列添加到原始数据中,但当然我不能在.variables中包含它,因为我不想'分组'那样,所以它不会在summaryDataFrame.

谢谢您的帮助.

sorting r plyr

8
推荐指数
1
解决办法
3643
查看次数

数据框列命名

我正在创建一个这样的简单数据框:

qcCtrl <- data.frame("2D6"="DNS00012345", "3A4"="DNS000013579")
Run Code Online (Sandbox Code Playgroud)

我的理解是列名称应为"2D6"和"3A4",但它们实际上是"X2D6"和"X3A4".为什么要添加X以及如何停止?

r dataframe

6
推荐指数
1
解决办法
2553
查看次数

显示文件或对象之间的差异

在R中有没有办法比较对象并返回有用的东西,比如差异在哪里?我需要比较文件,但我愿意将它们读入data.frames.这可能只是从命令行处理得更好,但我想将我的测试封装到一个R脚本中.我的下一次尝试是使用ddply将每一行发送到compare()函数并返回"FALSE"行的行号,但这只有在你有一次插入或删除时才有效,然后其他所有行都变为"FALSE".

谢谢.

编辑:文件包含数字和字符数据的组合.

diff r

5
推荐指数
2
解决办法
5758
查看次数

R data.table文本解析

我有一个data.table,其中包含一个包含"Exp 928.6.3(DMSO)"等文本的列.我想将其解析为"Exp 928"和"6.3"之类的列.似乎强大的data.table应该能够快速完成这项工作,但我无法弄清楚如何根据自己的意愿进行弯曲.有什么想法吗?

谢谢,詹姆斯

> dput(head(dat))
structure(list(Experiment = c("Exp 927.1.1 (DMSO)", "Exp 927.1.2 (DMSO)", 
"Exp 927.1.3 (DMSO)", "Exp 927.1.4 (DMSO)", "Exp 927.1.5 (DMSO)", 
"Exp 927.1.6 (DMSO)"), Conc.1..LP9. = c("Failed", "Failed", "Failed", 
"Failed", "Failed", "0.97"), Conc.2..LP11. = c("Failed", "Failed", 
"Failed", "Failed", "Failed", "0.87"), Conc.3..LP13. = c("Failed", 
"Failed", "Failed", "Failed", "Failed", "0.81"), Conc.4..LP15. = c("Failed", 
"Failed", "Failed", "Failed", "Failed", "0.76"), Conc.5..LP17. = c("Failed", 
"Failed", "Failed", "Failed", "Failed", "0.58"), Conc.1.uM..µM. = c("Failed", 
"Failed", "Failed", "Failed", "Failed", "0.001"), Conc.2.uM..µM. = c("Failed", 
"Failed", "Failed", "Failed", …
Run Code Online (Sandbox Code Playgroud)

parsing text r data.table

5
推荐指数
1
解决办法
215
查看次数

如何grep这个而不是那个?

我试图从list.files返回一个文件名,但有2个类似命名的文件. filename.csv filename_review.csv

我想将每个文件名放入自己的列表中.这样做filename_review.csv很容易,因为它有独特的东西,但我如何筛选出另一个呢?我需要grep(".csv", list.files())filename_review.csv返回.

regex r

4
推荐指数
1
解决办法
371
查看次数

创建没有扩展名的zip

我想创建一个名为"out"而不是"out.zip"的zip文件.当我运行这一行时:

zip("out", zippedfiles)
Run Code Online (Sandbox Code Playgroud)

这里zippedfiles是文件列表,我得到out.zip.我在Windows环境中这样做.

谢谢.

zip r

4
推荐指数
1
解决办法
1045
查看次数

R - ddply并递增一个计数器

我正在使用ddply拆分数据框并将块发送到函数.在线之前ddply,我设置了i=1.然后在函数内部我递增,i以便每个数据块获得一个新数字.但是,当我运行它时,i每次调用该函数时都会重置为1.我假设这是因为i每次ddply发送新的数据块时都会重新分配函数外部.有没有办法在函数外部递增并将该数字与数据一起发送?

编辑::这是主叫行:

rseDF <- ddply(rseDF, .(TestCompound), .fun = setTheSet)
Run Code Online (Sandbox Code Playgroud)

这是功能:

##Set The Set Column
setTheSet <- function(df) {
if (df[,"TestCompound"] == "DNS000000001") df[,"Set"] <- "Control"
else {df[,"Set"] <- i
i <<- i+1}
return(df)
}
Run Code Online (Sandbox Code Playgroud)

scope r plyr

2
推荐指数
1
解决办法
1501
查看次数

如何根据2列选择行?

dx <- data.frame(CMPD = c("cmpd1","cmpd1","cmpd1","cmpd1","cmpd2","cmpd2",
                          "cmpd2","cmpd2","cmpd3","cmpd3","cmpd3","cmpd3"),
                 MRM = c("309.0/121.1","309.0/121.1","309.0/90.1",
                         "309.0/90.1","305.2/140.3","305.2/140.3","300.5/107.3",
                         "300.5/107.3","404.8/126.0","404.8/126.0","401.5/91.0",
                         "401.5/91.0"),
                 RESP = c(123.4,234.5,345.6,456.7,567.8,678.9,789.0,12.4,
                          23.5,34.6,45.7,56.8))
Run Code Online (Sandbox Code Playgroud)

-

>dx

CMPD         MRM  RESP

1  cmpd1 309.0/121.1 123.4
2  cmpd1 309.0/121.1 234.5
3  cmpd1  309.0/90.1 345.6
4  cmpd1  309.0/90.1 456.7
5  cmpd2 305.2/140.3 567.8
6  cmpd2 305.2/140.3 678.9
7  cmpd2 300.5/107.3 789.0
8  cmpd2 300.5/107.3  12.4
9  cmpd3 404.8/126.0  23.5
10 cmpd3 404.8/126.0  34.6
11 cmpd3  401.5/91.0  45.7
12 cmpd3  401.5/91.0  56.8
Run Code Online (Sandbox Code Playgroud)

我想是能够基于所述的组合的独特性与该数据进行工作CMPD并且MRM(例如行1,2,则行3,4等)

r

1
推荐指数
1
解决办法
746
查看次数

标签 统计

r ×13

dataframe ×2

plyr ×2

regex ×2

csv ×1

data.table ×1

diff ×1

graphics ×1

heatmap ×1

import ×1

numeric ×1

parsing ×1

precision ×1

scope ×1

sorting ×1

text ×1

text-files ×1

zip ×1