我的数据看起来像这样:
SNP Geno Allele
marker1 G1 AA
marker2 G1 TT
marker3 G1 TT
marker1 G2 CC
marker2 G2 AA
marker3 G2 TT
marker1 G3 GG
marker2 G3 AA
marker3 G3 TT
Run Code Online (Sandbox Code Playgroud)
我希望它看起来像这样:
SNP Geno Allele1 Allele2
marker1 G1 A A
marker2 G1 T T
marker3 G1 T T
marker1 G2 C C
marker2 G2 A A
marker3 G2 T T
marker1 G3 G G
marker2 G3 A A
marker3 G3 T T
Run Code Online (Sandbox Code Playgroud)
我用这个:
strsplit(Allele, split extended = TRUE)
Run Code Online (Sandbox Code Playgroud)
但这不起作用.我需要其他命令吗?
我有一个看似简单的问题,但我无法弄清楚如何得到我想要的东西.
我的数据如下:
Job C/C++ Java Python
Student FALSE TRUE FALSE
Developer TRUE TRUE TRUE
Developer TRUE TRUE FALSE
Sysadmin TRUE FALSE FALSE
Student FALSE TRUE TRUE
Run Code Online (Sandbox Code Playgroud)
我想按"作业"列进行分组,并计算TRUE每列中的s 数.我想要的输出看起来像这样:
Job C/C++ Java Python
Student 0 2 1
Developer 2 2 1
Sysadmin 1 0 0
Run Code Online (Sandbox Code Playgroud)
任何帮助将不胜感激.
为什么table函数找到一个被删除的变量?
Dog <- c("Rover", "Spot")
Cat <- c("Scratch", "Fluffy")
Pets <- data.frame(Dog, Cat) #create a data frame with two variables
names(Pets)
# [1] "Dog" "Cat"
#rename Dog to a longer name
names(Pets)[names(Pets)=="Dog"] <- "Dog_as_very_long_name"
Pets$Dog <- NULL # delete Dog
names(Pets)
#[1] "Dog_as_very_long_name" "Cat" #the variable dog is not in the data set anymore
table(Pets$Dog) #Why does the table function on a variable that was deleted
# Rover Spot
# 1 1
Run Code Online (Sandbox Code Playgroud) 我有一些字符串R应该写入MySQL表中使用RODBC.问题是我不知道如何处理字符串中的引号以获取MySQL错误,但也不会弄乱文本?
我确信解决方案有点简单,但目前我有点陷入自己的想法中 - 我没有开箱即用...逃避逃避两次反击逃脱两次或更好4(或8,只是在保存方面)
例:
require(RODBC)
con <- odbcConnect("MyMySQLDatabase")
string <- "What's up?"
query <- "INSERT INTO table (textcolumn) VALUES"
value <- paste0( "('", string, "')" )
sql <- paste( query, value, ";")
res <- sqlQuery(con, sql)
Run Code Online (Sandbox Code Playgroud)
(如何处理我从带有可能的单引号和双引号的文件中读入的文本?)
我有一个包含列的data.frame:Month,Store和Demand.
Month Store Demand
Jan A 100
Feb A 150
Mar A 120
Jan B 200
Feb B 230
Mar B 320
Run Code Online (Sandbox Code Playgroud)
我需要转动它来创建一个新的data.frame或数组,每个月都有列,例如:
Store Jan Feb Mar
A 100 150 120
B 200 230 320
Run Code Online (Sandbox Code Playgroud)
很感谢任何形式的帮助.我刚开始用R.
我用sub替换R中的一个文本.
x<-"My name is ${name}"
sub("${name}","Tiger",x)
Run Code Online (Sandbox Code Playgroud)
错误信息:
Error in sub("${name}", "Tiger", x) :
invalid regular expression '${name}', reason 'Invalid contents of {}'
Run Code Online (Sandbox Code Playgroud)
输入文本有{},如何修复此错误?
我想在日期框架上使用聚合函数,但是对一列进行求和并取另一列的平均值.
这是一个示例数据框
Manager Category Amount SqFt
Joe Rent 150 500
Alice Rent 250 700
Joe Utilities 50 500
Alice Utilities 75 700
Run Code Online (Sandbox Code Playgroud)
我不能做下面这样的事情.有一个简单的方法吗?
Avg_CPSF=aggregate(cbind(Amount,SqFt)~Manager,data=aaa,FUN=c(sum,mean)
Run Code Online (Sandbox Code Playgroud)
最终我需要
Manager Amount SqFT
Joe 200 500
Alice 325 700
Run Code Online (Sandbox Code Playgroud)
这样我就可以通过金额/平方英尺来计算每平方英尺的成本
我有一个all看起来像这样的数据框:
现在我想创建一个散点图,其中x轴的列标题和相应的值作为数据点.例如:
7| x
6| x x
5| x x x x
4| x x x
3| x x
2| x x
1|
---------------------------------------
STM STM STM PIC PIC PIC
cold normal hot cold normal hot
Run Code Online (Sandbox Code Playgroud)
这应该很容易,但我无法弄清楚如何.
问候
我有一个.csv文件,格式如下:
Date , Time , Value
1899-01-01 , 4:00:00 , 1
1899-01-01 , 4:01:00 , 2
1899-01-01 , 4:02:00 , 3
1899-01-01 , 4:03:00 , 4
1899-01-01 , 4:04:00 , 5
1900-08-22 , 22:00:00 , 101
1900-08-22 , 22:01:00 , 102
2013-08-29 , 4:00:00 , 1000
2013-02-29 , 4:02:00 , 1001
2013-02-29 , 4:03:00 , 1002
Run Code Online (Sandbox Code Playgroud)
是否有可能group by date产生data.table的格式如下:
Date , Vector(variable length)
1899-02-28, c(1,2,3,4,5)
1900-08-22, c(101,102)
1900-08-22, c(1000,1001,1002)
Run Code Online (Sandbox Code Playgroud)
这是我迄今为止最好的(经过一天的尝试):
raw <- read.csv(pathName, header = TRUE, …Run Code Online (Sandbox Code Playgroud) 有一个这样的列表,从1开始.
[[7158]]
[1] 81 72
[[7159]]
[1] 81 69
[[7160]]
[1] 81 79
[[7161]]
[1] 81 84
Run Code Online (Sandbox Code Playgroud)
这需要更改为数据帧,其中每个元素中的第一个数字在一个数据帧列中对齐,每个元素中的第二个数字放在数据帧的第二列中.所以它应该像这样结束
> data.frame("col1" = c(81, 81, 81, 81), "col2" = c(72, 69, 79, 84))
col1 col2
1 81 72
2 81 69
3 81 79
4 81 84
Run Code Online (Sandbox Code Playgroud)
我尝试过,do.call(rbind.data.frame, my_list)但它似乎将数字放在大量的列中,而不是将其强制转换为所需的两列.使用循环执行此操作将非常简单,但R方式是什么?谢谢.