小编A5C*_*2T1的帖子

strsplit一列具有确切信息到两列

我的数据看起来像这样:

    SNP Geno Allele
marker1   G1    AA
marker2   G1    TT
marker3   G1    TT
marker1   G2    CC
marker2   G2    AA
marker3   G2    TT
marker1   G3    GG
marker2   G3    AA
marker3   G3    TT
Run Code Online (Sandbox Code Playgroud)

我希望它看起来像这样:

    SNP Geno Allele1 Allele2
marker1   G1       A       A
marker2   G1       T       T
marker3   G1       T       T
marker1   G2       C       C
marker2   G2       A       A
marker3   G2       T       T
marker1   G3       G       G
marker2   G3       A       A
marker3   G3       T       T
Run Code Online (Sandbox Code Playgroud)

我用这个:

strsplit(Allele, split extended = TRUE)
Run Code Online (Sandbox Code Playgroud)

但这不起作用.我需要其他命令吗?

split r

6
推荐指数
1
解决办法
1万
查看次数

如何计算多个列中因子的出现次数,按一列分组?

我有一个看似简单的问题,但我无法弄清楚如何得到我想要的东西.

我的数据如下:

      Job     C/C++     Java     Python
  Student     FALSE     TRUE      FALSE
Developer      TRUE     TRUE       TRUE
Developer      TRUE     TRUE      FALSE
 Sysadmin      TRUE    FALSE      FALSE
  Student     FALSE     TRUE       TRUE
Run Code Online (Sandbox Code Playgroud)

我想按"作业"列进行分组,并计算TRUE每列中的s 数.我想要的输出看起来像这样:

      Job     C/C++     Java     Python
  Student         0        2          1
Developer         2        2          1 
 Sysadmin         1        0          0
Run Code Online (Sandbox Code Playgroud)

任何帮助将不胜感激.

aggregate r

6
推荐指数
2
解决办法
9413
查看次数

为什么table函数会找到已删除的变量

为什么table函数找到一个被删除的变量?

Dog <- c("Rover", "Spot")
Cat <- c("Scratch", "Fluffy")

Pets <- data.frame(Dog, Cat)  #create a data frame with two variables
names(Pets)
# [1] "Dog" "Cat"

#rename Dog to a longer name

names(Pets)[names(Pets)=="Dog"] <- "Dog_as_very_long_name"
Pets$Dog <- NULL # delete Dog  
names(Pets) 
#[1] "Dog_as_very_long_name" "Cat"  #the variable dog is not in the data set anymore

table(Pets$Dog)  #Why does the table function on a variable that was deleted


#  Rover  Spot 
#  1     1 
Run Code Online (Sandbox Code Playgroud)

r r-table

6
推荐指数
1
解决办法
5784
查看次数

如何安全地转义R中的引号以向SQL提交文本?

我有一些字符串R应该写入MySQL表中使用RODBC.问题是我不知道如何处理字符串中的引号以获取MySQL错误,但也不会弄乱文本?

我确信解决方案有点简单,但目前我有点陷入自己的想法中 - 我没有开箱即用...逃避逃避两次反击逃脱两次或更好4(或8,只是在保存方面)

例:

require(RODBC)
con     <- odbcConnect("MyMySQLDatabase")

string  <- "What's up?"
query   <- "INSERT INTO table (textcolumn) VALUES"

value   <- paste0( "('", string, "')" )
sql     <- paste( query, value, ";")

res     <- sqlQuery(con, sql)
Run Code Online (Sandbox Code Playgroud)

(如何处理我从带有可能的单引号和双引号的文件中读入的文本?)

mysql sql r

6
推荐指数
2
解决办法
4722
查看次数

如何透视表以在R中为可变行值创建列

我有一个包含列的data.frame:Month,Store和Demand.

Month   Store   Demand
Jan     A   100
Feb     A   150
Mar     A   120
Jan     B   200
Feb     B   230
Mar     B   320
Run Code Online (Sandbox Code Playgroud)

我需要转动它来创建一个新的data.frame或数组,每个月都有列,例如:

Store   Jan Feb Mar
A       100 150 120
B       200 230 320
Run Code Online (Sandbox Code Playgroud)

很感谢任何形式的帮助.我刚开始用R.

pivot r reshape

5
推荐指数
2
解决办法
5211
查看次数

替换R中的文本时出错

我用sub替换R中的一个文本.

 x<-"My name is ${name}"
 sub("${name}","Tiger",x)
Run Code Online (Sandbox Code Playgroud)

错误信息:

Error in sub("${name}", "Tiger", x) : 
  invalid regular expression '${name}', reason 'Invalid contents of {}'
Run Code Online (Sandbox Code Playgroud)

输入文本有{},如何修复此错误?

regex replace runtime-error r

5
推荐指数
2
解决办法
1860
查看次数

按总和和另一列按平均值汇总列

我想在日期框架上使用聚合函数,但是对一列进行求和并取另一列的平均值.

这是一个示例数据框

Manager   Category  Amount  SqFt
Joe           Rent     150   500
Alice         Rent     250   700
Joe      Utilities      50   500
Alice    Utilities      75   700
Run Code Online (Sandbox Code Playgroud)

我不能做下面这样的事情.有一个简单的方法吗?

Avg_CPSF=aggregate(cbind(Amount,SqFt)~Manager,data=aaa,FUN=c(sum,mean)
Run Code Online (Sandbox Code Playgroud)

最终我需要

Manager  Amount   SqFT
Joe       200      500
Alice     325      700
Run Code Online (Sandbox Code Playgroud)

这样我就可以通过金额/平方英尺来计算每平方英尺的成本

aggregate r

5
推荐指数
1
解决办法
1万
查看次数

R - 从数据框创建散点图

我有一个all看起来像这样的数据框:

http://pastebin.com/Xc1HEYyH

现在我想创建一个散点图,其中x轴的列标题和相应的值作为数据点.例如:

7|                 x  
6|          x      x  
5|  x       x      x     x    
4|  x       x            x 
3|                             x      x  
2|                             x      x
1|
 ---------------------------------------
    STM    STM    STM   PIC   PIC    PIC
   cold   normal  hot  cold  normal  hot
Run Code Online (Sandbox Code Playgroud)

这应该很容易,但我无法弄清楚如何.

问候

plot r scatter-plot ggplot2 lattice

5
推荐指数
2
解决办法
9175
查看次数

如何按日期对data.frame进行分组?

我有一个.csv文件,格式如下:

Date       ,     Time  , Value
1899-01-01 ,  4:00:00  ,    1
1899-01-01 ,  4:01:00  ,    2
1899-01-01 ,  4:02:00  ,    3
1899-01-01 ,  4:03:00  ,    4
1899-01-01 ,  4:04:00  ,    5
1900-08-22 , 22:00:00  ,  101
1900-08-22 , 22:01:00  ,  102
2013-08-29 ,  4:00:00  , 1000
2013-02-29 ,  4:02:00  , 1001
2013-02-29 ,  4:03:00  , 1002
Run Code Online (Sandbox Code Playgroud)

是否有可能group by date产生data.table的格式如下:

Date      , Vector(variable length)
1899-02-28, c(1,2,3,4,5)
1900-08-22, c(101,102)
1900-08-22, c(1000,1001,1002)
Run Code Online (Sandbox Code Playgroud)

这是我迄今为止最好的(经过一天的尝试):

raw <- read.csv(pathName, header = TRUE, …
Run Code Online (Sandbox Code Playgroud)

aggregate r

5
推荐指数
1
解决办法
7075
查看次数

R - 将列表转换为DataFrame

有一个这样的列表,从1开始.

[[7158]]
[1] 81 72

[[7159]]
[1] 81 69

[[7160]]
[1] 81 79

[[7161]]
[1] 81 84
Run Code Online (Sandbox Code Playgroud)

这需要更改为数据帧,其中每个元素中的第一个数字在一个数据帧列中对齐,每个元素中的第二个数字放在数据帧的第二列中.所以它应该像这样结束

> data.frame("col1" = c(81, 81, 81, 81), "col2" = c(72, 69, 79, 84))
  col1 col2
1   81   72
2   81   69
3   81   79
4   81   84
Run Code Online (Sandbox Code Playgroud)

我尝试过,do.call(rbind.data.frame, my_list)但它似乎将数字放在大量的列中,而不是将其强制转换为所需的两列.使用循环执行此操作将非常简单,但R方式是什么?谢谢.

r list apply dataframe

5
推荐指数
2
解决办法
2万
查看次数