小编Cad*_*ama的帖子

使用R中的绘图可视化交叉表表

我看到了excel生成的情节,我想知道R是否也可以做到.这张图片基本上是交叉表的可视化,比较了当天的天数和当天的优惠膳食以及计算属于这些类别的人数

这张图片基本上是交叉表的可视化,比较了当天的天数与当天的首选膳食以及计算属于这些类别的人数.

我已经阅读了一些R气泡图,但我还没有看到这样的一个.有人能指出我的包裹或网站,解释我如何制作这样的情节?

bubble-chart r crosstab

17
推荐指数
1
解决办法
1万
查看次数

在unix中通过单个列合并两个文件

我想在unix中将两个文件合并为一列.

我有file_a:

subjectid name age  
12 Jane 16  
24 Kristen 90  
15 Clarke 78  
23 Joann 31  
Run Code Online (Sandbox Code Playgroud)

我有另一个file_b:

subjectid prob_disease  
12 0.009  
24 0.738  
15 0.392  
23 1.2E-5  
Run Code Online (Sandbox Code Playgroud)

我想在命令行中合并这些文件.我想通过subjectid合并文件a和b.由于每个文件大约有200万行,我试过R但由于数据量大而冻结,有人可以帮我在linux中做这个吗?期望的输出:

subjectid prob_disease name age  
12 0.009 Jane 16  
24 0.738 Kristen 90   
15 0.392 Clarke 78  
23 1.2E-5 Joanna 31     
Run Code Online (Sandbox Code Playgroud)

请帮助,谢谢!

unix linux merge

15
推荐指数
1
解决办法
3万
查看次数

将x = y行添加到scatterplot

我正在使用汽车包中的scatterplot函数来生成散点图.我希望能够在图中生成一个应该是x = y的参考线.我尝试使用abline,它确实添加了一条线,但它不是x = y线.有人可以帮忙吗?

我的代码如下:

scatterplot(phenos$P1~pheno$P0, data=pheno,spread=FALSE,ylab="6 month timepoint", xlab="Baseline Timepoint", jitter=list(x=1, y=1))
abline(0,1)
Run Code Online (Sandbox Code Playgroud)

谢谢.

plot r line scatter-plot

11
推荐指数
2
解决办法
4万
查看次数

在xgplot2中将x = y行添加到hexplot

您好我正在尝试通过在ggplot中使用hexplots来查看可视化数据集的不同方法.我基本上想要一个带有1.黄土线2的十六进制图.回归线3.x = y线 - >相当于abline(0,1)

到目前为止,我已经提出了这种代码:

c <- ggplot(mtcars, aes(qsec, wt))
c+stat_binhex()+stat_smooth(method="loess", colour="red")+stat_smooth(method='lm', se=FALSE, colour="orange")+ geom_abline(intercept=0, slope=1)
Run Code Online (Sandbox Code Playgroud)

这给出了下图,但我仍然没有看到x = y参考线.请帮忙.我不确定为什么它不起作用.谢谢

在此输入图像描述

visualization r ggplot2

7
推荐指数
1
解决办法
2万
查看次数

具有时间点的分箱纵向数据的意大利面条图

我有一个包含纵向数据的数据框,如下所示

测试

    Names     hr1    hr2    hr3    hr4      workhr_bin
      41     80     76     70     60               7
      42     80     74     75     NA               8
      43     85     NA     60     65               6
      44     NA     NA     NA     60               3
      45     80     70     NA     NA               8
      46     NA     NA     NA     60               3
Run Code Online (Sandbox Code Playgroud)

hr1hr2hr3、的变量hr4包括“姓名”列下的受试者以重复的时间间隔报告的服务时间。“workhr_bin”列包括使用分位数函数获得的 bin。总共有 10 个垃圾箱,1:10。

我正在尝试生成多个由垃圾箱组成的小时意大利面图。本质上它应该产生 10 个图,一个图用于 bin 1 中的数据,另一个图用于数据 bin 2 等。

我尝试这样做:

head(melt(test[,c(2:6)]))
Run Code Online (Sandbox Code Playgroud)

但我最终得到的workhr_bin变量消失了,取而代之的是一个像这样的文件:

  variable value
1   hours1    80
2   hours1    80
3   hours1    85 …
Run Code Online (Sandbox Code Playgroud)

plot r ggplot2

2
推荐指数
1
解决办法
961
查看次数

从R中的数据帧中提取唯一的组合行

我有一个数据框,给出了同一个州提供的人的成对相关性.我给出了一个关于我希望如何处理这些数据的小例子,但是现在我的实际数据集有成对相关的1500万行和更多的附加列.

以下是示例数据:

>sample_data

Pair_1ID    Pair_2ID    CORR    
1           2           0.12    
1           3           0.23    
2           1           0.12    
2           3           0.75    
3           1           0.23    
3           2           0.75    
Run Code Online (Sandbox Code Playgroud)

我想生成一个没有重复的新数据帧,例如在第1行中,人1和2之间的相关性是0.12.第1行与第3行相同,它显示了2和1之间的相关性.由于它们具有相同的信息,我希望最终文件没有重复,我想要一个类似下面的文件:

>output 


Pair_1ID    Pair_2ID    CORR
    1        2          0.12
    1        3          0.23
    2        3          0.75
Run Code Online (Sandbox Code Playgroud)

有人可以帮忙吗?独特的命令不适用于此,我不知道该怎么做.

r

2
推荐指数
1
解决办法
1078
查看次数

在R中创建相关矩阵

我有一个文件,其矩阵为500行(二进制分数)和120列.该文件是0和1的简单矩阵.

>file

00010010101010
01001010100101
00101001010001
11110101001010
Run Code Online (Sandbox Code Playgroud)

我正在编写一个函数,它使用特殊的相关公式来查找行之间的这种相关性.它需要两个向量行作为输入fn(row1,row2).例如.row1和row2并计算此特殊关联.

>fn(file[1,], file[2,])
>0.32
Run Code Online (Sandbox Code Playgroud)

我能够两行但是如何为所有行创建500x500相关矩阵.有人可以帮忙吗?谢谢.

r matrix

1
推荐指数
1
解决办法
675
查看次数

R:排除数据框中具有预设值列表的行

我有一个非常大但与此非常相似的数据框:

df <- data.frame(Group = rep(c('A', 'B', 'C', 'D'), 50),
                 Number = sample(1:100, 200, replace = T))

Group   Number
A   52
B   74
C   22
D   90
A   7
B   93
C   50
D   10
A   31
B   19
Run Code Online (Sandbox Code Playgroud)

我有另一个名为"remove"的数据框,如下所示:

>remove
 Group  Number
    A   52
    C   22
    B   93
    D   10
Run Code Online (Sandbox Code Playgroud)

如何对df数据进行子集,以便在"remove"中排除所有具有Group和Number值的行以获取以下数据帧?该文件非常大,因此我无法手动输入要排除的值.期望的输出:

Group   Number
B   74
D   90
A   7
C   50
A   31
B   19
Run Code Online (Sandbox Code Playgroud)

谢谢!

r extract rows subset dataframe

0
推荐指数
1
解决办法
1万
查看次数