偶尔我会看到一些小方法,我可以改进R(最近的IQR命令)和R文档(就在本周,或许可以详细说明其间的差异,以及更好地互连聚合,tapply和by).但我没有看到真正做出贡献的方法.我查看了开发人员网站,似乎我的选择是要么尝试成为一个成熟的开发人员,要么创建包,这两者都不符合我希望完成的任务.
我确实在R邮件列表上提出了IQR更改,但没有得到回应,所以我认为这无处可去.
为了澄清,我在谈论base-R.额外的包装是另一回事.
有小费吗?
使用RI想要通过显示其他值的饼图替换二维散点图中的点.
理性的背后是我有数百种元素(蛋白质)的时间序列数据,这些元素来源于监测4种条件的生物实验.我想在y轴上绘制元素(分类数据)并在x轴上绘制事件的时间.为了可视化4个条件之间的相对发生,我想以饼图或圆环图的形式将其可视化,重叠显示在散点图中的相应点上.总体数据密度低,因此重叠不会成为问题.
这可能在R?我在考虑在ggplot2中使用手动缩放,但无法弄清楚如何将饼图定义为缩放.
同样令人感兴趣的是如何最好地聚集这些数据并对其进行相应的排序.
我有以下Python代码和输出:
>>> import numpy as np
>>> s = [12.40265325, -1.3362417499999921, 6.8768662500000062, 25.673127166666703, 19.733372250000002, 21.649556250000003, 7.1676752500000021, -0.85349583333329804, 23.130314250000012, 20.074925250000007, -0.29701574999999281, 17.078694250000012, 3.3652611666666985, 19.491246250000003, -0.76856974999999039, -1.8838917499999965, -6.8547018333333085, 4.5195052500000088, 5.9882702500000136, -9.5889237499999922, 13.98170916666669, -2.3662137499999929, 12.111165250000013, -6.8334957499999902, -21.379336749999993, 8.4651301666666967, 2.5094612500000082, -0.21386274999998989, 5.1226162500000072, 14.283680166666699, -4.3340977499999909, -2.7831607499999933, 8.2339832500000085, -12.841856749999991, -6.4984398333333075, -6.2773697499999912, -13.638411749999996, -15.90088974999999, -8.2505068333333043, -19.616496749999996, -4.4346607499999919, -10.056376749999991, -13.581729833333299, -8.2284047499999957, -4.5957137499999945, -5.3758427499999968, -12.254779833333302, 11.207287250000007, -12.848971749999997, -14.449801749999992, -17.247984749999993, -17.475253833333305]
>>> np.mean(s)
1.3664283380001927e-14
>>> np.std(s)
12.137473069268983
>>> (s - np.mean(s)) / np.std(s)
array([ 1.02184806, -0.11009225, 0.56658138, 2.1151954 , ... …
Run Code Online (Sandbox Code Playgroud) 我有一个数据框,我想添加另一列,这是一个涉及3个其他列的计算结果.我现在使用的方法似乎很慢.有没有更好的方法来做同样的事情.这是我正在使用的方法.
library(bitops)
GetRes<-function(A, B, C){
tagU <- bitShiftR((A*C), 4)
tagV <- bitShiftR(B, 2)
x<-tagU %% 2
y<-tagV %% 4
res<-(2*x + y) %% 4
return(res)
}
df <- data.frame(id=letters[1:3],val0=1:3,val1=4:6,val2=7:9)
apply(df, 1, function(x) GetRes(x[2], x[3], x[4]))
Run Code Online (Sandbox Code Playgroud)
我的数据框非常大,需要很长时间才能完成这项计算.有人可以建议我做得更好吗?
谢谢.