R与MATLAB中高维数据结构的方法

Question

R与MATLAB中高维数据结构的方法

bri*_*tar 20 arrays matlab methodology r multidimensional-array

题

在R中进行探索性分析的重复试验中积累的分类标签构建多变量数据的正确方法是什么？我不想回到MATLAB.

说明

我喜欢R的分析函数和语法(以及令人惊叹的绘图)比MATLAB更好,并且一直在努力重构我的东西.但是,我一直对工作中数据的组织方式感到困惑.

MATLAB

我通常使用多个时间序列来重复多次试验,这些试验存储在SERIESxSAMPLESxTRIALS 的大矩阵 ~~秩-3张量~~多维数组中.这偶尔适用于一些不错的线性代数东西,但是当涉及另一个变量,即CLASS时,它是笨拙的.通常,类标签存储在尺寸为1x的另一个矢量中TRIALS.

在分析方面,我基本上尽可能少地绘制,因为需要做很多工作来组合一个非常好的情节,教你很多关于MATLAB中的数据.(我不是唯一一个有这种感觉的人).

[R

在R中我一直坚持尽可能接近MATLAB结构,但是当试图保持类标签分离时,事情变得非常复杂; 即使我只使用它们的属性,我也必须继续将标签传递给函数.所以我所做的就是通过CLASS将数组分成一个数组列表.这增加了我所有apply()功能的复杂性,但在保持一致性(和错误)方面似乎是值得的.

另一方面,R对于张量/多维数组似乎并不友好.只是为了与他们合作,你需要抓住abind图书馆.关于多变量分析的文档,比如这个例子似乎是假设你有一个巨大的2-D数据点表,比如~~一些长期的中世纪滚动~~数据框,并且没有提到如何从我所在的位置获得'那里' .

一旦我对绘制的数据进行绘图和分类,它就不是一个大问题了,因为到那时我一直在使用像TRIALSxFEATURES这样的形状的数据框架友好结构(melt对此有很大帮助).另一方面,如果我想快速生成探索阶段的散点图矩阵或latticist直方图集(即统计矩,分离,类/方差,直方图等),我必须停下来弄清楚如何我将apply()这些巨大的多维数组转换为这些库所理解的东西.

如果我继续在丛林中捣乱,为此提出临时解决方案,我要么永远不会变得更好,要么我最终会以自己奇怪的巫术方式结束,这对任何人都没有意义.

那么,对于R中的探索性分析,在重复试验中积累的分类标签构建多变量数据的正确方法是什么？拜托,我不想回到MATLAB.

额外奖励:我倾向于在多个主题的相同数据结构上重复这些分析.有没有比将代码块包装到for循环更好的通用方法？

Answer 1

Bro*_*ieG 19

正如已经指出的,许多更强大的分析和可视化工具依赖于长格式的数据.当然,对于受益于矩阵代数的转换,您应该将数据保存在数组中,但只要您想要对数据的子集进行并行分析,或者根据数据中的因子绘制内容,您真的想要melt.

下面是一个例子,让你开始data.table和ggplot.

数组 - >数据表

首先,让我们以您的格式制作一些数据:

series <- 3
samples <- 2
trials <- 4

trial.labs <- paste("tr", seq(len=trials))
trial.class <- sample(c("A", "B"), trials, rep=T)

arr <- array(
  runif(series * samples * trials), 
  dim=c(series, samples, trials),
  dimnames=list(
    ser=paste("ser", seq(len=series)), 
    smp=paste("smp", seq(len=samples)), 
    tr=trial.labs
  )
)
# , , tr = Trial 1
#        smp
# ser         smp 1     smp 2
#   ser 1 0.9648542 0.4134501
#   ser 2 0.7285704 0.1393077
#   ser 3 0.3142587 0.1012979
#
# ... omitted 2 trials ...
# 
# , , tr = Trial 4
#        smp
# ser         smp 1     smp 2
#   ser 1 0.5867905 0.5160964
#   ser 2 0.2432201 0.7702306
#   ser 3 0.2671743 0.8568685

归档时间：	12 年前
查看次数：	3458 次
最近记录：	12 年前

R与MATLAB中高维数据结构的方法

题

说明

MATLAB

[R

数组 - >数据表

从长格式绘图

数据表 - >数组 - >数据表

也许dplyr :: tbl_cube？

将数组加载到多维数据

易于从多维转换为扁平

子集

分组和汇总措施

nd和2-d数据结构的一致表示法

绘图 - 作为"喜欢"平面数据的R功能的示例

在生成的平面数据上使用data.table

与您的多维数据集动态协作

尺寸 - 或不......

持久性