R和SPSS的区别

sfa*_*tor 36 statistics r spss data-analysis

我将很快分析大量的网络流量相关数据,并将对数据进行预处理以进行分析.我发现R和SPSS是最流行的统计分析工具之一.我还将生成相当多的图形和图表.因此,我想知道这两个软件之间的基本区别是什么.

我不是问哪个更好,而只是想知道两者之间的工作流程有什么不同(除了SPSS有GUI之外).无论如何,我将主要使用脚本,所以我想了解其他差异.

Gre*_*now 35

这是我前一段时间发布到R-help邮件列表的内容,但我认为它提供了对R和SPSS的一般差异的高级概述:

在谈论计算机软件的用户友好性时,我喜欢汽车与公共汽车的类比:

公共汽车非常容易使用,您只需要知道要乘坐哪辆公共汽车,在哪里上车,以及在哪里下车(而且您需要支付车费).另一方面,汽车需要更多的工作,你需要有某种类型的地图或方向(即使地图在你的头脑中),你需要时不时地加油,你需要知道的规则道路(有某种类型的驾驶执照).这辆车的最大优点是它可以带你到公共汽车不去的一堆地方,一些需要在公共汽车之间转移的旅行更快.

使用像SPSS这样的类比程序是公共汽车,易于使用标准的东西,但如果你想做一些尚未预先编程的事情,那将非常令人沮丧.

R是一款四轮驱动的SUV(虽然环保),背面有自行车,顶部有皮划艇,在pasenger座椅上有很好的步行和跑鞋,后面还有爬山和冲锋枪.

如果您花时间学习如何使用设备,R可以带您到任何您想去的地方,但这比在SPSS中学习公共汽车站的时间要长.

R有GUI可以使它更容易使用,但也限制了可以轻松使用的功能.SPSS确实有脚本,它不仅仅是一种公共汽车,而是SPSS的一般哲学将人们引向GUI而不是脚本.


Cha*_*ase 34

我在一家使用SPSS进行大部分数据分析的公司工作,出于各种原因 - 我已经开始尝试使用R进行越来越多的自己的分析.我遇到的一些最大的差异包括:

  1. 表的输出 - SPSS具有基本表,通用表,自定义表等,它们都输出到那个漂亮的数据查看器或他们称之为的任何东西.这些可以相对容易地传输到Word文档或Excel表格进行进一步分析/演示.R中的等效函数涉及学习LaTex或使用某种odfWeaveLyx那种性质的东西.
  2. 数据标签 - > SPSS使用变量标签和值标签做得非常好.我还没有找到一个强大的R解决方案来完成同样的任务.
  3. 你提到你将编写大部分工作的脚本,而且我个人认为SPSS的脚本语法非常可怕,以至于我尽可能不再使用SPSS.R语法似乎更符合逻辑,并且更紧密地遵循编程标准.如果遇到麻烦(例如SO),有一个非常活跃的社区可以依赖.我没有找到一个好的SPSS社区来询问我遇到问题的时间.

其他人指出了程序的成本和功能方面的一些重大差异.如果你必须与他人合作,他们对SPSS或R的舒适程度应该起到一个作用,因为你不希望成为你团队中唯一能够处理或编辑你将来编写的脚本的人.

如果你要学习R,统计交换网站上的这篇文章有很多很好的学习资源R:https://stats.stackexchange.com/questions/138/resources-for-learning-r

  • 是的,我的公司中有一些组已经安排了运行的R脚本,从SQL数据库中提取数据,处理它,生成Sweave PDF文件,并将结果通过电子邮件发送给相关人员.R和某些架构上的某些数据库存在一些问题,但是单凭SPSS无法实现这种自动化水平! (2认同)
  • @Chase:我不明白为什么只能用R来做这个.我已经为那些完全相同的公司开发了一些自定义工具:从SPSS获取数据或自动从MySQL获取数据并应用标签/变量名(来自从在线HTML调查的主体到列的另一个MySQL表,生成具有所需格式的表并将其导出为odt文件,可以在任何MsWord(2007+)或OOWriter中打开.输出可以很容易地以主题(标题,颜色,图像,字体,表格的边距等)为主题.这可能是很多工作(而且还有GUI)但从长远来看可能值得. (2认同)

Spa*_*man 23

SPSS的初始工作流程涉及证明编写大额支票的合理性.R是免费提供的.

R有一种用于'脚本'的单一语言,但是没有想到它,R实际上是一种编程语言,内置了很好的数据操作,统计和图形功能.SPSS有'语法','脚本'并且是也可以用Python编写脚本.

另一个重要因素是SPSS将其数据压缩到一个网络安全表结构中.处理其他数据结构可能非常困难,但R自然而然.我不知道从哪里开始处理SPSS中的网络图类型数据,但是有一个包为R做它.

使用R,您还可以使用Sweave将工作流程与报告集成在一起 - 您可以编写包含R代码的嵌入位的文档,生成图表或表格,通过系统运行文件,然后以PDF格式显示报告.非常适合您想要每周报告,或者您做了大量工作,然后老板会为您提供更新的数据集.重新运行,读完,完成.

但是你知道,你的电话......

  • 有一个名为[PSPP](https://www.gnu.org/software/pspp/pspp.html)的免费和开源SPSS风格的软件包。假设。 (2认同)
  • PSPP在功能上非常基础。 (2认同)

Har*_*lan 8

嗯,你是一个体面的程序员吗?如果你是,那么学习R是值得的.你可以使用SPSS在操作和统计建模方面对数据做更多的事情,你的图表也可能更好.另一方面,如果您以前从未真正编程过,或者发现花费几个月成为程序员恐吓的想法,您可能会从SPSS中获得更多价值.你可以用R做的东西的水平,而不是作为一个成熟的编程语言潜入其力量可能并不能证明这一努力是正确的.

还有另一种选择 - 合作.你知道你可以在你的项目上工作的人(你不是说它是学术还是行业,但无论哪种方式......),谁知道R好?


Ric*_*ton 6

这里的一些统计工具之间有一个有趣(并且相当公平)的比较

http://anyall.org/blog/2009/02/comparison-of-data-analysis-packages-r-matlab-scipy-excel-sas-spss-stata/