用于处理R的大数据的编程语言

Nic*_*ick 0 haskell r clojure

最近我有时间学习数据可视化,作为Excel图表的替代品.我的选择是R(使用ggplot2)并且已经开始学习它.

在"R简而言之"中,约瑟夫阿德勒说:

通常,我使用像Perl这样的工具在R中使用之前预处理大文件.

我建议使用像Perl,Python或Ruby这样的脚本语言来预处理大型复杂的文本文件,并将它们转换为易于理解的形式.(作为一个方面说明,我通常写出在Excel字段名称和长度的列表,然后使用Excel公式来创建R或Perl代码加载它们.

这个想法落后于Unix哲学 - 让每个工具都能很好地完成工作,并让它们协同工作.因此,从长远来看,我打算学习:

  • R用于可视化,和
  • 另一种用于未来数据处理的编程语言.

问题出现在哪种语言学习?

我没有计算机科学背景,同时Perl对我来说太难了.我在网上做了一些搜索,发现Haskell和Clojure非常有趣.由于这里有很多程序员+统计员,我想知道,哪一个作为大数据处理目的与R一起顺利?

缺口

Pau*_*tra 6

我真的不喜欢工作流程中有太多工具.如果我只是使用R就可以逃脱,我更喜欢.您最终必须手动运行一些串联的工具,这使得再次运行更有效.或者你花时间连接不同的工具,这需要时间并引入自己的一系列问题.

对于一个初学程序员来说,坚持使用R还有另一个好处:你花费所有时间学习一种语言,即防止成为所有行业的杰克,但不能掌握.

我使用几种编程语言(R,Python,IDL,Fortran),但是对于数据处理,我倾向于坚持使用纯R,如果我可以帮助它的话.