推荐的用于统计的 Linux 发行版?

dmv*_*nna 0 distribution-choice

鉴于RPython和许多其他用于统计的开源库在 Linux 中比 Windows/OSX 有更好的支持(想到 rPy),我觉得很奇怪以前没有人问过这个问题。所以我现在这样做:

从事统计/数据分析/机器学习的 Linux 发行版人员更喜欢/推荐哪些 Linux 发行版?

PS:我问这个问题有点尴尬,因为通过使用 Python 和 R 的内置包管理,理论上我应该不会遇到与基本系统的任何冲突。:P

slm*_*slm 6

我认为你会发现引擎盖下的发行版并不重要。特别是如果您使用 R 和 Python。

通常,人们使用virtualenvvirtualenvwrapper管理自己的 Python 版本,并将他们想要的各种包安装到其中,而不是尝试与发行版的 Python 共存。

现在大多数编程语言,如 Perl、Python、Ruby 和 R 都提供了这个管理层。Ruby 有rvm,Perl 有perlbrew,R 有Renv

此外,它们提供了自己的包管理层,用于系统地安装各种库和工具,因此发行版对于这些类型的工具来说实际上并不重要。

例子

现在我的笔记本电脑上安装了多个版本的 Ruby:

$ rvm list

rvm rubies

   ruby-1.9.2-head [ x86_64 ]
   jruby-1.5.6 [ amd64-java ]
   ruby-1.9.2-p290 [ x86_64 ]
=> ruby-1.9.2-p180 [ x86_64 ]
   ree-1.8.7-2011.03 [ x86_64 ]
Run Code Online (Sandbox Code Playgroud)

我目前设置为使用 ruby​​-1.9.2-p290:

$ which ruby
~/.rvm/rubies/ruby-1.9.2-p180/bin/ruby
Run Code Online (Sandbox Code Playgroud)

这个版本还安装了几个 gems(库):

$ gem list|head -10
abstract (1.0.0)
actionmailer (3.0.10, 3.0.5)
actionpack (3.0.10, 3.0.5)
activemodel (3.0.10, 3.0.5)
activerecord (3.0.10, 3.0.5)
activeresource (3.0.10, 3.0.5)
activesupport (3.0.10, 3.0.5)
akami (1.2.0)
albino (1.3.3)
anemone (0.7.2)
Run Code Online (Sandbox Code Playgroud)

大多数管理层提供与此相同的功能。下面是perlbrew例如:

$ perlbrew list
  local (5.14.0)
* perl-5.14.0

$ which perl
~/apps/perl5/perlbrew/perls/perl-5.14.0/bin/perl
Run Code Online (Sandbox Code Playgroud)

Python 和 R 没有什么不同。以这种方式管理环境的优点是我的安装都保存在我的主目录中,因此我可以将它们从一台机器移到另一台机器并将它们保留在我的工作中,而不是浪费我的时间来管理这些资源的发行版本身。