iin*_*ion 35 matlab language-comparisons r machine-learning data-mining
我最近开始学习R,而不是开始用Matlab编写代码,主要是因为它是开源的.我目前在数据挖掘和机器学习领域工作.我发现在R中实现了许多机器学习算法,我仍在探索在R中实现的不同包.
我有一个简单的问题:你如何比较R和Matlab的数据挖掘应用,它的受欢迎程度,利弊,行业和学术接受度等?你会选择哪一个?为什么?
我针对各种指标对Matlab与R进行了各种比较,但我特别感兴趣的是能够得到它在数据挖掘和ML中的适用性的答案.由于这两种语言对我来说都很新,我只是想知道R是否是一个不错的选择.
我感谢任何建议.
dou*_*oug 61
在过去三年左右的时间里,我每天都使用R,而日常使用的最大部分用于机器学习/数据挖掘问题.
我是大学期间的独家Matlab用户; 当时我认为这是一套优秀的工具/平台.我相信今天也是如此.
对于使用MATLAB进行ML /数据挖掘工作的人来说,神经网络工具箱,优化工具箱,统计工具箱和曲线拟合工具箱都是非常需要的(如果不是必不可少的话),但它们都与基础MATLAB环境分开 - 在其他单词,它们必须单独购买.
我在R中学习ML /数据挖掘的前5个列表:
这指的是几件事:首先,一组R套件全部开始arules(可从CRAN获得); 您可以在项目主页上找到完整列表(arules,aruluesViz等).其次,所有这些软件包都基于称为市场预订分析的数据挖掘技术,或者作为关联规则.在许多方面,这个家庭的算法是数据挖掘的本质-详尽穿越大型交易数据库,并找到高于平均水平的协会或相关性在这些数据库中的字段(变量或功能)之间.实际上,您将它们连接到数据源并让它们在一夜之间运行.上述集合中的中心R包被称为arules ; 在arules的CRAN Package页面上,您可以找到arules包上的一些优秀的二级源(R的词典中的小插图)和一般的关联规则技术的链接.
本书的最新版本以数字形式免费提供.同样,在本书的网站(链接到上面)是ESL中使用的所有数据集,可以免费下载.(顺便说一句,我有免费的数字版本;我还从BN.com购买了精装版;数字版本中的所有颜色图都在精装版中复制.)ESL包含对至少一个示例的详细介绍大多数主要的ML规则 - 例如,神经元,SVM,KNN; 无监督技术(LDA,PCA,MDS,SOM,聚类),多种回归,CART,贝叶斯技术,以及模型聚合技术(Boosting,Bagging)和模型调整(正则化).最后,从CRAN获得本书附带的R包(这将节省必须下载输入数据集的麻烦).
可用于R的+3,500个软件包按域划分为大约30个软件包系列或" 任务视图 ".机器学习是这些家庭之一.机器学习任务视图包含大约50个左右的包.其中一些软件包是核心版本的一部分,包括e1071(一个庞大的ML软件包,其中包含许多常见ML类别的工作代码.)
特别关注使用Predictive Analytics标记的帖子
对代码的彻底研究本身就是对R中ML的一个很好的介绍.
我认为最后一个资源是优秀的,但没有进入前5名:
发布在博客A Beautiful WWW
| 归档时间: |
|
| 查看次数: |
26163 次 |
| 最近记录: |