数据挖掘开源工具

Arn*_*shn 27 open-source data-mining

我打算开展一个涉及数据挖掘的项目.在我加入之前,我想探索一下允许基于Web的报告的不同数据挖掘工具(最好是开源).在我的场景中,数据将提供给我,所以我不应该抓它.

简而言之,我正在寻找一种工具 - 数据分析,基于Web的报告,提供某种仪表板和挖掘功能.

我曾经参与过微软分析服务和BOXI,最近我一直在寻找Pentaho,这似乎是一个不错的选择.

请分享您对任何此类工具的经验.

干杯

Ali*_*xel 12

我相信WEKA是最好的开源DM软件.

检查一下:http://www.cs.waikato.ac.nz/ml/weka/


yba*_*kos 9

Weka很棒,但您可能想尝试使用Orange Data Mining工具包.

http://www.ailab.si/orange/

编辑:截至2010年11月,我必须说我真的很喜欢KNIME.

  • KNIME为+1.几个星期前我发现了这一点,并且对它能做的事情印象非常深刻.支持Java,Python和R脚本,BIRT附加组件使编写报告变得轻而易举. (2认同)

Sha*_*ane 5

R有很多与数据挖掘相关的优秀软件包.特别要看:

它也与Weka联系在一起(参见RWeka包).它可以与.Net(通过COM)或Python(通过RPy或RPy2)集成.

我同意Pentaho的报告平台,虽然这是一个非常大的项目,取决于你使用它的目的.


小智 5

您还应该查看Apache Mahout.它对于某些大规模机器学习任务(例如用户群集)非常有用.


小智 5

RapidMiner是我首选的数据挖掘工具.