使用哪种数据挖掘工具?

use*_*818 7 comparison data-mining weka rapidminer

有人可以向我解释最著名的数据挖掘开源工具的主要利弊吗?

我到处都读到RapidMinerWekaOrangeKNIME是最好的。 看这篇博客文章

有人可以在一个小的项目符号列表中进行快速的技术比较。

我的需求如下:

  • 它应支持分类算法(朴素贝叶斯,SVM,C4.5,kNN)。
  • 它应该易于用Java实现。
  • 它应该具有易于理解的文档。
  • 它应该包含参考生产项目或用例。
  • 如果可能,进行一些其他基准比较。

谢谢!

D31*_*181 7

我首先要说的是,列表中每个都有利弊,但我建议从我的亲身经历中将weka排除在列表之外,使用weka jar文件在您自己的Java应用程序中实现起来非常简单自己的数据挖掘工具。

Rapid Miner似乎是一种提供端到端解决方案的商业解决方案,但是,Rapid Miner解决方案的外部实现的最著名例子通常是python,而r脚本不是Java。

Orange提供的工具似乎主要针对那些可能不太需要自定义实现到其自己的软件中的人,但是通过用户迭代可以轻松得多,它是用python编写的,并且提供了源代码,并且支持用户插件。

Knime是另一个商业平台,提供用于数据挖掘和分析的端到端解决方案,并提供了所需的所有工具,该平台在互联网上获得了许多不错的评价,但我还没有充分利用它来向您或任何就其优点或缺点的人提供建议。

看到这里knime vs weka

最好的数据挖掘工具

正如我所说,weka是我个人最喜欢的软件开发人员,但我相信其他人对于选择一个人的选择有不同的理由和看法。希望您找到适合您的解决方案。

根据您的要求,weka还支持以下服务:

朴素贝叶斯

支持向量机

C4.5

知识网络