我应该为AI和数据挖掘工作学习哪些python库

tej*_*tan 5 python django statistics data-mining

我正在学习python和django.我需要为数据解析,统计,AI和数据挖掘做大量工作.有许多图书馆可供使用.所以我想知道我应该学习哪个SET.目前我在我心中有以下SET.

  • 解析:美丽的汤
  • 搜索引擎:飞快(它是否会抓取并索引网站?)
  • AI:PyBrain
  • 数据挖掘:橙色(我不确定这个,其他的)

所以我想知道我还需要为这些领域学习什么.或某些人试过的图书馆.基本上我想要我可以在Django中使用的库,我不想要那些不同的框架.

chl*_*chl 1

除了 @aix 引用的 scikit 之外,您可能还想看看以下库:

  • mlpy,一个用于预处理、聚类、预测分类、回归和特征选择的 ML 库。
  • PyML,另一个 ML 库。
  • pandas(Pythonic 横截面、时间序列和统计分析)是一组基于 NumPy 的快速数据结构,针对面板、时间序列和横截面数据分析进行了优化,重点是计量经济学应用。
  • scikits.statsmodels,实现常见的统计模型(OLS/GLS、GLM、M-估计器等)。我真的很喜欢这个包,语法很干净,感觉就像我们没有离开 R。

我真的会再研究一下 Orange 的功能,它是一个用于数据挖掘的全功能应用程序,但您可以从外部脚本调用它,例如,请参阅Beginning with Orange教程以获得一个想法。