Python中的Pandas和NumPy + SciPy有什么区别?

187 python numpy scipy pandas

它们看起来非常相似,我很好奇哪种方案对财务数据分析更有利.

Wes*_*ney 294

实际上,pandas提供了基于NumPy构建的高级数据操作工具.NumPy本身就是一个相当低级的工具,与使用MATLAB非常相似.另一方面,pandas提供丰富的时间序列功能,数据对齐,NA友好统计,groupby,合并和连接方法以及许多其他便利.近年来,它在金融应用中变得非常流行.在我即将出版的书中,我将有一章专门讨论使用大熊猫进行财务数据分析.

  • 你应该提到你是熊猫的主要作者.:)这本书有问题:http://shop.oreilly.com/product/0636920023784.do (203认同)
  • 可能是一个愚蠢的问题,但你的答案中提到的"NA友好统计"是什么意思. (5认同)
  • 我认为,他提到考虑到缺失数据的统计数据(NA,"不可用") (5认同)
  • 冷线程,但是,例如,在numpy中复杂的操作,但在大熊猫的语法简化方面呢?进入高级,简单的语法路​​径是否有性能成本? (4认同)
  • 说numpy主要提供有效的数组是否公平,而pandas提供有效的字典?(在这两种情况下,仅限于一致的数据类型而不是自由形式.)对我来说(我现在刚开始研究它),这让我感觉到了潜在的差异:处理标签配对数据(在1d aka dicts and 2d aka表).由于这一点,数据对齐,连接等都成为*可能*,但是对于那些没有理解底层差异的人来说,甚至不清楚那些意味着什么(例如,两个numpy数组的"数据对齐"是什么?). (3认同)

Bre*_*arn 55

大熊猫需要Numpy(几乎所有Python的数字工具都需要).Pandas不严格要求Scipy,但列为"可选依赖项".我不会说大熊猫是Numpy和/或Scipy的替代品.相反,它是一个额外的工具,提供了一种更简化的方式来处理Python中的数字和表格数据.您可以使用pandas数据结构,但可以自由地使用Numpy和Scipy函数来操作它们.