pandas 的索引在日常数据科学任务中发挥重要作用吗?: 不必要。
我喜欢 R/dplyr 的语法,但最近不得不在 pandas 中完成大部分开发。我自己已经成功地避免了索引,没有遇到太多麻烦。事实上,我一贯使用索引的唯一操作是为stack()(类似于 tidyr::gather())和unstack()(类似于 tidyr::spread())函数准备输入。
通过使用reset_index()将遇到的任何索引数据转换为列,很有可能完全避免 Pandas 中的索引。几乎所有需要索引的 pandas 操作都有不需要索引的替代方法。
除此之外,我建议研究 pandas 函数“方法链”。方法链接函数(例如allocate()和query())的构建方式与 R/tidyverse 管道函数非常相似,我相信它们主要针对列而不是索引进行操作,这并非巧合。
这是关于方法链的很好的指南。
有趣的是,这是同一指南中关于索引的另一章。
| 归档时间: |
|
| 查看次数: |
211 次 |
| 最近记录: |