为什么数据选择性能在按字典顺序排序的数据帧上"更好"？

Kei*_*owd 5 python dataframe pandas

我正在通过Wes McKinney的新版Python for Data Analysis和pg.他在第8章中指出,如果索引按字典顺序从最外层开始排序,那么大熊猫中的数据选择性能在分层索引对象(例如,数据帧)上"要好得多".

换句话说,在此数据框上选择数据:

key1 key2 col1
1    a    11
     b    12
2    a    13
     b    14

Run Code Online (Sandbox Code Playgroud)

......比这个数据帧上的数据选择"好得多":

key1 key2 col1
1    a    11
2    a    13
1    b    12
2    b    14

Run Code Online (Sandbox Code Playgroud)

Wes没有对此声明提供解释.

请有人向我解释:

为什么第一个数据帧上的数据选择"比第二个数据帧"好得多？换句话说,当数据框从最外层开始按字典顺序排序时,为什么数据帧上的数据选择具有"更好"的分层索引？
在这种情况下,"更好"意味着什么？快点？内存效率更高？别的什么？

归档时间：	7 年，9 月前
查看次数：	28 次
最近记录：	7 年，9 月前

大熊猫索引的重点是什么？ 46

大熊猫中非唯一索引的性能影响是什么？ 36

大熊猫中非唯一索引的性能影响是什么？ 36

更多相关链接

Pandas - 获取给定列的第一行值 236

matplotlib在导入时需要时间 103

Python游戏库Pygame和Pyglet之间的差异？ 42

使用子集从data.frame中删除列的列表 8

Pandas DataFrame.hist() 不起作用 8

如何使用Python计算Excel文件中的总页数 6

在 Pandas 中按组保留 X% 的最后一行 6

pandas groupby：我可以通过 MultiIndex 列的一级选择 agg 函数吗？ 5

PySpark：获取数据框中每个列的第一个非空值 4

将因子转换为整数,同时保持因子级别排序 3

在函数中使用全局变量 2939

是什么 !!(不是)JavaScript中的运算符？ 2906

如何迭代字符串的单词？ 2895

如何让Git忽略文件模式(chmod)的变化？ 2188

如何在Python中将字符串解析为float或int？ 2108

自制安装特定版本的公式？ 2072

vim"用sudo写"技巧如何工作？ 1347

是否有"以前的兄弟"CSS选择器？ 1253

require,include,require_once和include_once之间的区别？ 1166

测量Python中经过的时间？ 1031