为什么数据选择性能在按字典顺序排序的数据帧上"更好"?

Kei*_*owd 5 python dataframe pandas

我正在通过Wes McKinney的新版Python for Data Analysis和pg.他在第8章中指出,如果索引按字典顺序从最外层开始排序,那么大熊猫中的数据选择性能在分层索引对象(例如,数据帧)上"要好得多".

换句话说,在此数据框上选择数据:

key1 key2 col1
1    a    11
     b    12
2    a    13
     b    14
Run Code Online (Sandbox Code Playgroud)

......比这个数据帧上的数据选择"好得多":

key1 key2 col1
1    a    11
2    a    13
1    b    12
2    b    14
Run Code Online (Sandbox Code Playgroud)

Wes没有对此声明提供解释.

请有人向我解释:

  1. 为什么第一个数据帧上的数据选择"比第二个数据帧"好得多?换句话说,当数据框从最外层开始按字典顺序排序时,为什么数据帧上的数据选择具有"更好"的分层索引?

  2. 在这种情况下,"更好"意味着什么?快点?内存效率更高?别的什么?