为什么 pd.unique() 比 np.unique() 更快?

Son*_* Li 7 python numpy data-analysis pandas data-science

我尝试比较两者,一个是,pandas.unique()另一个是numpy.unique(),我发现后者实际上超越了第一个。
我不确定阁下是否是线性的。

谁能告诉我为什么在代码实现方面存在这样的差异?什么情况下我应该使用哪个?

小智 4

np.unique() 将数据视为数组,因此它会单独遍历每个值,然后标识唯一字段。

然而,pandas 具有包含此信息的预构建元数据,并且 pd.unique() 只是调用包含“唯一”信息的元数据,因此不必再次计算。