Pandas DataFrame:测试是否设置了索引名称

Mat*_*ias 5 python datetime dataframe pandas

我有一个包含多个列的 DataFrame,其中一个是 datetime 类型。有时,此列通过df.set_index(...)用作索引。

在其他情况下,我需要重置该索引以保留日期时间列。现在我正在寻找一种方法来检查数据框是否具有默认索引。我试过这个,但这并不适用于所有情况:

if df.index.name is not None:
    df.reset_index(inplace=True)
Run Code Online (Sandbox Code Playgroud)

我可以测试索引是否为 datetime 类型,但我真的想知道是否有像df.is_index_set()这样的通用方法。有什么建议吗?

EdC*_*ica 6

您不应测试该index.name属性,因为它并非在所有场景中都设置。您可以进行以下测试:

In[13]:

df = pd.DataFrame(np.random.randn(5,3), columns=list('abc'))
type(df.index) == pd.RangeIndex

Out[13]: True

In[14]:    
df = pd.DataFrame(np.random.randn(5,3), columns=list('abc'), index=pd.date_range(dt.datetime(2017,1,1), periods=5))
df.index.is_all_dates

Out[14]: True
Run Code Online (Sandbox Code Playgroud)

所以默认索引是 a pd.RangeIndex,如果你的索引是 aDatetimeIndex你可以调用is_all_dates或比较pd.DatetimeIndex

即使您将索引设置为单调的 int 列,第一种方法也会处理:

In[27]:
df = pd.DataFrame({'a':[0,1,2,3,4], 'b':35,'c':np.random.randn(5)})
df = df.set_index('a')
type(df.index) == pd.RangeIndex

Out[27]: False
Run Code Online (Sandbox Code Playgroud)

dtype这里的索引是Int64Index

In[28]:
df.index

Out[28]: Int64Index([0, 1, 2, 3, 4], dtype='int64', name='a')
Run Code Online (Sandbox Code Playgroud)