ValueError: cannot reindex from a duplicate axis当我试图将索引设置为某个值时,我得到了一个.我尝试用一个简单的例子重现这个,但我做不到.
这是我在ipdb跟踪中的会话.我有一个带字符串索引的DataFrame,以及整数列,浮点值.但是,当我尝试为sum所有列的总和创建索引时,我收到ValueError: cannot reindex from a duplicate axis错误.我创建了一个具有相同特征的小型DataFrame,但无法重现该问题,我可能缺少什么?
我真的不明白是什么ValueError: cannot reindex from a duplicate axis意思,这个错误信息是什么意思?也许这可以帮助我诊断问题,这是我问题中最容易回答的部分.
ipdb> type(affinity_matrix)
<class 'pandas.core.frame.DataFrame'>
ipdb> affinity_matrix.shape
(333, 10)
ipdb> affinity_matrix.columns
Int64Index([9315684, 9315597, 9316591, 9320520, 9321163, 9320615, 9321187, 9319487, 9319467, 9320484], dtype='int64')
ipdb> affinity_matrix.index
Index([u'001', u'002', u'003', u'004', u'005', u'008', u'009', u'010', u'011', u'014', u'015', u'016', u'018', u'020', u'021', u'022', u'024', u'025', u'026', u'027', u'028', u'029', u'030', u'032', u'033', u'034', u'035', …Run Code Online (Sandbox Code Playgroud) 如何在默认日期为 2015-01-01 的数据框中填写 NAN 值
我在这里用什么 df['SIGN_DATE'] = df['SIGN_DATE'].fillna(??, inplace=True)
>>>df.SIGN_DATE.head()
0 2012-03-28 14:14:18
1 2011-05-18 00:41:48
2 2011-06-13 16:36:58
3 nan
4 2011-05-22 23:43:56
Name: SIGN_DATE, dtype: object
type(df.SIGN_DATE)
pandas.core.series.Series
Run Code Online (Sandbox Code Playgroud)