Fai*_*ani 1 python machine-learning dataframe pandas scikit-learn
不浪费时间,直奔问题。我正在尝试对我的数据集进行排序索引,并从 Mean_Ratings DataFrame 中获取“top_Female_Ratings”。我运行了这段代码:
active_titles = ratings_by_title.index[ratings_by_title >= 250]
active_titles[:10]
mean_ratings = mean_ratings.loc[active_titles]
mean_ratings.info()
Run Code Online (Sandbox Code Playgroud)
这段代码给了我这个输出:
<class 'pandas.core.frame.DataFrame'>
Index: 1216 entries, 'burbs, The (1989) to eXistenZ (1999)
Data columns (total 2 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 F 1216 non-null float64
1 M 1216 non-null float64
dtypes: float64(2)
memory usage: 28.5+ KB
Run Code Online (Sandbox Code Playgroud)
所以,我想过滤并获取上面的顶部“F”列:我编写了以下代码:
top_female_ratings = mean_ratings.sort_index(ascending=False, by='F')
top_female_ratings[:10]
Run Code Online (Sandbox Code Playgroud)
我得到了这个错误:
TypeError Traceback (most recent call last)
<ipython-input-8-0f1195012e3e> in <module>
----> 1 top_female_ratings = mean_ratings.sort_index(ascending=False, by='F')
2 top_female_ratings[:10]
TypeError: sort_index() got an unexpected keyword argument 'by'
Run Code Online (Sandbox Code Playgroud)
我不明白。
如果有人寻找答案:
by现在已从sort_index中删除,如果您关注 python 数据科学书籍,则可以使用sort_values而不是sort_index来获取所需的输出。
top_female_ratings = mean_ratings.sort_values(by='F',ascending=False)
top_female_ratings[:10]
Run Code Online (Sandbox Code Playgroud)