Pandas DataFrame排序忽略了这种情况

ede*_*esz 9 python sorting dataframe pandas

我在Python中有一个Pandas数据帧.数据框的内容来自此处.我略微修改了"单一"列中第一个字母的大小写.这是我有的:

import pandas as pd
df = pd.read_csv('test.csv')
print df

Position                       Artist                  Single               Year     Weeks
       1                Frankie Laine               I Believe               1953  18 weeks
       2                  Bryan Adams         I Do It for You               1991  16 weeks
       3                  Wet Wet Wet      love Is All Around               1994  15 weeks
       4  Drake (feat. Wizkid & Kyla)               One Dance               2016  15 weeks
       5                        Queen       bohemian Rhapsody  1975/76 & 1991/92  14 weeks
       6                 Slim Whitman              Rose Marie               1955  11 weeks
       7              Whitney Houston  i Will Always Love You               1992  10 weeks
Run Code Online (Sandbox Code Playgroud)

我想按单列按升序排序(a到z).我跑的时候

df.sort_values(by='Single',inplace=True)
Run Code Online (Sandbox Code Playgroud)

似乎排序不能组合大写和小写.这是我得到的:

Position                       Artist                  Single               Year     Weeks
       1                Frankie Laine               I Believe               1953  18 weeks
       2                  Bryan Adams         I Do It for You               1991  16 weeks
       4  Drake (feat. Wizkid & Kyla)               One Dance               2016  15 weeks
       6                 Slim Whitman              Rose Marie               1955  11 weeks
       5                        Queen       bohemian Rhapsody  1975/76 & 1991/92  14 weeks
       7              Whitney Houston  i Will Always Love You               1992  10 weeks
       3                  Wet Wet Wet      love Is All Around               1994  15 weeks
Run Code Online (Sandbox Code Playgroud)

因此,它首先按大写排序,然后按小写单独排序.我想要一个组合排序,无论单列中的起始字母表是什么情况.排序后,带有"波希米亚狂想曲"的行位于错误的位置.应该是第一个; 相反,它出现在排序后的第5行.

有没有办法对Pandas DataFrame进行排序,同时忽略Single列中文本的大小写?

Psi*_*dom 13

您可以将所有字符串转换为大写/小写,然后调用argsort()哪个给出索引值以通过单一忽略大小写来重新排序数据框:

df.iloc[df.Single.str.lower().argsort()]
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述


Raf*_*afG 12

Pandas 1.1.0引入了key参数作为实现这一点的更直观的方式:

df.sort_values(by='Single', inplace=True, key=lambda col: col.str.lower())
Run Code Online (Sandbox Code Playgroud)

  • 最佳答案。 (2认同)

DYZ*_*DYZ 7

创建Single所有大写字母的副本并按该列排序:

df["Single.Upper"] = df["Single"].str.upper()
df.sort_values(by="Single.Upper", inplace=True)
Run Code Online (Sandbox Code Playgroud)

您可以稍后删除该列:

del df["Single.Upper"] 
Run Code Online (Sandbox Code Playgroud)