Ber*_*rdL 1 python string pandas
我的数据框包含我只想显示某些发件人的发件人姓名。数据框中的列名称是发件人。
1 Tin, Heather-LK
2 Wong, Wan Sing
3 Employee Engagement
4 Loh, Kelly-KK
5 EXCHANGE ADMINISTRATIVE GROUP
6 CorpComms
7 Loo Wai Long
8 Tang, Heather-L
9 Oracle
Run Code Online (Sandbox Code Playgroud)
代码
df[df.Sender.str.contains('Tin', na=False)]
Run Code Online (Sandbox Code Playgroud)
结果是一个空白的数据框。我不明白字符串属性包含我正在寻找的部分。
以下是数据框的信息
1378
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1378 entries, 0 to 1377
Data columns (total 4 columns):
Sender 1375 non-null object
Content 1378 non-null object
Received Time 1378 non-null object
Replied Time 189 non-null object
dtypes: object(4)
memory usage: 53.8+ KB
Run Code Online (Sandbox Code Playgroud)
如果我自己重建框架,它就可以工作。但似乎无法让它处理我通过 Outlook MAPI 提取的原始数据。
好的,所以结果df.Sender.map(type).head()表明Sender列中的项目实际上不是字符串,而是其他类的实例(可能是 Outlook API 特有的?)。objectdtype 列可以包含任何类型的对象,因此有时您会遇到这样的问题,您需要检查单个单元格中的类型以了解发生了什么。
您可以尝试将这些项目显式转换为字符串以查看是否可以解决您的问题:
df['Sender_str'] = df['Sender'].map(str)
df.loc[df['Sender_str'].str.contains('Tin', na=False), :]
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3823 次 |
| 最近记录: |