Han*_*nah 2 python string correlation pandas
我有一个包含专栏专业和媒体的df。我想计算这两列之间的相关性。
有一个简短的技巧来计算字符串列的相关性吗?还是我已将每个专业和媒体转换为一个数字,然后使用.corr()计算相关性?
我发现了一个类似的问题(是否有办法与字符串数据和熊猫中的数值建立关联?),但我想检查字符串,而不是字符串中的每个单词。
df
profession media
0 media lawyer print
1 student online
2 student print
3 professor online
4 media lawyer online
Run Code Online (Sandbox Code Playgroud)
您可以将数据类型转换为分类,然后执行
df['profession']=df['profession'].astype('category').cat.codes
df['media']=df['media'].astype('category').cat.codes
df.corr()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2529 次 |
| 最近记录: |