Nab*_*zir 4 python string text feature-extraction pandas
这是我的数据
No Body
1 DaTa Analytics 2
2 StackOver 67
Run Code Online (Sandbox Code Playgroud)
这是我的预期输出
No Body Uppercase Lowercase
1 DaTa Analytics 2 3 10
2 StackOver 67 2 7
Run Code Online (Sandbox Code Playgroud)
用于str.findall提取大写和小写以及str.len长度:
df['Uppercase'] = df['Body'].str.findall(r'[A-Z]').str.len()
df['Lowercase'] = df['Body'].str.findall(r'[a-z]').str.len()
Run Code Online (Sandbox Code Playgroud)
另一个解决方案:
df['Uppercase'] = df['Body'].str.count(r'[A-Z]')
df['Lowercase'] = df['Body'].str.count(r'[a-z]')
print (df)
No Body Uppercase Lowercase
0 1 DaTa Analytics 3 10
1 2 StackOver 2 7
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
4146 次 |
| 最近记录: |