Nab*_*zir 2 python regex text feature-extraction pandas
这是我的数据
No Body
1 DaTa, Analytics
2 StackOver.
Run Code Online (Sandbox Code Playgroud)
这是我的预期输出
No Body Vowels Consonant
1 DaTa, Analytics. 5 8
2 StackOver. 3 6
Run Code Online (Sandbox Code Playgroud)
您可以使用非常简单的RegEx来计算元音数量,而辅音数量是所有字母数量减去元音数量的数量:
In [121]: df['Vowels'] = df.Body.str.lower().str.count(r'[aeiou]')
In [122]: df['Consonant'] = df.Body.str.lower().str.count(r'[a-z]') - df['Vowels']
In [123]: df
Out[123]:
No Body Vowels Consonant
0 1 DaTa, Analytics 5 8
1 2 StackOver. 3 6
Run Code Online (Sandbox Code Playgroud)