Nab*_*zir 2 python regex text feature-extraction pandas
这是我的数据
No  Body
1   DaTa, Analytics
2   StackOver.
这是我的预期输出
No  Body                 Vowels   Consonant  
1   DaTa, Analytics.     5        8        
2   StackOver.           3        6 
您可以使用非常简单的RegEx来计算元音数量,而辅音数量是所有字母数量减去元音数量的数量:
In [121]: df['Vowels'] = df.Body.str.lower().str.count(r'[aeiou]')
In [122]: df['Consonant'] = df.Body.str.lower().str.count(r'[a-z]') - df['Vowels']
In [123]: df
Out[123]:
   No             Body  Vowels  Consonant
0   1  DaTa, Analytics       5          8
1   2       StackOver.       3          6