如何计算pandas数据框(大写和小写)中的元音和辅音?

Nab*_*zir 2 python regex text feature-extraction pandas

这是我的数据

No  Body
1   DaTa, Analytics
2   StackOver.
Run Code Online (Sandbox Code Playgroud)

这是我的预期输出

No  Body                 Vowels   Consonant  
1   DaTa, Analytics.     5        8        
2   StackOver.           3        6 
Run Code Online (Sandbox Code Playgroud)

Max*_*axU 5

您可以使用非常简单的RegEx来计算元音数量,而辅音数量是所有字母数量减去元音数量的数量:

In [121]: df['Vowels'] = df.Body.str.lower().str.count(r'[aeiou]')

In [122]: df['Consonant'] = df.Body.str.lower().str.count(r'[a-z]') - df['Vowels']

In [123]: df
Out[123]:
   No             Body  Vowels  Consonant
0   1  DaTa, Analytics       5          8
1   2       StackOver.       3          6
Run Code Online (Sandbox Code Playgroud)

PS y可以是元音也可以是辅音......

  • 我是印度尼西亚人,`y`在这里算作辅音 (2认同)