是否有一种简单的方法可以获得单词中重复字符的数量?

emr*_*rah 9 python regex string counter

我想知道一个单词中有多少个字符重复.重复必须是连续的.

例如,输入"loooooveee"的方法应该返回6('o'的4次,'e'的2次).

我正在尝试实现字符串级别的功能,我可以这样做但是,有一种简单的方法可以做到这一点吗?正则表达式,还是其他一些东西?

到目前为止我试过这个:

__PRE__

它以"loooooveee"返回8.

jpp*_*jpp 16

原始问题: order of repetition does not matter

您可以按总字母数减去唯一字母的数量.set应用于字符串将返回唯一的字母集合.

x = "loooooveee"
res = len(x) - len(set(x))  # 6
Run Code Online (Sandbox Code Playgroud)

或者您可以使用collections.Counter,从每个值中减去1,然后sum:

from collections import Counter

c = Counter("loooooveee")

res = sum(i-1 for i in c.values())  # 6
Run Code Online (Sandbox Code Playgroud)

新问题: repetitions must be sequential

您可以使用itertools.groupby对顺序相同的字符进行分组:

from itertools import groupby

g = groupby("aooooaooaoo")
res = sum(sum(1 for _ in j) - 1 for i, j in g)  # 5
Run Code Online (Sandbox Code Playgroud)

要避免嵌套sum调用,您可以使用itertools.islice:

from itertools import groupby, islice

g = groupby("aooooaooaoo")
res = sum(1 for _, j in g for _ in islice(j, 1, None))  # 5
Run Code Online (Sandbox Code Playgroud)