小编Mat*_*eek的帖子

计算单词列表中的字母频率,不包括同一单词中的重复项

我想在一个单词列表中找到最常见的字母.我正在努力学习这个算法,因为我只需要在跳过重复项时只计算一个单词中的字母频率,所以我需要帮助找到一种方法来计算整个列表中字母的频率,每个单词只出现一次,忽略了第二次出现.

例如,如果我有:

words = ["tree", "bone", "indigo", "developer"]

Run Code Online (Sandbox Code Playgroud)

频率将是:

letters={a:0, b:1, c:0, d:2, e:3, f:0, g:1, h:0, i:1, j:0, k:0, l:1, m:0, n:2, o:3, p:1, q:0, r:2, s:0, t:1, u:0, v:1, w:0, x:0, y:0, z:0}

Run Code Online (Sandbox Code Playgroud)

从字母词典中可以看出:'e'是3而不是5,因为如果'e'在同一个单词中重复多次,则应忽略它.

这是我提出的算法,它是用Python实现的:

for word in words:
    count=0;

    for letter in word:
        if(letter.isalpha()):
            if((letters[letter.lower()] > 0  && count == 0) ||
               (letters[letter.lower()] == 0 && count == 0)):

                    letters[letter.lower()]+=1
                    count=1

            elif(letters[letter.lower()]==0 && count==1):   
                letters[letter.lower()]+=1

Run Code Online (Sandbox Code Playgroud)

但它仍然需要工作,我无法想到任何其他事情,我会很高兴有人帮我思考一个有效的解决方案.

python algorithm

Mat*_*eek

2019 02-15

41
推荐指数

4
解决办法

2136
查看次数

标签统计

algorithm ×1

python ×1

计算单词列表中的字母频率,不包括同一单词中的重复项

标签 统计

小编Mat_eek的帖子

标签统计