随机"int不可订阅"行为

pur*_*ion 5 python json dictionary casting exception

我正在读一个有效的JSON文件(嵌套5级深度),然后向它添加一些数据,然后尝试将这些数据用于某些计算.

int is not subscriptable以随机的方式得到错误.我无法绕过它.铸造str()没有帮助,印刷与pprint不缓解它,铸造int()对输入也没有帮助.我拼命耗尽了选择......

主功能

with open(rNgram_file, 'r', encoding='utf-8') as ngram_file:
    data = json.load(ngram_file)
    data = rank_items(data)
    data = probability_items(data)
Run Code Online (Sandbox Code Playgroud)

rank_items(数据)

所有值都在5嵌套级别计算,并在树中向上添加.我将转换添加int()到输入作为可能的解决方案,但这没有帮助.得到的问题出现了x_grams['_rank']

for ngram, one_grams in data.items():
        ngram_rank = 0
        for one_gram, two_grams in one_grams.items():
            one_gram_rank = 0
           [..]
                for four_gram, values in four_grams.items():
                # 4gram = of, values = 34
                three_gram_rank += values
                four_grams['_rank'] = int(three_gram_rank)
                two_gram_rank += three_gram_rank
           [..]    
            two_grams['_rank'] = int(one_gram_rank)
            ngram_rank += one_gram_rank
        one_grams['_rank'] = int(ngram_rank)
Run Code Online (Sandbox Code Playgroud)

probability_items(数据)

这是错误发生的地方.看似随意,它会抱怨int is not subscriptable在那里x_rankx_grams['rank]正在被打印或分配,即使它们与评估type()(其中,如果它的工作原理,说<class 'int'>)我打上下面留言中最常见的线.奇怪的是,第2行和第3行从未提出例外......

    for ngram, one_grams in data.items():
        ngram_rank = int(one_grams['_rank'])               # never gives an error
        print("NgramRank: ", str(ngram_rank))              # never gives an error
        if ngram != '_rank':
            for one_gram, two_grams in one_grams.items():
                pprint(type(two_grams['_rank']))             # common error point
                one_gram_rank = str(two_grams['_rank'])      # never reaches this
                if one_gram != '_rank':
                    for two_gram, three_grams in two_grams.items():
                        pprint(type(three_grams['_rank']))   # common error point
                        pprint(str(three_grams['_rank']))    # never reaches this
                        two_gram_rank = str(three_grams['_rank'])
                        [..]
                    one_gram_prob = int(one_gram_rank) / int(ngram_rank)
                    two_grams['_prob'] = one_gram_prob
            ngram_prob = int(ngram_rank) / int(ngram_rank)
            one_grams['_prob'] = ngram_prob
Run Code Online (Sandbox Code Playgroud)

以randowm方式,在上面的常见错误点上抛出异常.由于这些例外,从未达到以下行.但是,如果删除常见错误点,下面的行将成为错误点.有时候,它会在内部循环中完全运行,<class 'int'>在评估时进行打印,以及所有内容,直到它在异常时停止.

我不知道发生了什么,我甚至不明白当我用它来评估时这个错误是怎么发生的 Type()

由于这是一个奇怪的问题,而且我显然犯了一个奇怪的错误,我把所有代码放在一个要点:https://gist.github.com/puredevotion/7922480

希望有人可以帮忙!

TraceBack细节

['Traceback (most recent call last):\n', '  File "Ngram_ranking.py", line 121, in probability_items\n    pprint(type(four_grams[\'_rank\']))\n', "TypeError: 'int' object is not subscriptable\n"]

*** extract_tb:
[('Ngram_ranking.py', 121, 'probability_items', "pprint(type(four_grams['_rank']))")]

*** format_tb:
['  File "Ngram_ranking.py", line 121, in probability_items\n    pprint(type(four_grams[\'_rank\']))\n']

*** tb_lineno: 121
Exception in on line 121: pprint(type(four_grams['_rank'])): 'int' object is not subscriptable
Run Code Online (Sandbox Code Playgroud)

第115行的TraceBack

['Traceback (most recent call last):\n', '  File "Ngram_ranking.py", line 115, in probability_items\n    pprint(type(three_grams[\'_rank\']))\n', "TypeError: 'int' object is not subscriptable\n"]

*** extract_tb:
[('Ngram_ranking.py', 115, 'probability_items', "pprint(type(three_grams['_rank']))")]

*** format_tb:
['  File "Ngram_ranking.py", line 115, in probability_items\n    pprint(type(three_grams[\'_rank\']))\n']

*** tb_lineno: 115
Exception in on line 115: pprint(type(three_grams['_rank'])): 'int' object is not subscriptable
Run Code Online (Sandbox Code Playgroud)

概率_items(数据)顶部的PPRINT(数据)

{'aesthetic': {'_rank': 290,
           'feeling': {'_rank': 10,
                       'the': {'_rank': 10,
                               'feeling': {'_rank': 10, 'of': 10}}},
           'perception': {'_rank': 280,
                          'and': {'_rank': 190,
                                  'the': {'_rank': 190,
                                          'design': 15,
                                          'environment': 5,
                                          'music': 100,
                                          'painting': 15,
                                          'work': 5,
                                          'works': 50}},
                          'of': {'_rank': 90,
                                 'the': {'_rank': 50,
                                         'work': 30,
                                         'world': 20},
                                 'their': {'_rank': 40, 'female': 40}}}}}
Run Code Online (Sandbox Code Playgroud)

Red*_*ron 4

问题是您有一个多级嵌套字典,并且您为所有三个级别复制相同的代码,尽管嵌套有些不同。

我只拿你字典的一部分

{
'aesthetic': 
    {
    '_rank': 290,
    'feeling': 
        {
        '_rank': 10,
        'the': 
            {
            '_rank': 10,
            'feeling': 
                {
                '_rank': 10, 
                'of': 10
                }
            }
         },
    }
}
Run Code Online (Sandbox Code Playgroud)

您的顶级字典是统一的,因为值(对于 key aesthetic始终是字典。但较低级别也有ints其一些价值。

因此,当你这样做时

for ngram, one_grams in data.items():
Run Code Online (Sandbox Code Playgroud)

你有ngram=aesthetics并且one_grams={the dictionary}

int(one_grams['_rank'])
Run Code Online (Sandbox Code Playgroud)

总是有效(因为值字典具有元素_rank。所以这里永远不会出现错误。

现在我们进入下一步

one_gram, two_grams in one_grams.items()
Run Code Online (Sandbox Code Playgroud)

运行字典.items()给出one_grams

(one_gram,two_grams) = [('_rank', 290), ('feeling', {'_rank': 10, 'the': {'_rank': 10, 'feeling': {'_rank': 10, 'of': 10}}})]
Run Code Online (Sandbox Code Playgroud)

注意第一个条目为 ,two_grams第二个条目为 。由于您在执行时迭代整个 items()intdict

two_grams['_rank']
Run Code Online (Sandbox Code Playgroud)

你遇到了错误(它告诉你你已经达到了预期的int时间)。dict同样的问题也发生在内部循环中。

由于字典没有排序,items() 可以按任何顺序返回。因此_rank可能是第一个元素或位于其他字典元素之下。在这种情况下,您会进入内部 for 循环并在那里遇到相同的问题。

您可以_rank在迭代时忽略键

for one_gram,two_grams one_grams.items(): 
    if one_gram=='_rank': 
        continue  
Run Code Online (Sandbox Code Playgroud)

在所有循环中。