pur*_*ion 5 python json dictionary casting exception
我正在读一个有效的JSON文件(嵌套5级深度),然后向它添加一些数据,然后尝试将这些数据用于某些计算.
我int is not subscriptable以随机的方式得到错误.我无法绕过它.铸造str()没有帮助,印刷与pprint不缓解它,铸造int()对输入也没有帮助.我拼命耗尽了选择......
主功能
with open(rNgram_file, 'r', encoding='utf-8') as ngram_file:
data = json.load(ngram_file)
data = rank_items(data)
data = probability_items(data)
Run Code Online (Sandbox Code Playgroud)
rank_items(数据)
所有值都在5嵌套级别计算,并在树中向上添加.我将转换添加int()到输入作为可能的解决方案,但这没有帮助.得到的问题出现了x_grams['_rank']
for ngram, one_grams in data.items():
ngram_rank = 0
for one_gram, two_grams in one_grams.items():
one_gram_rank = 0
[..]
for four_gram, values in four_grams.items():
# 4gram = of, values = 34
three_gram_rank += values
four_grams['_rank'] = int(three_gram_rank)
two_gram_rank += three_gram_rank
[..]
two_grams['_rank'] = int(one_gram_rank)
ngram_rank += one_gram_rank
one_grams['_rank'] = int(ngram_rank)
Run Code Online (Sandbox Code Playgroud)
probability_items(数据)
这是错误发生的地方.看似随意,它会抱怨int is not subscriptable在那里x_rank或x_grams['rank]正在被打印或分配,即使它们与评估type()(其中,如果它的工作原理,说<class 'int'>)我打上下面留言中最常见的线.奇怪的是,第2行和第3行从未提出例外......
for ngram, one_grams in data.items():
ngram_rank = int(one_grams['_rank']) # never gives an error
print("NgramRank: ", str(ngram_rank)) # never gives an error
if ngram != '_rank':
for one_gram, two_grams in one_grams.items():
pprint(type(two_grams['_rank'])) # common error point
one_gram_rank = str(two_grams['_rank']) # never reaches this
if one_gram != '_rank':
for two_gram, three_grams in two_grams.items():
pprint(type(three_grams['_rank'])) # common error point
pprint(str(three_grams['_rank'])) # never reaches this
two_gram_rank = str(three_grams['_rank'])
[..]
one_gram_prob = int(one_gram_rank) / int(ngram_rank)
two_grams['_prob'] = one_gram_prob
ngram_prob = int(ngram_rank) / int(ngram_rank)
one_grams['_prob'] = ngram_prob
Run Code Online (Sandbox Code Playgroud)
以randowm方式,在上面的常见错误点上抛出异常.由于这些例外,从未达到以下行.但是,如果删除常见错误点,下面的行将成为错误点.有时候,它会在内部循环中完全运行,<class 'int'>在评估时进行打印,以及所有内容,直到它在异常时停止.
我不知道发生了什么,我甚至不明白当我用它来评估时这个错误是怎么发生的 Type()
由于这是一个奇怪的问题,而且我显然犯了一个奇怪的错误,我把所有代码放在一个要点:https://gist.github.com/puredevotion/7922480
希望有人可以帮忙!
TraceBack细节
['Traceback (most recent call last):\n', ' File "Ngram_ranking.py", line 121, in probability_items\n pprint(type(four_grams[\'_rank\']))\n', "TypeError: 'int' object is not subscriptable\n"]
*** extract_tb:
[('Ngram_ranking.py', 121, 'probability_items', "pprint(type(four_grams['_rank']))")]
*** format_tb:
[' File "Ngram_ranking.py", line 121, in probability_items\n pprint(type(four_grams[\'_rank\']))\n']
*** tb_lineno: 121
Exception in on line 121: pprint(type(four_grams['_rank'])): 'int' object is not subscriptable
Run Code Online (Sandbox Code Playgroud)
第115行的TraceBack
['Traceback (most recent call last):\n', ' File "Ngram_ranking.py", line 115, in probability_items\n pprint(type(three_grams[\'_rank\']))\n', "TypeError: 'int' object is not subscriptable\n"]
*** extract_tb:
[('Ngram_ranking.py', 115, 'probability_items', "pprint(type(three_grams['_rank']))")]
*** format_tb:
[' File "Ngram_ranking.py", line 115, in probability_items\n pprint(type(three_grams[\'_rank\']))\n']
*** tb_lineno: 115
Exception in on line 115: pprint(type(three_grams['_rank'])): 'int' object is not subscriptable
Run Code Online (Sandbox Code Playgroud)
概率_items(数据)顶部的PPRINT(数据)
{'aesthetic': {'_rank': 290,
'feeling': {'_rank': 10,
'the': {'_rank': 10,
'feeling': {'_rank': 10, 'of': 10}}},
'perception': {'_rank': 280,
'and': {'_rank': 190,
'the': {'_rank': 190,
'design': 15,
'environment': 5,
'music': 100,
'painting': 15,
'work': 5,
'works': 50}},
'of': {'_rank': 90,
'the': {'_rank': 50,
'work': 30,
'world': 20},
'their': {'_rank': 40, 'female': 40}}}}}
Run Code Online (Sandbox Code Playgroud)
问题是您有一个多级嵌套字典,并且您为所有三个级别复制相同的代码,尽管嵌套有些不同。
我只拿你字典的一部分
{
'aesthetic':
{
'_rank': 290,
'feeling':
{
'_rank': 10,
'the':
{
'_rank': 10,
'feeling':
{
'_rank': 10,
'of': 10
}
}
},
}
}
Run Code Online (Sandbox Code Playgroud)
您的顶级字典是统一的,因为值(对于 key aesthetic)始终是字典。但较低级别也有ints其一些价值。
因此,当你这样做时
for ngram, one_grams in data.items():
Run Code Online (Sandbox Code Playgroud)
你有ngram=aesthetics并且one_grams={the dictionary}
int(one_grams['_rank'])
Run Code Online (Sandbox Code Playgroud)
总是有效(因为值字典具有元素_rank。所以这里永远不会出现错误。
现在我们进入下一步
one_gram, two_grams in one_grams.items()
Run Code Online (Sandbox Code Playgroud)
运行字典.items()给出one_grams
(one_gram,two_grams) = [('_rank', 290), ('feeling', {'_rank': 10, 'the': {'_rank': 10, 'feeling': {'_rank': 10, 'of': 10}}})]
Run Code Online (Sandbox Code Playgroud)
注意第一个条目为 ,two_grams第二个条目为 。由于您在执行时迭代整个 items()intdict
two_grams['_rank']
Run Code Online (Sandbox Code Playgroud)
你遇到了错误(它告诉你你已经达到了预期的int时间)。dict同样的问题也发生在内部循环中。
由于字典没有排序,items() 可以按任何顺序返回。因此_rank可能是第一个元素或位于其他字典元素之下。在这种情况下,您会进入内部 for 循环并在那里遇到相同的问题。
您可以_rank在迭代时忽略键
for one_gram,two_grams one_grams.items():
if one_gram=='_rank':
continue
Run Code Online (Sandbox Code Playgroud)
在所有循环中。
| 归档时间: |
|
| 查看次数: |
320 次 |
| 最近记录: |