数据框:
pair = collections.defaultdict(collections.Counter)
Run Code Online (Sandbox Code Playgroud)
例如
pair = {'doc1': {'word1':4, 'word2':3},
'doc2': {'word1':2, 'word3':4},
'doc3': {'word2':2, 'word4':1},
...}
Run Code Online (Sandbox Code Playgroud)
我想保留数据框但是改变这个部分的类型{'word1':4, 'word2':3} {'word1':2, 'word3':4}``...它现在是一个Counter我需要一个dict.
我试过这个来获取数据pair,但我不知道如何dict为每个doc 创建一个:
new_pair = collections.defaultdict(collections.Counter)
for doc, tab in testing.form.items():
for word, freq in tab.items():
new_pair[doc][word] = freq
Run Code Online (Sandbox Code Playgroud)
我不想改变输出.我只需要在每个doc中,数据类型dict不是Counter.
我使用Counter来计算列表项的出现次数.我很难很好地展示它.对于以下代码,
category = Counter(category_list)
print category
Run Code Online (Sandbox Code Playgroud)
以下是输出,
Counter({'a': 8508, 'c': 345, 'w': 60})
Run Code Online (Sandbox Code Playgroud)
我必须如下显示上述结果,
a 8508
c 345
w 60
Run Code Online (Sandbox Code Playgroud)
我试图迭代计数器对象,但我没有成功.有没有办法很好地打印Counter操作的输出?