我有一个二维数组,其中每个元素都是一对两个标签,例如 [“NOUN”,“VERB”],我想计算每个唯一对在大型数据集中出现的次数。
到目前为止,我已经尝试使用 defaultdict(int) 和 Counter() 轻松添加元素(如果之前未找到),或者如果找到则将值增加 1。
dTransition = Counter()
# dTransition = defaultdict(int)
# <s> is a start of sentence tag
pairs = [[('<s>', 'NOUN')], [('CCONJ', 'NOUN')], [('NOUN', 'SCONJ')], [('SCONJ', 'NOUN')]]
for pair in pairs:
dTransition[pairs] += 1
Run Code Online (Sandbox Code Playgroud)
这不起作用,因为它不接受两个参数。所以我想知道是否有一种简单的方法来检查字典中是否已经存在作为 2D 数组的键,如果存在则将值增加 1。