Alm*_*lma 2 python nltk pos-tagger
我有一个句子列表的列表,先用单词标记,然后用pos标记,所以结果显然是一个包含元素的列表:
[(w1,pos_tag1)(w2,pos_tag2)]
[(w3,pos_tag3),(w4,pos_tag4),(w5,pos_tag5)]
[(w6,pos_tag6),(w7,pos_tag7)]
Run Code Online (Sandbox Code Playgroud)
我只需要按照所有句子中出现的顺序来获得pos_tags列表。我尝试的是对该列表进行迭代
标签= [x [1]对于列表中元素中的x]
但这不起作用。如何在这些列表中包含所有标签?
谢谢
您可以使用该zip(*list)成语对元组列表进行解包,请参阅将成对的列表/元组解包为两个列表/元组
>>> from nltk import pos_tag
>>> tagged_sent = pos_tag('The quick brown fox jumps over the lazy dog'.split())
>>> tagged_sent
[('The', 'DT'), ('quick', 'JJ'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'VBZ'), ('over', 'IN'), ('the', 'DT'), ('lazy', 'JJ'), ('dog', 'NN')]
>>> words, tags = zip(*tagged_sent)
>>> tags
('DT', 'JJ', 'NN', 'NN', 'VBZ', 'IN', 'DT', 'JJ', 'NN')
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1548 次 |
| 最近记录: |