我有一个元组列表如下:
data = [
('A', '59', '62'), ('A', '2', '6'), ('A', '87', '92'),
('A', '98', '104'), ('A', '111', '117'),
('B', '66', '71'), ('B', '25', '31'), ('B', '34', '40'), ('B', '46', '53'),
('B', '245', '251'), ('B', '235', '239'), ('B', '224', '229'), ('B', '135', '140'),
('C', '157', '162'), ('C', '203', '208'),
('D', '166', '173'), ('D', '176', '183'),
('E', '59', '62'), ('E', '2', '6'), ('E', '87', '92'), ('E', '98', '104'), ('E', '111', '117')
]
Run Code Online (Sandbox Code Playgroud)
它们对应于较大数据集的子集,因此我如上所述进行了提取以简化此帖子.每个元组的第一个元素,即A,B,C,D,E ......是一个标识符,可以存在多个副本中.
我想提取每个ID /类别(A,B,C,D,E ...):
1 - 从元组的第2个元素开始最小化
2 …