在python中提取每个子列表的第一项

Question

在python中提取每个子列表的第一项

我想知道在列表列表中提取每个子列表的第一项并将其附加到新列表的最佳方法是什么.所以,如果我有:

lst = [[a,b,c], [1,2,3], [x,y,z]]

Run Code Online (Sandbox Code Playgroud)

我想拉出一个,1和x并从中创建一个单独的列表.

我试过了:

lst2.append(x[0] for x in lst)

Run Code Online (Sandbox Code Playgroud)

Answer 1

ale*_*cxe 169

使用列表理解:

>>> lst = [['a','b','c'], [1,2,3], ['x','y','z']]
>>> lst2 = [item[0] for item in lst]
>>> lst2
['a', 1, 'x']

Run Code Online (Sandbox Code Playgroud)

列表理解方法也是最快的，甚至比 Numpy 方法还要快。[jboi](/sf/answers/3370992691/)的回答谈到了性能比较， (2认同)

Answer 2

daw*_*awg 75

你可以使用zip:

>>> lst=[[1,2,3],[11,12,13],[21,22,23]]
>>> zip(*lst)[0]
(1, 11, 21)

Run Code Online (Sandbox Code Playgroud)

或者,Python 3 zip不生成列表:

>>> list(zip(*lst))[0]
(1, 11, 21)

Run Code Online (Sandbox Code Playgroud)

要么,

>>> next(zip(*lst))
(1, 11, 21)

Run Code Online (Sandbox Code Playgroud)

或者,(我最喜欢的)使用numpy:

>>> import numpy as np
>>> a=np.array([[1,2,3],[11,12,13],[21,22,23]])
>>> a
array([[ 1,  2,  3],
       [11, 12, 13],
       [21, 22, 23]])
>>> a[:,0]
array([ 1, 11, 21])

Run Code Online (Sandbox Code Playgroud)

Answer 3

Chr*_*ott 13

Python包含一个名为itemgetter的函数,用于返回列表中特定索引处的项:

from operator import itemgetter

Run Code Online (Sandbox Code Playgroud)

将itemgetter()函数传递给要检索的项的索引.要检索第一个项目,您将使用itemgetter(0).要理解的重要一点是itemgetter(0)本身返回一个函数.如果将列表传递给该函数,则会获得特定项:

itemgetter(0)([10, 20, 30]) # Returns 10

Run Code Online (Sandbox Code Playgroud)

当你将它与map()结合使用时很有用,map()将函数作为第一个参数,将列表(或任何其他可迭代的)作为第二个参数.它返回在iterable中的每个对象上调用函数的结果:

my_list = [['a', 'b', 'c'], [1, 2, 3], ['x', 'y', 'z']]
list(map(itemgetter(0), my_list)) # Returns ['a', 1, 'x']

Run Code Online (Sandbox Code Playgroud)

请注意,map()返回一个生成器,因此结果将传递给list()以获取实际列表.总之,您的任务可以像这样完成:

lst2.append(list(map(itemgetter(0), lst)))

Run Code Online (Sandbox Code Playgroud)

这是使用列表推导的另一种方法,选择哪种方法高度依赖于上下文,可读性和首选项.

更多信息:https: //docs.python.org/3/library/operator.html#operator.itemgetter

Answer 4

jbo*_*boi 13

有同样的问题,并对每个解决方案的性能感到好奇.

这是%timeit:

import numpy as np
lst = [['a','b','c'], [1,2,3], ['x','y','z']]

Run Code Online (Sandbox Code Playgroud)

第一个numpy方式,转换数组:

%timeit list(np.array(lst).T[0])
4.9 µs ± 163 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

Run Code Online (Sandbox Code Playgroud)

完全原生使用列表理解(由@alecxe解释):

%timeit [item[0] for item in lst]
379 ns ± 23.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

Run Code Online (Sandbox Code Playgroud)

使用另一种本地方式zip(由@dawg解释):

%timeit list(zip(*lst))[0]
585 ns ± 7.26 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

Run Code Online (Sandbox Code Playgroud)

第二个numpy-way.@dawg也解释了:

%timeit list(np.array(lst)[:,0])
4.95 µs ± 179 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

Run Code Online (Sandbox Code Playgroud)

令人惊讶的是(好吧,至少对我来说)使用列表推导的本地方式是最快的,比numpy方式快10倍.在没有最终list节省的情况下运行两个numpy-way 大约一μs,这仍然是10x的差异.

请注意,当我通过调用包围每个代码片段len以确保Generators运行到结束时,时间保持不变.

创建数组时会有很大的开销。 (2认同)
同意 hpaulj 的观点，如果你从 numpy 数组开始，[:,0] 更快。试一试： lst = np.array([['a','b','c'], [1,2,3], ['x','y','z']]),然后是lst[:,0]。示例计时试验中的转换为列表理解提供了不公平的优势。因此，如果可以的话，如果速度是您的最终目标，请使用 numpy 数组来存储数据。Numpy 几乎总是更快。它是为速度而生的。 (2认同)

归档时间：	11 年，7 月前
查看次数：	248090 次
最近记录：	6 年，11 月前