检查Python中的列表中是否存在某些内容

Zac*_*ack 271 python membership conditional list

我在Python中有一个元组列表,我有一个条件,我想只在元组不在列表中时才占用分支(如果它在列表中,那么我不想接受if分支)

if curr_x -1 > 0 and (curr_x-1 , curr_y) not in myList: 

    # Do Something
Run Code Online (Sandbox Code Playgroud)

但这并不适合我.我做错了什么?

orl*_*rlp 432

该错误可能在您的代码中的其他位置,因为它应该工作正常:

>>> 3 not in [2, 3, 4]
False
>>> 3 not in [4, 5, 6]
True
Run Code Online (Sandbox Code Playgroud)

或者使用元组:

>>> (2, 3) not in [(2, 3), (5, 6), (9, 1)]
False
>>> (2, 3) not in [(2, 7), (7, 3), "hi"]
True
Run Code Online (Sandbox Code Playgroud)

  • @nightcracker没有任何意义,因为"A不在B中"被简化为"不是B .__包含__(A)",这与"不是B"中的A被缩减为"不是B .__包含__(A) )`. (14认同)
  • @Zack:如果你不知道这个,你可以做``如果不是ELEMENT in COLLECTION:` (10认同)
  • 哦,哇,我可以发誓 Python 有类似 `__notcontains__` 的东西。对不起,那我说的都是废话。 (2认同)
  • @ std''OrgnlDave唯一可能发生的方法是,如果`not`的优先级高于`in`的优先级,而没有优先级。考虑一下ast.dump(ast.parse(“ Not A in B”)。body [0])的结果,该结果为`“ Expr(value = UnaryOp(op = Not(),operationnd = Compare(left = Name(id ='A',ctx = Load()),ops = [In()],比较器= [Name(id ='B',ctx = Load())]))))))'')如果`not`与A紧密地分组在一起,人们期望结果为`“ Expr(value = Compare(left = UnaryOp(op = Not(),操作数= Name(id ='A',ctx = Load()))),ops = [In()],比较器= [Name(id ='B',ctx = Load())]))))“`,是B中`(非A)的解析。 (2认同)

cs9*_*s95 12

如何检查Python列表中是否包含某些内容?

最便宜,最易读的解决方案是使用in运算符(或在您的特定情况下为not in)。如文档中所述,

运营商innot in进行会员资格测试。x in s评估 True是否x为的成员sFalse否则为。x not in s返回的否定x in s

另外,

运算符not in被定义为具有的真逆值in

y not in x在逻辑上与相同not y in x

这里有一些例子:

'a' in [1, 2, 3]
# False

'c' in ['a', 'b', 'c']
# True

'a' not in [1, 2, 3]
# True

'c' not in ['a', 'b', 'c']
# False
Run Code Online (Sandbox Code Playgroud)

这也适用于元组,因为元组是可哈希的(由于它们也是不可变的):

(1, 2) in [(3, 4), (1, 2)]
#  True
Run Code Online (Sandbox Code Playgroud)

如果RHS上的对象定义了一个__contains__()方法,in则将在内部调用该方法,如文档“ 比较”部分的最后一段所述。

... innot in,由可迭代或实现该__contains__()方法的类型支持 。例如,您可以(但不应)这样做:

[3, 2, 1].__contains__(1)
# True
Run Code Online (Sandbox Code Playgroud)

in短路,因此,如果您的元素位于列表的开头,则in求值速度更快:

lst = list(range(10001))
%timeit 1 in lst
%timeit 10000 in lst  # Expected to take longer time.

68.9 ns ± 0.613 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
178 µs ± 5.01 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
Run Code Online (Sandbox Code Playgroud)

如果您要做的不仅仅是检查项目是否在列表中,还可以使用以下选项:

  • list.index可用于检索项目的索引。如果该元素不存在,ValueError则引发a。
  • list.count 如果您要计算发生次数,可以使用。

XY问题:您考虑过sets吗?

问自己以下问题:

  • 您是否需要检查一个项目是否在列表中多次?
  • 此检查是在循环内完成还是要重复调用一个函数?
  • 您存储在列表中的项目是否可哈希化?IOW,你可以打电话hash给他们吗?

如果您对这些问题的回答为“是”,则应改用“ a” set。s 的in隶属度检验list是O(n)时间复杂度。这意味着python必须对列表进行线性扫描,访问每个元素并将其与搜索项进行比较。如果您重复执行此操作,或者列表很大,那么此操作将产生开销。

set另一方面,对象会对其值进行哈希处理以进行恒定时间成员资格检查。也可以使用in以下命令进行检查:

1 in {1, 2, 3} 
# True

'a' not in {'a', 'b', 'c'}
# False

(1, 2) in {('a', 'c'), (1, 2)}
# True
Run Code Online (Sandbox Code Playgroud)

如果您很不幸地要搜索/不搜索的元素位于列表的末尾,则python将一直扫描列表至末尾。从以下时间可以明显看出这一点:

l = list(range(100001))
s = set(l)

%timeit 100000 in l
%timeit 100000 in s

2.58 ms ± 58.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
101 ns ± 9.53 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
Run Code Online (Sandbox Code Playgroud)

提醒一下,这是一个合适的选项,只要要存储和查找的元素是可哈希的即可。IOW,它们要么必须是不可变的类型,要么是必须实现的对象__hash__

  • 集并不总是一个选项(例如,当具有可变项列表时)。对于大型集合:建立查找集合的时间为* O(n)*时间,并且可能会使内存使用量增加一倍。如果您还没有进行查找,那么它并不是制作/维护一个的最佳选择。 (2认同)