对具有常量但不可散列的对象的函数使用functools.lru_cache

cel*_*cel 6 python python-3.x functools

是否可以functools.lru_cache用于缓存由functools.partial?创建的部分函数?

我的问题是一个带有可清洗参数的函数以及NumPy数组等不可清除的对象.

考虑这个玩具示例:

import numpy as np
from functools import lru_cache, partial

def foo(key, array):
    print('%s:' % key, array)
a = np.array([1,2,3])
Run Code Online (Sandbox Code Playgroud)

由于NumPy数组不可清除,因此不起作用:

@lru_cache(maxsize=None)
def foo(key, array):
    print('%s:' % key, array)
foo(1, a)
Run Code Online (Sandbox Code Playgroud)

正如所料,您会收到以下错误:

/Users/ch/miniconda/envs/sci34/lib/python3.4/functools.py in __init__(self, tup, hash)
    349     def __init__(self, tup, hash=hash):
    350         self[:] = tup
--> 351         self.hashvalue = hash(tup)
    352 
    353     def __hash__(self):

TypeError: unhashable type: 'numpy.ndarray'
Run Code Online (Sandbox Code Playgroud)

所以我的下一个想法是用来functools.partial摆脱NumPy数组(无论如何都是常量)

pfoo = partial(foo, array=a)
pfoo(2)
Run Code Online (Sandbox Code Playgroud)

所以现在我有一个只能使用hashable参数的函数,并且应该是完美的lru_cache.但是lru_cache在这种情况下可以使用吗?我不能用它作为包装函数而不是@lru_cache装饰器,可以吗?

有一个聪明的方法来解决这个问题吗?

Ash*_*ary 10

由于数组是常量,您可以在实际的lru缓存函数周围使用包装器,只需将键值传递给它:

from functools import lru_cache, partial
import numpy as np


def lru_wrapper(array=None):
    @lru_cache(maxsize=None)
    def foo(key):
        return '%s:' % key, array
    return foo


arr = np.array([1, 2, 3])
func = lru_wrapper(array=arr)

for x in [0, 0, 1, 2, 2, 1, 2, 0]:
    print (func(x))

print (func.cache_info())
Run Code Online (Sandbox Code Playgroud)

输出:

('0:', array([1, 2, 3]))
('0:', array([1, 2, 3]))
('1:', array([1, 2, 3]))
('2:', array([1, 2, 3]))
('2:', array([1, 2, 3]))
('1:', array([1, 2, 3]))
('2:', array([1, 2, 3]))
('0:', array([1, 2, 3]))
CacheInfo(hits=5, misses=3, maxsize=None, currsize=3)
Run Code Online (Sandbox Code Playgroud)


Geo*_*rgy 5

以下是如何使用lru_cachewith的示例functools.partial

from functools import lru_cache, partial
import numpy as np


def foo(key, array):
    return '%s:' % key, array


arr = np.array([1, 2, 3])
pfoo = partial(foo, array=arr)
func = lru_cache(maxsize=None)(pfoo)

for x in [0, 0, 1, 2, 2, 1, 2, 0]:
    print(func(x))

print(func.cache_info())
Run Code Online (Sandbox Code Playgroud)

输出:

('0:', array([1, 2, 3]))
('0:', array([1, 2, 3]))
('1:', array([1, 2, 3]))
('2:', array([1, 2, 3]))
('2:', array([1, 2, 3]))
('1:', array([1, 2, 3]))
('2:', array([1, 2, 3]))
('0:', array([1, 2, 3]))
CacheInfo(hits=5, misses=3, maxsize=None, currsize=3)
Run Code Online (Sandbox Code Playgroud)

这比@AshwiniChaudhary 的解决方案更简洁,并且还使用了functools.partial以下 OP 的要求。


PS:此解决方案改编自Applying functools.lru_cacheto lambda