ved*_*ant 10 python uuid celery google-cloud-platform
我正面临这个奇怪的问题。我的一些(5%)芹菜任务被默默地放弃了。
在 celery 日志中做一些挖掘,我发现在某些情况下,为不同的任务生成相同的任务 ID。自然地,任何新任务都会覆盖具有相同任务 ID 的现有任务;导致旧任务静默删除(如果它没有执行)。
在 1.5 小时内,生成了 3 次相同的 UUID。我做了一些随机抽样,结果在同一台机器上在很短的时间内(1-2 小时)出现了这种情况。服务器每天生成大约 100 万个 UUID。与38 位数字相比的 7 位数字- 可能的 UUID 数量。
我在 Linux VM 上运行 python 3.6 和 celery 4.4.2。
Celery 使用 python 的uuid.uuid4:参考
我不知道如何从这里开始。某个版本的 python(或 linux 内核)中是否存在错误、某些配置问题或硬件/VM 错误?所有情况似乎都不太可能。
更新:
VM 是运行 ubuntu 18 LTS 的标准 Google Cloud Platform 计算实例。
我不明白为什么,但我实施了一个解决方法。
我猴子打补丁了uuid.uuid4。由于某种原因,我无法对celery.utils.uuidor做同样的事情kombu.utils.uuid。
我制作了一个非常简单的随机数生成器,它将系统纳秒时间和主机名连接起来,并生成一个 UUID:
def __my_uuid_generator():
time_hex = float.hex(time.monotonic())[4:-4] # 13 chars
host = hex(abs(hash(socket.gethostname())))[2:] # 16 chars
hashed = bytes(f'{time_hex}{host}', 'ascii').hex()[:32] # always a 32 chars long hex string
return uuid.UUID(hashed)
# Monkey patch uuid4, because /sf/ask/4361882521/. Sigh!
uuid.uuid4 = __my_uuid_generator
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
426 次 |
| 最近记录: |