我正在使用 Lustre 文件系统的集群上运行许多(18k)批处理作业。作业同时提交,每个大约需要3秒,它们使用sqlite3
python模块写入结果。代码的写部分很简单:
with sqlite3.connect(name, timeout=900) as conn:
conn.execute(
"insert into someTable values (?, ?)", (value1, value2))
Run Code Online (Sandbox Code Playgroud)
但是很多工作都会抛出异常:
sqlite3.DatabaseError: database disk image is malformed
Run Code Online (Sandbox Code Playgroud)
而有时
sqlite3.OperationalError: unable to open database file
Run Code Online (Sandbox Code Playgroud)
我猜这与许多作业在写入文件时锁定文件有关,但我的印象是sqlite3
应该知道耐心等待文件空闲。我的错误可能是由于并发写入过多造成的吗?我该如何解决?