具有一对一关系的 SQLalchemy 批量插入

Ofe*_*man 2 python sqlalchemy flask

我有以下模型,其中 TableA 和 TableB 具有 1 对 1 的关系:

class TableA(db.Model):
    id = Column(db.BigInteger, primary_key=True)
    title = Column(String(1024))
    table_b = relationship('TableB', uselist=False, back_populates="table_a")


class TableB(db.Model):
    id = Column(BigInteger, ForeignKey(TableA.id), primary_key=True)
    a = relationship('TableA', back_populates='table_b')
    name = Column(String(1024))
Run Code Online (Sandbox Code Playgroud)

当我插入 1 条记录时一切正常:

rec_a = TableA(title='hello')
rec_b = TableB(a=rec_a, name='world')
db.session.add(rec_b)
db.session.commit()
Run Code Online (Sandbox Code Playgroud)

但是当我尝试为大量记录执行此操作时:

bulk_ = []

for title, name in zip(titles, names):
    rec_a = TableA(title=title)
    bulk_.append(TableB(a=rec_a, name=name))

db.session.bulk_save_objects(bulk_)
db.session.commit()
Run Code Online (Sandbox Code Playgroud)

我收到以下异常:

sqlalchemy.exc.InternalError: (pymysql.err.InternalError) (1364, "Field 'id' doesn't have a default value")
Run Code Online (Sandbox Code Playgroud)

难道我做错了什么?模型配置错了吗?有没有办法批量提交这种类型的数据?

Hal*_*Ali 5

您看到的错误是由 Mysql 抛出的。它抱怨将记录插入的尝试table_b违反了外键约束。

一种技术可能是在一个批量语句中写入所有标题,然后在第二个批量语句中写入所有名称。另外,我从来没有成功地将关系传递给批量操作,这个方法依赖于插入简单的值。

bulk_titles = [TableA(title=title) for title in titles]
session.bulk_save_objects(bulk_titles, return_defauls=True)
bulk_names = [TableB(id=title.id, name=name) for title, name in zip(bulk_titles, names)]
session.bulk_save_objects(bulk_names)
Run Code Online (Sandbox Code Playgroud)

return_defaults=True上面需要,因为我们需要title.id在第二个批量操作中。但这大大降低了批量操作的性能提升

为了避免由于 导致的性能下降return_defauts=True,您可以从应用程序而不是数据库生成主键,例如使用 uuid,或获取每个表中的最大 id 并从该起始值生成一个范围。

另一种技术可能是使用 sqlalchemy 核心或纯文本编写批量插入语句。