异步 SQLalchemy:访问急切加载的空关系会触发新的延迟加载,引发错误

avi*_*610 8 asynchronous sqlalchemy python-asyncio asyncpg

我正在使用 sqlalchemy + asyncpg 和“选择”急切加载。

我有与朋友有一对多关系的个人项目。

我将一个人插入到我的数据库中,但没有相关的朋友条目。如果在同一个会话中我尝试从数据库中获取该人,我可以很好地访问他们的静态(非关系)列,但无法访问关系friends

我认为尝试访问person.friends会触发延迟加载,尽管它之前是作为selectin加载强制执行的。为什么是这样?我怎样才能避免它?

# Create the ORM model
class Person(Base):
    __tablename__ = 'items'
    id_ = Column(POSTGRES_UUID(as_uuid=True), primary_key=True)
    name = Column(String(32))
    friends = relationship('Friend', lazy='selectin')

# Create an instance
person_id = uuid4()
person = Person(id_=person_id, name='Alice') # Note that this Person's friends are not set

# Add to database
async with AsyncSession(engine, expire_on_commit=False) as session:
    try:
        session.begin()
        session.add(person)
        await session.commit()
    except:
        await session.rollback()
        raise
    # Get the added person from the database
    created_person = await session.get(person, person_id)
    print(created_person.id_) # Works fine
    print(created_person.friends) # Raises error
Run Code Online (Sandbox Code Playgroud)

错误:

sqlalchemy.exc.MissingGreenlet: greenlet_spawn has not been called; can't call await_() here.
Was IO attempted in an unexpected place? (Background on this error at: https://sqlalche.me/e/14/xd2s)
Run Code Online (Sandbox Code Playgroud)

avi*_*610 5

解决方案是使用populate_existing以下参数get

\n
\n

populate_existing \xe2\x80\x93 导致该方法无条件发出 SQL 查询并使用新加载的数据刷新对象,无论该对象是否已存在。

\n
\n

代替

\n
created_person = await session.get(person, person_id)\n
Run Code Online (Sandbox Code Playgroud)\n

\n
created_person = await session.get(person, person_id, populate_existing=True)\n
Run Code Online (Sandbox Code Playgroud)\n

session.get 文档

\n

另请参阅:https ://github.com/sqlalchemy/sqlalchemy/issues/7176

\n

  • 这是否意味着延迟加载不能与异步 SQLAlchemy 结合使用? (11认同)

Tia*_*que 5

@theo-brown 的回答开门见山,但想在这里添加一些有趣的信息。

添加有关延迟加载和异步 SQLAlchemy 的额外上下文:

当您使用异步 SqlAlchemy 获取数据时,每个被查询的模型都会生成一个协程。如果您不急于加载关系,您最终会得到部分填充的模型。

想象一下我正在处理的这个用例:我有一个batch_job对象,它与batch_file和batch_job条目相关,所有这些都是我的数据库中的表。当我不急于加载它们时,看看调试器中会发生什么:

关系的调试器回溯

从端点返回对象时得到的回溯是这样的:

greenlet_spawn has not been called; can't call await_only() here. Was IO attempted in an unexpected place? (Background on this error at: https://sqlalche.me/e/14/xd2s)
Run Code Online (Sandbox Code Playgroud)

原因是我没有等待这些值,这就是急切加载在异步 sqlalchemy 中为您所做的事情。

但是,如果您在应用程序范围内工作并且稍后想要使用这些值,则可能不必急切加载,因此您可以等待它们。

对于那些使用 ORM 的人,您可以使用旧的加载选项来完成此操作:

results = await db_session.execute(select(YourModel).options(joinedload(YourModel.relationshipcolumn)).all()
Run Code Online (Sandbox Code Playgroud)