SQLAlchemy：测试关系是否存在而不实际加载

Question

SQLAlchemy：测试关系是否存在而不实际加载

Nie*_*iel 1 python performance sqlalchemy

我不确定这是否可能，但我在 SQLite 中有一个使用 SQLAlchemy 的层次结构类型结构。在我的层次结构中，我想向用户表明父母有孩子，而无需加载所有孩子。我知道 SQLAlchemy 使用延迟加载，但是在我访问关系属性的那一刻，整个列表都被加载了。由于父级可以有数千个子级，这对于测试来说是相当大的性能开销children != None。

目前，该关系定义如下：

children = relationship('child',
                        cascade='all',
                        backref=backref('parent'),
                        )

Run Code Online (Sandbox Code Playgroud)

我目前使用以下方法测试儿童：

qry = session.query(parenttable).all()

for parent in qry:
    if parent.children != None:
        childrenindication = [{'Name': '...'}]
    else:
        childrenindication = []

    hierarchylist.append({
                'Name': parent.name,
                'Children': childrenindication
                })

Run Code Online (Sandbox Code Playgroud)

如果有一种对性能更友好的方式来做到这一点，那就太好了。

Answer 1

van*_*van 6

假设一个示例模型：

class Parent(Base):
    __tablename__ = 'parent'

    id = Column(Integer, primary_key=True)
    name = Column(String, nullable=False)

    children = relationship("Child", cascade="all", backref="parent")


class Child(Base):
    __tablename__ = 'child'

    id = Column(Integer, primary_key=True)
    name = Column(String, nullable=False)
    parent_id = Column(ForeignKey(Parent.id))

Run Code Online (Sandbox Code Playgroud)

下面列出了几个选项，其中第一个是对您的问题最直接的回答：

选项 1：使用 Relationship.any(...) - 可能是最快的

has_children = Parent.children.any()
q = session.query(Parent, has_children)
for parent, has_children in q.all():
    print(parent, has_children)

Run Code Online (Sandbox Code Playgroud)

选项 2：使用子查询获取孩子的数量

# @note: returns None instead of 0 for parent with no children
from sqlalchemy import func
subq = (
    session.query(Child.parent_id, func.count(Child.id).label("num_children"))
    .group_by(Child.parent_id)
    .subquery()
)
q = (session
     .query(Parent, subq.c.num_children)
     .outerjoin(subq, Parent.id == subq.c.parent_id)
     )
for parent, has_children in q.all():
    print(parent, has_children)

Run Code Online (Sandbox Code Playgroud)

选项 3：获取没有子查询的子项数（如果父表没有

# not have many columns
from sqlalchemy import func
q = (session
     .query(Parent, func.count(Child.id).label("num_children"))
     .outerjoin(Child, Parent.children)
     .group_by(Parent)
     )
for parent, has_children in q.all():
    print(parent, has_children)

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，7 月前
查看次数：	6197 次
最近记录：	10 年，7 月前