最近我遇到了以下问题:如何迭代一个真正的大数据查询以执行操作(比如为每个对象创建两个不同的对象)。如果您处理一个小的查询集,这很简单:
for obj in Mymodel.objects.all():
create_corresponding_entries(obj)
Run Code Online (Sandbox Code Playgroud)
现在尝试在具有 900k 个对象的查询集中执行此操作。可能你的电脑会死机,因为它会吃光所有的内存。那么我怎样才能懒惰地实现这一目标呢?无论您使用 Django ORM 还是 SQLAlchemy,都会出现同样的问题