Jef*_*ffP 6 python relational-database ponyorm
如果这是一个显而易见的问题,请原谅我,但我一般都是小马和数据库的新手,并没有找到回答这个问题的文档的正确部分.
我正在尝试创建一个包含公司的数据库以及这些公司设有办事处的地点.这是一种多对多的关系,因为每个公司都在多个地点,每个地点都可以托管多家公司.我正在定义我的实体:
from pony import orm
class Company(db.Entity):
'''A company entry in database'''
name = orm.PrimaryKey(str)
locations = orm.Set('Location')
class Location(db.Entity):
'''A location for a company'''
name = orm.PrimaryKey(str)
companies = orm.Set('Company')
Run Code Online (Sandbox Code Playgroud)
理想情况下,我希望能够编写一个将公司添加到数据库的功能,同时还添加该公司所在位置的列表,同时确保添加新的位置实例(如果它们尚不存在).我可以很快想到两种方法.
首先是尝试输入该位置,即使它存在并处理异常:
@orm.db_session
def add_company(name, locations):
loc_entities = []
for l in locations:
try:
loc = Location[l]
except orm.core.ObjectNotFound:
loc = Location(name=l)
else:
loc_entities.append(loc)
comp = Company(name=name, locations=loc_entities)
Run Code Online (Sandbox Code Playgroud)
第二个是查询数据库并询问这些位置是否存在:
@orm.db_session
def add_company2(name, locations):
old_loc_entities = orm.select(l for l in Location if l.name in locations)[:]
old_locations = [l.name for l in old_loc_entities]
new_locations = set(locations) - (set(locations) & set(old_locations))
loc_entities = [Location(name=l) for l in new_locations] + old_loc_entities
comp = Company(name=name, locations=loc_entities)
Run Code Online (Sandbox Code Playgroud)
在这两个中,我猜想更加pythonic的方法是简单地处理异常,但这会遇到N + 1问题吗?我注意到通过使用名称作为主键,我每次使用索引访问实体时都会进行查询.当我让小马选择顺序id时,我似乎不需要查询.我还没有用任何大型数据集对此进行测试,所以我还没有进行过基准测试.
我注意到,通过使用名称作为主键,我每次使用索引访问实体时都会进行查询。当我只是让小马选择顺序编号时,我似乎不需要查询。
内部Pony以与字符串主键相同的方式缓存顺序主键,因此我认为应该没有区别。每个db_session都有独立的缓存(称为“身份映射”)。读取对象后,db_session同一对象内通过主键(或任何其他唯一键)进行的任何访问都应直接从身份映射中返回同一对象,而无需发出新查询。结束之后db_session,使用同一键进行的另一次访问将发出新查询,因为可以通过并发事务在数据库中修改对象。
关于您的方法,我认为它们都是有效的。如果一家公司只有几个地点(例如大约十个地点),那么我会使用第一种方法,因为它对我来说更Python化。它确实导致了N + 1查询,但是通过主键检索对象的查询非常快速且易于服务器执行。可以使用以下get方法将代码表示得更紧凑:
@orm.db_session
def add_company(name, locations):
loc_entities = [Location.get(name=l) or Location(name=l)
for l in locations]
comp = Company(name=name, locations=loc_entities)
Run Code Online (Sandbox Code Playgroud)
对我而言,通过单个查询检索所有现有位置的第二种方法对我来说似乎是过早的优化,但是如果您每秒创建数百家公司,并且每个公司都有数百个位置,则可以使用它。