我正在围绕现有(mysql)数据库构建python应用程序,并在使用自动映射来推断表和关系:
base = automap_base()
self.engine = create_engine(
'mysql://%s:%s@%s/%s?charset=utf8mb4' % (
config.DB_USER, config.DB_PASSWD, config.DB_HOST, config.DB_NAME
), echo=False
)
# reflect the tables
base.prepare(self.engine, reflect=True)
self.TableName = base.classes.table_name
Run Code Online (Sandbox Code Playgroud)
使用这个我可以做类似的事情session.query(TableName)...但是,我担心性能,因为每次应用程序运行时,它都会再次进行整个推断。
性能可能是一个合理的担忧。如果数据库架构未更改,则每次运行脚本时反映数据库可能会非常耗时。这更多是开发过程中的问题,而不是启动长时间运行的应用程序的问题。如果您的数据库位于远程服务器上(同样,特别是在开发期间),这也可以节省大量时间。
我使用与此处答案类似的代码(如@ACV 所示)。一般计划是第一次执行反射,然后pickle元数据对象。下次运行脚本时,它将查找 pickle 文件并使用它。该文件可以在任何地方,但我将我的放在~/.sqlalchemy_cache. 这是基于您的代码的示例。
import os
from sqlalchemy.ext.declarative import declarative_base
self.engine = create_engine(
'mysql://%s:%s@%s/%s?charset=utf8mb4' % (
config.DB_USER, config.DB_PASSWD, config.DB_HOST, config.DB_NAME
), echo=False
)
metadata_pickle_filename = "mydb_metadata"
cache_path = os.path.join(os.path.expanduser("~"), ".sqlalchemy_cache")
cached_metadata = None
if os.path.exists(cache_path):
try:
with open(os.path.join(cache_path, metadata_pickle_filename), 'rb') as cache_file:
cached_metadata = pickle.load(file=cache_file)
except IOError:
# cache file not found - no problem, reflect as usual
pass
if cached_metadata:
base = declarative_base(bind=self.engine, metadata=cached_metadata)
else:
base = automap_base()
base.prepare(self.engine, reflect=True) # reflect the tables
# save the metadata for future runs
try:
if not os.path.exists(cache_path):
os.makedirs(cache_path)
# make sure to open in binary mode - we're writing bytes, not str
with open(os.path.join(cache_path, metadata_pickle_filename), 'wb') as cache_file:
pickle.dump(Base.metadata, cache_file)
except:
# couldn't write the file for some reason
pass
self.TableName = base.classes.table_name
Run Code Online (Sandbox Code Playgroud)
对于任何使用声明性表类定义的人,假设Base对象定义为例如
Base = declarative_base(bind=engine)
metadata_pickle_filename = "ModelClasses_trilliandb_trillian.pickle"
# ------------------------------------------
# Load the cached metadata if it's available
# ------------------------------------------
# NOTE: delete the cached file if the database schema changes!!
cache_path = os.path.join(os.path.expanduser("~"), ".sqlalchemy_cache")
cached_metadata = None
if os.path.exists(cache_path):
try:
with open(os.path.join(cache_path, metadata_pickle_filename), 'rb') as cache_file:
cached_metadata = pickle.load(file=cache_file)
except IOError:
# cache file not found - no problem
pass
# ------------------------------------------
# define all tables
#
class MyTable(Base):
if cached_metadata:
__table__ = cached_metadata.tables['my_schema.my_table']
else:
__tablename__ = 'my_table'
__table_args__ = {'autoload':True, 'schema':'my_schema'}
...
# ----------------------------------------
# If no cached metadata was found, save it
# ----------------------------------------
if cached_metadata is None:
# cache the metadata for future loading
# - MUST DELETE IF THE DATABASE SCHEMA HAS CHANGED
try:
if not os.path.exists(cache_path):
os.makedirs(cache_path)
# make sure to open in binary mode - we're writing bytes, not str
with open(os.path.join(cache_path, metadata_pickle_filename), 'wb') as cache_file:
pickle.dump(Base.metadata, cache_file)
except:
# couldn't write the file for some reason
pass
Run Code Online (Sandbox Code Playgroud)
重要的提示!!如果数据库架构发生更改,您必须删除缓存文件以强制代码自动加载并创建新的缓存。如果不这样做,更改将反映在代码中。这是一件很容易忘记的事情。
我认为“反映”数据库的结构不是要走的路。除非您的应用程序尝试从结构中“推断”事物,例如对源文件进行静态代码分析,否则没有必要。在运行时反映它的另一个原因是减少了使用 SQLAlchemy 开始“使用”数据库的时间。然而:
另一种选择是使用类似 SQLACodegen ( https://pypi.python.org/pypi/sqlacodegen ) 的东西:
它将“反映”您的数据库一次,并创建一组 99.5% 准确的声明式 SQLAlchemy 模型供您使用。但是,这确实要求您随后使模型与数据库结构保持同步。我认为这不是一个大问题,因为您已经在使用的表足够稳定,因此它们结构的运行时反射不会对您的程序产生太大影响。
生成声明性模型本质上是反射的“缓存”。只是 SQLACodegen 将它保存到一组非常可读的类 + 字段而不是内存中的数据中。即使结构发生变化,并且我自己对生成的声明性模型进行了“更改”,但无论何时我进行数据库更改,我仍然会在项目中使用 SQLACodegen。这意味着我的模型在彼此之间通常是一致的,并且我没有由于复制粘贴而导致的拼写错误和数据不匹配等问题。
| 归档时间: |
|
| 查看次数: |
1695 次 |
| 最近记录: |