使用 Python 转储 PostgreSQL 数据库架构

Geo*_*a.b 4 python sql postgresql python-2.7

我正在寻找一种使用 Python 转储 PostgreSQL 数据库模式的方法。理想情况下,结果可以是.sql转储或任何其他格式,稍后 SQLAlchemy 可以使用这些格式从该模式创建新数据库。

我用 SQLAlchemy 的MetaData 类做了这个实验:

from sqlalchemy import MetaData, create_engine

engine = create_engine(source_database_url)
test_engine = create_engine(test_database_url)
metadata = MetaData()
metadata.reflect(engine)
metadata.create_all(test_engine)
Run Code Online (Sandbox Code Playgroud)

除了导出架构以供以后使用之外,这正是我想要的。因此,考虑到 SQLAlchemy 可以成功反映模式并基于它创建另一个表,我希望有一种方法可以在此过程中以编程方式导出它。

我知道我可以从代码中调用pg_dumppg_restore,但我想避免外部依赖以及随之而来的麻烦。

有没有办法使用 SQLAlchemy 或其他 Python 库来实现这一点?

Geo*_*a.b 7

经过进一步挖掘,我从 SQLAlchemy 文档中发现了这个有用的部分。因此,从该代码片段开始,我创建了以下类:

import io
from sqlalchemy import create_engine, MetaData
from sqlalchemy.orm import sessionmaker

class SchemaDump(object):
    def __init__(self, db_url, schema_file_path):
        self.db_url = db_url
        self.schema_file_path = schema_file_path
        self.buf = io.BytesIO()

    def dump_shema(self):
        engine = create_engine(self.db_url)
        metadata = MetaData()
        metadata.reflect(engine)

        def dump(sql, *multiparams, **params):
            f = sql.compile(dialect=engine.dialect)
            self.buf.write(str(f).encode('utf-8'))
            self.buf.write(b';\n')

        new_engine = create_engine(self.db_url, strategy='mock', executor=dump)
        metadata.create_all(new_engine, checkfirst=True)

        with io.open(self.schema_file_path, 'wb+') as schema:
            schema.write(self.buf.getvalue())
Run Code Online (Sandbox Code Playgroud)

这仍然很粗略,但主要思想是捕获sql.compile(dialect=engine.dialect)in返回的原始 SQL 语句buf并将它们写入文件。

.sql我编写了一个同样粗略的类来从上面的类创建的转储中恢复数据库:

import io
from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker

class RestoreSchema(object):
    def __init__(self, db_url, schema_file_path):
        self.db_url = db_url
        self.schema_file_path = schema_file_path

    def restore_schema(self):
        raw_schema = ''
        with io.open(self.schema_file_path) as sql_schema:
            raw_schema = sql_schema.read()
        engine = create_engine(self.db_url)
        Session = sessionmaker(bind=engine)
        session = Session()
        conn = engine.connect()
        transaction = conn.begin()
        try:
            conn.execute(raw_schema)
            transaction.commit()
        except Exception as e:
            transaction.rollback()
            raise e
        finally:
            session.close()
Run Code Online (Sandbox Code Playgroud)

您仍然需要担心表是否已经存在等,但效果与我的问题中的代码片段完全相同。