如何在 SQLAlchemy 中连接来自不同数据库的 2 个表?

Vin*_*ara 3 python sqlalchemy

我正在使用 python/SQLAlchemy 从 MySQL 数据库中提取数据。我有 2 个不同的主机,每个主机都有一个数据库,我需要加入 2 个表(每个主机/数据库中一个)。我该怎么做?

我正在阅读此文档,但无法获得任何直接的帮助。连接到一个数据库非常简单:

engine = create_engine('mysql+pymysql://user:pass@host/database')
Run Code Online (Sandbox Code Playgroud)

但我不确定如何使用两个引擎。

有人吗?提前致谢。

unu*_*tbu 5

您可以使用Pandas作为两个数据库之间的粘合剂。例如,

import config
import pandas as pd
import sqlalchemy as SA

engine_postgresql = SA.create_engine('postgresql+psycopg2://{u}:{p}@{h}/{d}'.format(
    u=PGUSER, p=PGPASS, h=PGHOST, d='pgtest'))
engine_mysql = SA.create_engine('mysql+mysqldb://{u}:{p}@{h}/{d}'.format(
    u=MYUSER, p=MYPASS, h=MYHOST, d='mytest'))

sql = 'SELECT col1, col2, col3 FROM tableA'
df1 = pd.read_sql(sql, con=engine_postgresql)
sql = 'SELECT col1, col2, col4 FROM tableB'
df2 = pd.read_sql(sql2, con=engine_mysql)

result = pd.merge(df1, df2, how='left', on=['col1', 'col2'])
Run Code Online (Sandbox Code Playgroud)

pd.read_sql将 SQL 查询传递给数据库并返回一个 DataFrame。 pd.merge连接两个 DataFrame 并返回一个 DataFrame。

DataFrames 也可以使用to_sql方法作为表插入到数据库中。例如,

result.to_sql('tablename', engine_postgresql, if_exists='append')
Run Code Online (Sandbox Code Playgroud)