从 Python 中的 Dataflow 连接到 CloudSQL

IoT*_*ser 5 python google-cloud-sql google-cloud-platform google-cloud-dataflow

我正在尝试使用 python 管道连接到 CloudSQL。


实际情况

  • 我可以使用 DirectRunner 毫无问题地做到这一点
  • 我无法使用 DataflowRunner 连接

连接功能

def cloudSQL(input):
    import pymysql
    connection = pymysql.connect(host='<server ip>',
                                   user='...',
                                   password='...',
                                   db='...')
    cursor = connection.cursor()
    cursor.execute("select ...")
    connection.close()
    result = cursor.fetchone()
    if not (result is None):
        yield input
Run Code Online (Sandbox Code Playgroud)

错误

这是使用 DataflowRunner 的错误消息

OperationalError: (2003, "Can't connect to MySQL server on '<server ip>' (timed out)")
Run Code Online (Sandbox Code Playgroud)

云SQL

我有 publicIP(使用 directrunner 从本地进行测试),并且我还尝试激活私有 IP 以查看这是否是与 DataflowRunner 连接的问题


选项2

我也尝试过

connection = pymysql.connect((unix_socket='/cloudsql/' + <INSTANCE_CONNECTION_NAME>,
                               user='...',
                               password='...',
                               db='...')
Run Code Online (Sandbox Code Playgroud)

出现错误:

OperationalError: (2003, "Can't connect to MySQL server on 'localhost' ([Errno 2] No such file or directory)")
Run Code Online (Sandbox Code Playgroud)

kur*_*svg 0

查看Cloud SQL 代理。它将创建一个本地入口点(Unix套接字或TCP端口,具体取决于您的配置),该入口点将代理和验证与您的Cloud SQL实例的连接。