Python 连接到 EMR 上的 Hive

amf*_*895 5 hive amazon-emr python-3.x

有没有办法通过 Python 连接到 AWS EMR 集群上的 Hive 表?

我一直在尝试几个软件包,如 pyhive、ibis 和 impyla 等等,但没有运气。我已经尝试使用我在 PuTTy 中使用的确切信息来 ssh,但仍然出现错误。

在腻子中:

主机名:(用户名)@(EMR 的主公共 DNS)

端口:22

身份验证:使用 .ppk 文件

电子病历信息

from pyhive import hive
conn = hive.Connection(host = "(Master public DNS of EMR)",
                       port = 22, username = '(username)', database = '(database)')
Run Code Online (Sandbox Code Playgroud)

这是我得到的错误:

TTransportException: Could not start SASL: b'Error in sasl_client_start (-4) SASL(-4): no mechanism available: Unable to find a callback: 2'
Run Code Online (Sandbox Code Playgroud)

我也应该使用 .ppk 文件吗?