如何将 presto 查询输出转换为 python 数据框

Nav*_*yak 5 dataframe presto

我想将我的查询输出转换为 python 数据框以绘制折线图

import prestodb
import pandas as pd

conn=prestodb.dbapi.connect(
host='10.0.0.101',
port=8081,
user='hive',
catalog='hive',
schema='ong',
)

cur = conn.cursor()

query="SELECT dtime,tagName FROM machine where tagname is not null 
limit 1000"

cur.execute(query)

rows = cur.fetchall()

print(rows)

df = pd.DataFrame(query, columns=['x_axis','tagName'])
Run Code Online (Sandbox Code Playgroud)

这是我的查询输出示例

[['2018-09-08 00:00:00.000', 26], ['2018-09-08 01:00:00.000', 26], 
['2018-09-08 02:00:00.000', 26], ['2018-09-08 03:00:00.000', 27], 
['2018-09-08 04:00:00.000', 27], ['2018-09-08 05:00:00.000', 27]]
Run Code Online (Sandbox Code Playgroud)

如何使用python将此查询输出转换为数据框

Ham*_*d95 5

这很简单,我建议您使用pyhive.presto连接器(请参阅:https : //github.com/dropbox/PyHive)来连接到 presto,但您使用的连接器也应该以相同的方式工作。

然后你有几个选择:

1 - 使用 presto 连接和熊猫 read_sql_query

2 - 使用 presto 游标并使用 fetchall 的输出作为数据帧的输入数据。

# option 1
import pandas as pd
from pyhive import presto

connection = presto.connect(user='my-user', host='presto.my.host.com', port=8889)

df = pd.read_sql_query("select 100", connection)

print(
    df.head()
)
Run Code Online (Sandbox Code Playgroud)

或者

# option 2
import pandas as pd
from pyhive import presto

connection = presto.connect(user='my-user', host='presto.my.host.com', port=8889)
cur = connection.cursor()

cur.execute("select 100") 

df = pd.DataFrame(cur.fetchall())

print(
    df.head()
)
Run Code Online (Sandbox Code Playgroud)