Presto如何与Relational Database一起使用

Thi*_*dim 2 mysql hive bigdata hdfs presto

我正在尝试了解PrestoDB,我有一个MySql数据库.这个数据库只是一个相对较小的数据库,我用它来理解presto如何与JDBC连接一起工作.

我已经使用presto连接到Hive Metastore,我理解它如何与ORC文件一起工作,presto worker如何获取数据并运行我需要的查询.

这张图片对我来说非常清楚:

Presto + Hive

很明显,并行化将如何与此模型一起使用.

但是在MySql连接中,如何将数据与关系数据库并行化?perst是否将表加载到worker中然后运行查询?

或者只是在MySQL中运行查询并创建结果的接口?

小智 5

Presto创建单个JDBC连接,并以单线程方式从MySQL中提取数据.

将来,如果数据被分区(为每个分区创建单独的JDBC连接),Presto将能够并行化从MySQL中提取数据.