相关疑难解决方法(0)

查询pyspark中的HIVE表

我正在使用CDH5.5

我有一个在HIVE默认数据库中创建的表,并能够从HIVE命令查询它.

产量

hive> use default;

OK

Time taken: 0.582 seconds


hive> show tables;

OK

bank
Time taken: 0.341 seconds, Fetched: 1 row(s)

hive> select count(*) from bank;

OK

542

Time taken: 64.961 seconds, Fetched: 1 row(s)
Run Code Online (Sandbox Code Playgroud)

但是,我无法从pyspark查询表,因为它无法识别表.

from pyspark.context import SparkContext

from pyspark.sql import HiveContext

sqlContext = HiveContext(sc)


sqlContext.sql("use default")

DataFrame[result: string]

sqlContext.sql("show tables").show()

+---------+-----------+

|tableName|isTemporary|

+---------+-----------+

+---------+-----------+


sqlContext.sql("FROM bank SELECT count(*)")

16/03/16 20:12:13 INFO parse.ParseDriver: Parsing command: FROM bank SELECT count(*)
16/03/16 20:12:13 INFO parse.ParseDriver: Parse Completed
Traceback …
Run Code Online (Sandbox Code Playgroud)

hive pyspark

23
推荐指数
2
解决办法
7万
查看次数

标签 统计

hive ×1

pyspark ×1