Impala查询卡在执行中状态

Mar*_*icz 2 hadoop impala cloudera-manager

我有一个CREATE TABLE foobar AS SELECT ...在Hue中成功运行的查询(返回的状态为Inserted 986571 row(s)),需要几秒钟才能完成。但是,在Cloudera Manager中,其状态(超过10分钟)仍然显示Executing

这是Cloudera Manager中的错误,还是此查询实际上仍在运行?

Mat*_*att 5

当Hue执行查询时,它将使查询保持打开状态,以便用户可以按自己的进度浏览结果。(当然,此行为对DDL语句不是很有用。)这意味着Impala仍认为查询正在执行,即使它没有积极使用CPU周期(请记住,它仍在保留内存!)。如果明确告知Hue,或在关闭页面/会话时(例如使用hue命令),Hue将关闭查询:

> build/env/bin/hue close_queries --help

请注意,Impala具有查询选项,可在一段时间后自动“超时”查询,请参阅query_timeout_s。色相默认将其设置为10分钟,但是您可以在hue.ini设置中将其覆盖。

需要注意的一件事是,当查询“超时”时,它们将被取消但不会关闭,即查询将保持“运行中” CANCELLED状态。这样做的原因是,用户(或工具)可以继续观察查询元数据(例如查询配置文件,状态等),如果查询完全关闭并因此从impalad注销,则该元数据将不可用。不幸的是,这些已取消的查询可能仍会包含一些不可忽略的资源,但这将由IMPALA-1575修复。

详细信息:Hive和Impala查询生命周期