小编Nad*_*ine的帖子

在Hive中执行任何查询时,有没有办法获取列名和输出?

在Hive中,当我们执行查询(如:)时 select * from employee,我们在输出中没有得到任何列名(比如我们在RDBMS SQL中获得的名称,年龄,工资),我们只获取值.

在执行任何查询时,有没有办法让列名与输出一起显示?

rdbms hadoop hive

66
推荐指数
3
解决办法
9万
查看次数

使用Hive ntile导致where子句

我想获取Hive中表格的第一个四分位数的摘要数据.以下是获取每个四分位数中的最大视图数的查询:

SELECT NTILE(4) OVER (ORDER BY total_views) AS quartile, MAX(total_views)
FROM view_data
GROUP BY quartile
ORDER BY quartile;
Run Code Online (Sandbox Code Playgroud)

此查询是获取第一个四分位数中所有人的名称:

SELECT name, NTILE(4) OVER (ORDER BY total_views) AS quartile
FROM view_data
WHERE quartile = 1
Run Code Online (Sandbox Code Playgroud)

我为这两个查询都收到此错误:

Invalid table alias or column reference 'quartile'
Run Code Online (Sandbox Code Playgroud)

如何ntilewhere条款或group by条款中引用结果?

hadoop hive quantile hiveql

7
推荐指数
1
解决办法
7731
查看次数

使用tinys3上传到Amazon S3

我正在使用Python和tinys3将文件写入S3,但它无法正常工作.这是我的代码:

import tinys3
conn = tinys3.Connection('xxxxxxx','xxxxxxxx',tls=True)

f = open('testing_s3.txt','rb')
print conn.upload('testing_data/testing_s3.txt',f,'testing-bucket')
print conn.get('testing_data/testing_s3.txt','testing-bucket')
Run Code Online (Sandbox Code Playgroud)

这给出了输出:

<Response [301]>
<Response [301]>
Run Code Online (Sandbox Code Playgroud)

当我尝试指定端点时,我得到:

requests.exceptions.HTTPError: 403 Client Error: Forbidden
Run Code Online (Sandbox Code Playgroud)

知道我做错了什么吗?

编辑:当我尝试使用boto时,它可以工作,因此问题不在访问密钥或密钥中.

python amazon-s3

6
推荐指数
1
解决办法
6976
查看次数

在Hive中使用保留字

我正在将数据迁移到Hive 1.2,我意识到默认情况下,我不再被允许使用保留字作为列名。如果要使用保留字,则需要显式设置以下设置:

hive.support.sql11.reserved.keywords=false
Run Code Online (Sandbox Code Playgroud)

我的问题是,更改此默认值是否会导致任何意外的问题?更改之前我应该​​注意什么问题?

顺便说一下,此更改记录在此票证中:https : //issues.apache.org/jira/browse/HIVE-6617

hadoop hive hadoop2

5
推荐指数
1
解决办法
5617
查看次数

标签 统计

hadoop ×3

hive ×3

amazon-s3 ×1

hadoop2 ×1

hiveql ×1

python ×1

quantile ×1

rdbms ×1