小编Pio*_*sen的帖子

亚马逊雅典娜/普雷斯托的时差(秒和分钟)

我有一个创建时间戳和结束时间戳的列表,我想获得从创建到结束的最后秒数.没有使用UNIX时间戳(我目前没有)时无法找到任何方法.

类似的东西:

DATEDIFF( '第二',分钟(CREATION_TIME),最大值(ENDING_TIME))

creation_time ='2017-03-20 10:55:00'..

presto amazon-athena

4
推荐指数
1
解决办法
1万
查看次数

Presto - 十六进制字符串到 int

我正在尝试使用 presto 将十六进制字符串(以“0x”开头)转换为其整数值。例如0x100256。我的十六进制字符串称为msg_id。我尝试用这个-

from_hex(substr(msg_id,3))
Run Code Online (Sandbox Code Playgroud)

但我遇到了一个问题,因为from_hex期望偶数个十六进制数字(0100而不是100)。我决定尝试使用if语句来解决这个问题,所以我尝试了以下方法:

if(length(msg_id)%2=0, from_hex(substr(msg_id,3))) 
Run Code Online (Sandbox Code Playgroud)

(稍后会处理奇数位的情况)

但是 - 的结果from_hex是一种varbinary具有不同字节数的类型。我想将其转换为整数或任何其他数字类型,但我找不到方法。

有任何想法吗?我会很感激...

sql hex presto

4
推荐指数
1
解决办法
9880
查看次数

来自字符串字段的 AWS Athena json_extract 查询返回空值

我在雅典娜有一张这种结构的桌子

CREATE EXTERNAL TABLE `json_test`(
  `col0` string , 
  `col1` string , 
  `col2` string , 
  `col3` string , 
  `col4` string , 
  )
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.OpenCSVSerde' 
WITH SERDEPROPERTIES ( 
  'quoteChar'='\"', 
  'separatorChar'='\;') 
Run Code Online (Sandbox Code Playgroud)

像这样的 Json 字符串存储在“col4”中:

{'email': 'test_email@test_email.com', 'name': 'Andrew', 'surname': 'Test Test'}
Run Code Online (Sandbox Code Playgroud)

我正在尝试进行 json_extract 查询:

SELECT json_extract(col4 , '$.email') as email FROM "default"."json_test"
Run Code Online (Sandbox Code Playgroud)

但查询返回空值。

任何帮助,将不胜感激。

json hive amazon-s3 presto amazon-athena

4
推荐指数
1
解决办法
9753
查看次数

除JDBC之外的Presto API选项

除了JDBC之外,还有从Hive通过Presto查询引擎获取数据到用户界面的所有其他选项

UI  <--> Presto <--> Hive
Run Code Online (Sandbox Code Playgroud)

presto

3
推荐指数
1
解决办法
1692
查看次数

显示Presto db中所有模式的表

在Presto db

SHOW SCHEMAS; 返回所有模式

SHOW TABLES FROM foo; 返回foo架构的所有表

是否有一种简单的方法可以从Presto中的所有模式中返回表格?

sql presto

3
推荐指数
1
解决办法
7877
查看次数

Presto map(varchar,varchar):如何获取它的所有可能键?

我正在尝试搜索具有数据类型映射(varchar,varchar)的列.现在访问该列的一种方法是使用这个结构name_of_column [' key '],它将给出该键的值.但我想知道什么是可能的密钥,然后根据这些密钥应用分组和其他操作.

我尝试在互联网上搜索,但无法找到合适的解决方案.

presto

3
推荐指数
1
解决办法
5457
查看次数

如何为Presto和InfluxDB创建自定义连接器

我正在尝试为Presto和InfluxDB创建一个自定义连接器,以便Presto可以在InfluxDB上运行SQL查询.有没有这种连接器可用的例子?

Connectors are the source of all data for queries in Presto. Even if your data source doesn’t have underlying tables backing it, as long as you adapt your data source to the API expected by Presto, you can write queries against this data.
Run Code Online (Sandbox Code Playgroud)

我找到的用于编写连接器的唯一文档是:https: //prestodb.io/docs/current/develop/example-http.html

如果有人有其他例子,请你分享一下吗?

presto influxdb

3
推荐指数
1
解决办法
715
查看次数

AWS Athena(Presto)OFFSET支持

我想知道AWS Athena中是否支持OFFSET。对于mysql,以下查询正在运行,但在雅典娜中却给了我错误。任何示例都将有所帮助。

从雇员中选择* empSal> 3000 LIMIT 300 OFFSET 20

sql amazon-web-services presto amazon-athena

3
推荐指数
1
解决办法
1559
查看次数

查找雅典娜查询结果的来源

我们在S3中存储了数千个文件。这些文件暴露于雅典娜,以便我们对其进行查询。在进行调试时,我发现雅典娜在对特定进行查询时会显示多个空白行id。鉴于有成千上万个文件,所以我不确定这些数据来自何处。

有没有一种方法可以查看雅典娜结果中各行的源文件?

amazon-s3 amazon-web-services presto amazon-athena

3
推荐指数
1
解决办法
379
查看次数

在 Presto 中添加两张地图

我的数据如下

customer_id   usage_month  usage_by_product         usage
1             June         {"A":50, "B":50}         100
1             July         {"A":50, "B":10, "C":20} 80
1             Aug          {"A":50, "D":500}        550
1             Sep          {"C" :30}                30
Run Code Online (Sandbox Code Playgroud)

我想编写一个查询来汇总全年的总使用量

customer_id   usage_by_product    usage
 1            {"A": 150, "B":60   760
               "C": 50, "D":500}
Run Code Online (Sandbox Code Playgroud)

是否可以在 Athena (Presto) 的地图上进行这种聚合?

presto

3
推荐指数
1
解决办法
5155
查看次数

标签 统计

presto ×10

amazon-athena ×4

sql ×3

amazon-s3 ×2

amazon-web-services ×2

hex ×1

hive ×1

influxdb ×1

json ×1