小编Pio_sen的帖子

如何部分导出 git 存储库？

我的公司内部使用 git，我们在使用 svn 的 Google Code 上以开源方式发布了一些工作。（如果它支持git，问题可能是一样的。）

问题是我们只发布了存储库的一部分，因此按照http://code.google.com/p/support/wiki/ImportingFromGit中所述使用 git-svn将不起作用。

如何发布部分存储库？（我第一次只是复制了我们想要发布的文件。）
如何同步发布的文件和Code的存储库之间的更改？

svn git google-code git-svn

4
推荐指数

1
解决办法

2268
查看次数

如何在 Windows 上开始（构建）Presto

我看到了构建 presto 需要 Mac OS/Linux 的明确要求。 https://github.com/prestodb/presto 我也看到有一些问题正在讨论获得 Windows 对 Presto 构建的支持 https://github.com/prestodb/presto/issues/2351

我没有看到有关如何开始或开始使用 Windows 的方法的正确文档。

我找到了这个链接http://wheresthedocs.blogspot.com/ 但我不确定它是否会帮助我开始使用 presto。如果有人做过，请提供一些非常有用的基本说明！

4
推荐指数

1
解决办法

3216
查看次数

如何从Presto中的前几行获取date_diff？

我正在尝试diff_date从Presto中获取此数据。

timespent | 2016-04-09T00:09:07.232Z | 1000          | general
timespent | 2016-04-09T00:09:17.217Z | 10000         | general
timespent | 2016-04-09T00:13:27.123Z | 250000        | general
timespent | 2016-04-09T00:44:21.166Z | 1144020654000 | general

Run Code Online (Sandbox Code Playgroud)

这是我的查询

select _t, date_diff('second', from_iso8601_timestamp(_ts), SELECT from_iso8601_timestamp(f._ts) from logs f 
              where f._t = 'timespent'
               and f.dt = '2016-04-09'
               and f.uid = 'd2de01a1-8f78-49ce-a065-276c0c24661b'
               order by _ts)
from logs d
where _t = 'timespent'
and dt = '2016-04-09'
and uid = 'd2de01a1-8f78-49ce-a065-276c0c24661b'
order by _ts;

Run Code Online (Sandbox Code Playgroud)

这是我得到的错误

Query 20160411_150853_00318_fmb4r failed: line 1:61: …

Run Code Online (Sandbox Code Playgroud)

4
推荐指数

1
解决办法

1万
查看次数

亚马逊雅典娜/普雷斯托的时差(秒和分钟)

我有一个创建时间戳和结束时间戳的列表,我想获得从创建到结束的最后秒数.没有使用UNIX时间戳(我目前没有)时无法找到任何方法.

类似的东西:

DATEDIFF( '第二',分钟(CREATION_TIME),最大值(ENDING_TIME))

creation_time ='2017-03-20 10:55:00'..

presto amazon-athena

4
推荐指数

1
解决办法

1万
查看次数

Presto - 十六进制字符串到 int

我正在尝试使用 presto 将十六进制字符串（以“0x”开头）转换为其整数值。例如0x100256。我的十六进制字符串称为msg_id。我尝试用这个-

from_hex(substr(msg_id,3))

Run Code Online (Sandbox Code Playgroud)

但我遇到了一个问题，因为from_hex期望偶数个十六进制数字（0100而不是100）。我决定尝试使用if语句来解决这个问题，所以我尝试了以下方法：

if(length(msg_id)%2=0, from_hex(substr(msg_id,3)))

Run Code Online (Sandbox Code Playgroud)

（稍后会处理奇数位的情况）

但是 - 的结果from_hex是一种varbinary具有不同字节数的类型。我想将其转换为整数或任何其他数字类型，但我找不到方法。

有任何想法吗？我会很感激...

4
推荐指数

1
解决办法

9880
查看次数

来自字符串字段的 AWS Athena json_extract 查询返回空值

我在雅典娜有一张这种结构的桌子

CREATE EXTERNAL TABLE `json_test`(
  `col0` string , 
  `col1` string , 
  `col2` string , 
  `col3` string , 
  `col4` string , 
  )
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.OpenCSVSerde' 
WITH SERDEPROPERTIES ( 
  'quoteChar'='\"', 
  'separatorChar'='\;')

Run Code Online (Sandbox Code Playgroud)

像这样的 Json 字符串存储在“col4”中：

{'email': 'test_email@test_email.com', 'name': 'Andrew', 'surname': 'Test Test'}

Run Code Online (Sandbox Code Playgroud)

我正在尝试进行 json_extract 查询：

SELECT json_extract(col4 , '$.email') as email FROM "default"."json_test"

Run Code Online (Sandbox Code Playgroud)

但查询返回空值。

任何帮助，将不胜感激。

json hive amazon-s3 presto amazon-athena

4
推荐指数

1
解决办法

9753
查看次数

Presto SQL：使用查询结果出现的时区字符串更改时区不起作用

我通过 Mode Analytics Platform 连接到 AWS Athena 并使用其查询引擎（基于 Presto 0.172 ）查询表。该表public.zones将时区信息存储在time_zone我感兴趣的某些区域的列中，存储为varchar.

例如，如果我输入：

SELECT time_zone 
FROM public.zones
LIMIT 4;

Run Code Online (Sandbox Code Playgroud)

我得到（如预期）：

time_zone
----------  
US/Pacific 
US/Eastern 
US/Eastern 
US/Eastern

Run Code Online (Sandbox Code Playgroud)

我可以运行这个测试查询：

SELECT 
  timestamp '2017-06-01 12:34:56.789' AT TIME ZONE 'US/Eastern' AS time_eastern,
  time_zone 
FROM public.zones
LIMIT 4;

Run Code Online (Sandbox Code Playgroud)

我得到（如预期）

time_eastern                        time_zone
----------------------------------  ----------
2017-06-01 08:34:56.789 US/Eastern  US/Pacific
2017-06-01 08:34:56.789 US/Eastern  US/Eastern
2017-06-01 08:34:56.789 US/Eastern  US/Eastern
2017-06-01 08:34:56.789 US/Eastern  US/Eastern

Run Code Online (Sandbox Code Playgroud)

现在，我想'2017-06-01 12:34:56.789'在我从区域表中查询的不同时区中表示相同的时间字符串。我希望运行以下查询。（它在 PostgreSQL 上运行）。

SELECT 
  timestamp '2017-06-01 12:34:56.789' AT TIME …

Run Code Online (Sandbox Code Playgroud)

sql postgresql timezone presto amazon-athena

4
推荐指数

1
解决办法

1万
查看次数

AWS Athena：删除日期范围之间的分区

我有一个基于日期的分区 athena 表，如下所示：

20190218

Run Code Online (Sandbox Code Playgroud)

我想删除去年创建的所有分区。

我尝试了以下查询，但没有奏效。

ALTER TABLE tblname DROP PARTITION (partition1 < '20181231');

ALTER TABLE tblname DROP PARTITION (partition1 > '20181010'), Partition (partition1 < '20181231');

Run Code Online (Sandbox Code Playgroud)

amazon-web-services presto amazon-athena

4
推荐指数

1
解决办法

6130
查看次数

AWS S3 - 没有 gz 压缩的 Athena

我正在 AWS Athena 中使用以下语句创建一个表：

CREATE TABLE table2
WITH 
(
  format='JSON',
  external_location='s3://bucket/path'
) AS
SELECT field1, field2, field3, field4, field5, field6
FROM table1
ORDER BY field1, field2

Run Code Online (Sandbox Code Playgroud)

但是，当我查看 external_location 时，我发现所有文件都被压缩为 gz 格式。是否可以关闭压缩？也就是说，只需将原始 JSON 写入 S3 存储桶即可。

amazon-s3 amazon-athena

4
推荐指数

2
解决办法

3285
查看次数

如何在 Athena (Presto) 中过滤聚合值？

我无法从 Athena 控制台运行带有 where 条件的简单 sql 选择。以下是详细信息：

SELECT name, count(*) AS c
FROM target_reddit_movie
GROUP BY name
HAVING c > 1
ORDER BY c DESC
LIMIT 10

Run Code Online (Sandbox Code Playgroud)

我收到一个错误SYNTAX_ERROR: line 1:74: Column 'c' cannot be resolved。

Athena 似乎无法识别该as列名称。我怎样才能让它发挥作用？它使用不同的语法吗？

sql presto amazon-athena

4
推荐指数

1
解决办法

7780
查看次数

标签统计

amazon-athena ×6

sql ×4

amazon-web-services ×1

git ×1

google-code ×1

hex ×1

hive ×1

json ×1

svn ×1

«
1
…
2
3
4
5
6
…
8
»