小编Nir*_*rKa的帖子

BigQuery - 日期时间与时间戳

我查看了Google大查询数据类型的文档,检查了TimeStamp与Datetime数据类型之间的差异.

据我了解,主要区别是:

与Timestamps不同,DATETIME对象不会及时引用绝对实例.相反,它是民用时间,或用户在手表或日历上看到的时间.

那我什么时候应该使用Timestamp/Datetime?

谢谢

google-bigquery bigquery-standard-sql

16
推荐指数
1
解决办法
4969
查看次数

Spark Streaming 正常关闭

我看到有一个选项可以在两个地方配置正常关机:

  1. 在定义 spark conf 时:

“spark.streaming.stopGracefullyOnShutdown”,“真”。

  1. 停止流上下文时:

JavaStreamingContext scc;

scc.stop(真,真)

这两个选项有什么区别?

谢谢

java apache-spark spark-streaming

4
推荐指数
1
解决办法
2559
查看次数

BigQuery查询嵌套JSON

我有JSON数据,它以字符串形式保存在BigQuery中。

{
   "event":{
      "action":"prohibitedSoftwareCheckResult",
      "clientTime":"2017-07-16T12:55:40.828Z",
      "clientTimeZone":"3",
      "serverTime":"2017-07-16T12:55:39.000Z",
      "processList":{
         "1":"outlook.exe",
         "2":"notepad.exe"
      }
   },
   "user":{
      "id":123456,

   }
}
Run Code Online (Sandbox Code Playgroud)

我想要一个结果集,其中每个进程将在不同的行中。就像是:

UserID        ProcessName
-------------------------
123456        outlook.exe
123456        notepad.exe
Run Code Online (Sandbox Code Playgroud)

我看到有一个查询重复数据的选项,但据我所知,该字段必须为RECORD类型。

是否可以在子查询中“即时”转换为RECORD类型?(我无法将源字段更改为RECORD)。

还是有其他方法返回期望的结果集?

sql json nested google-bigquery

0
推荐指数
1
解决办法
1265
查看次数