fas*_*n01 1 linux bash shell awk
我有一个 csv 文件,其中包含大约 600 万行分隔线
1,2018-11-25 23:00:26,403,74
1,2018-11-25 23:02:10,406,68
1,2018-11-25 23:04:19,448,108
1,2018-11-25 23:05:26,417,79
1,2018-11-25 23:05:30,378,80
1,2018-11-25 23:05:31,360,78
1,2018-11-25 23:06:45,391,79
1,2018-11-25 23:06:50,432,76
Run Code Online (Sandbox Code Playgroud)
这些时间是 UTC,我住在欧洲 UTC + 1。我已经“编写”了我的第一个 AWK 脚本:test.awk:
BEGIN { FS=",";OFS="\t"}
{
$2 = mktime(gensub(/[-:]/," ","g",$2))
print
}
Run Code Online (Sandbox Code Playgroud)
当我运行时:
$ awk -f test.awk mark.csv
Run Code Online (Sandbox Code Playgroud)
它给出了输出:
1 1543183226 403 74
1 1543183330 406 68
1 1543183459 448 108
1 1543183526 417 79
1 1543183530 378 80
1 1543183531 360 78
1 1543183605 391 79
1 1543183610 432 76
Run Code Online (Sandbox Code Playgroud)
看起来不错,但问题是纪元提前了一个小时
1543183226?2018-11-25 23:00:26 but 1543183226=2018-11-25 22:00:26
Run Code Online (Sandbox Code Playgroud)
为了解决这个问题,我在看
strftime([format [, timestamp[, utc-flag]]])
Run Code Online (Sandbox Code Playgroud)
我快到了,但我需要一些帮助。
谢谢
只需在调用 awk 或为 mktime() 设置 UTC 标志之前将时区 ( TZ) 变量UTC设置为:
$ awk 'BEGIN{print mktime("2018 11 25 23 00 26")}'
1543208426
$ TZ=UTC awk 'BEGIN{print mktime("2018 11 25 23 00 26")}'
1543186826
$ awk 'BEGIN{print mktime("2018 11 25 23 00 26",1)}'
1543186826
$ awk 'BEGIN{print mktime("2018 11 25 22 00 26",1)}'
1543183226
Run Code Online (Sandbox Code Playgroud)