Sin*_*ata 7 datetime r azure-machine-learning-studio
我在Azure机器学习中的Execute R模块中操作的所有这些日期在输出中写为空白 - 也就是说,这些日期列存在,但这些列中没有值.
包含我正在读入数据框的日期信息的源变量有两种不同的日期格式.它们如下:
usage$Date1=c(‘8/6/2015’ ‘8/20/2015’ ‘7/9/2015’)
usage$Date2=c(‘4/16/2015 0:00’, ‘7/1/2015 0:00’, ‘7/1/2015 0:00’)
Run Code Online (Sandbox Code Playgroud)
我在AML中检查了日志文件,而AML找不到本地时区.日志文件警告具体:[ModuleOutput] 1:在strptime(x,format,tz = tz):[ModuleOutput]无法识别当前时区'C':[ModuleOutput]请设置环境变量'TZ'[ModuleOutput] [ModuleOutput ] 2:在strptime(x,format,tz = tz):未知时区'localtime'
我在这里提到了另一个关于为strptime设置默认时区的答案
我更改了代码以显式定义全局环境时间变量.
Sys.setenv(TZ='GMT')
####Data frame usage cleanup, format and labeling
usage<-as.data.frame(usage)
usage$Date1<-as.character(usage$Date1)
usage$Date1<-as.POSIXct(usage$Date1, "%m/%d/%Y",tz="GMT")
usage$Date1<-format(usage$Date1, "%m/%d/%Y")
usage$Date1<-as.Date(usage$Date1, "%m/%d/%Y")
usage<-as.data.frame(usage)
usage$Date2<- as.POSIXct(usage$Date2, "%m/%d/%Y",tz="GMT")
usage$Date2<- format(usage$Date2,"%m/%d/%Y")
usage$Date2<-as.Date(usage$Date2, "%m/%d/%Y")
usage<-as.data.frame(usage)
Run Code Online (Sandbox Code Playgroud)
问题仍然存在 - 因此AzureML不会将这些变量写出来,而是将这些列写为空白.
(此代码适用于R studio,我假设本地时间来自系统.)
在阅读关于此问题的两篇博客文章后,似乎Azure ML不支持某些日期时间格式:
http://www.mikelanzetta.com/2015/01/data-cleaning-with-azureml-and-r-dates/
所以我尝试在将它发送到输出流之前转换为POSIXct,我已经完成如下:tenantusage $ Date1 = as.POSIXct(tenantusage $ Date1,"%m /%d /%Y",tz ="EST5EDT "); tenantusage $ Date2 = as.POSIXct(tenantusage $ Date2,"%m /%d /%Y",tz ="EST5EDT");
但遇到同样的问题.这些变量中的信息拒绝写出输出.Date1和Date2列为空.
请指教!
谢谢
嗨 SingingData 和 SochiX,
很遗憾听到这个令人沮丧的根源!我发现 SingingData 代码示例的以下变体对我有用(在 CRAN 3.1.0 模块中测试):
usage <- data.frame(list(Date1 = c('8/6/2015', '8/20/2015', '7/9/2015'),
Date2 = c('4/16/2015 0:00', '7/1/2015 0:00', '7/1/2015 0:00')))
usage$Date1 <- as.POSIXlt(usage$Date1, "%m/%d/%Y",tz="GMT")
usage$Date2 <- as.POSIXlt(usage$Date2, "%m/%d/%Y",tz="GMT")
usage$Date1 <- format(usage$Date1, "%m/%d/%Y")
usage$Date2 <- format(usage$Date2,"%m/%d/%Y")
usage$Date1 <- as.Date(usage$Date1, "%m/%d/%Y")
usage$Date2 <- as.Date(usage$Date2, "%m/%d/%Y")
maml.mapOutputPort("usage");
Run Code Online (Sandbox Code Playgroud)
我用过as.POSIXlt()
而不是as.POSIXct()
. 我希望这能帮助您解除 R 工作的障碍。