我使用RMySQL和MySQL数据库来存储我的数据集.有时数据会被修改,或者我也会将结果存储回数据库.简而言之,在我的用例中,R和数据库之间存在相当多的交互.
大部分时间我使用的便利功能,如dbWriteTable与dbReadTable写入和读取我的数据.不幸的是,这些只是完全忽略了R数据类型和MySQL字段类型.我的意思是我希望MySQL日期字段最终在一个Date或POSIX类中.另一种方法我认为这些R类存储为一个有点对应的MySQL字段类型.这意味着日期不应该是角色 - 我不希望在这里区分浮动和双打......
我也尝试过使用dbGetQuery- 那里有相同的结果.在阅读本手册时是否有一些我完全错过的内容,或者在这些软件包中是否完全不可能?一个不错的工作会怎样?
编辑:@mdsummer我试图在文档中找到更多内容,但只发现了这些令人失望的行:`MySQL表作为data.frames读入R,但没有将字符或逻辑数据强制转换为因子.类似地,在导出data.frames时,因子被导出为字符向量.
整数列通常作为R整数向量导入,但BIGINT或UNSIGNED INTEGER等情况除外,它们被强制转换为R的双精度向量以避免截断(当前R的整数是带符号的32位数).
时间变量作为字符数据导入/导出,因此您需要将这些变量转换为您喜欢的日期/时间表示.
好的,我现在有了一个有效的解决方案.这是一个将MySQL字段类型映射到R类的函数.这有助于特别处理MySQL字段类型日期...
dbReadMap <- function(con,table){
statement <- paste("DESCRIBE ",table,sep="")
desc <- dbGetQuery(con=con,statement)[,1:2]
# strip row_names if exists because it's an attribute and not real column
# otherweise it causes problems with the row count if the table has a row_names col
if(length(grep(pattern="row_names",x=desc)) != 0){
x <- grep(pattern="row_names",x=desc)
desc <- desc[-x,]
}
# replace length output in brackets that is returned by describe
desc[,2] <- gsub("[^a-z]","",desc[,2])
# building a dictionary
fieldtypes <- c("int","tinyint","bigint","float","double","date","character","varchar","text")
rclasses <- c("as.numeric","as.numeric","as.numeric","as.numeric","as.numeric","as.Date","as.character","as.character","as.character")
fieldtype_to_rclass = cbind(fieldtypes,rclasses)
map <- merge(fieldtype_to_rclass,desc,by.x="fieldtypes",by.y="Type")
map$rclasses <- as.character(map$rclasses)
#get data
res <- dbReadTable(con=con,table)
i=1
for(i in 1:length(map$rclasses)) {
cvn <- call(map$rclasses[i],res[,map$Field[i]])
res[map$Field[i]] <- eval(cvn)
}
return(res)
}
Run Code Online (Sandbox Code Playgroud)
也许这不是一个好的编程实践 - 我只是不知道更好.因此,使用它需要您自担风险或帮助我改进它......当然,它只有一半:reading.希望我能尽快找到写一些写作功能的时间.
如果您对映射字典有建议,请告诉我:)