我发现了我认为MicrosoftR处理来自SPSS的.sav文件的元数据的方式中的错误.
以下是变量视图的摘要:
ColumnA: 1 - Yes, 2 - No
ColumnB: 0.33 - Yes, 0.5 - Maybe, 0.66 - No, 0.99 - Why not, 1.00 - Yes, for sure.
ColumnC: A - Yes, B - No
Run Code Online (Sandbox Code Playgroud)
我的代码:
library(RevoScaleR)
df <- RxSpssData(
"RoundingTest.sav",
stringsAsFactors = FALSE,
labelsAsInfo = TRUE,
labelsAsLevels = TRUE,
mapMissingCodes = "none"
)
test = rxImport(df)
Run Code Online (Sandbox Code Playgroud)
数据读得很好:
ColumnA ColumnB ColumnC Var0001
1 Yes 0.33 Yes NA
2 No 0.50 Yes NA
3 Yes 0.66 No NA
Run Code Online (Sandbox Code Playgroud)
但是,valueInfoCodes不会:
attr(test$ColumnA, ".rxValueInfoCodes") …Run Code Online (Sandbox Code Playgroud)