Ian*_*ows 23
R没有内置的方法来处理变量标签.我个人认为这是应该修复的缺点.Hmisc确实为hadling变量标签提供了一些便利,但标签只能被该包中的函数识别.read.dta创建一个data.frame,其属性为"var.labels",其中包含标签信息.然后,您可以从中创建数据字典.
> data(swiss)
> write.dta(swiss,swissfile <- tempfile())
> a <- read.dta(swissfile)
>
> var.labels <- attr(a,"var.labels")
>
> data.key <- data.frame(var.name=names(a),var.labels)
> data.key
var.name var.labels
1 Fertility Fertility
2 Agriculture Agriculture
3 Examination Examination
4 Education Education
5 Catholic Catholic
6 Infant_Mortality Infant.Mortality
Run Code Online (Sandbox Code Playgroud)
当然这个.dta文件没有非常有趣的标签,但你的标签应该更有意义.
正如Hadley Wickham在README.md文件中提到的那样:
总是得到一个数据框,日期时间转换为相应的R类,标记的向量作为新的标记类返回.您可以根据需要轻松强制使用因子或替换带有缺失的标记值.如果您还使用dplyr,您会注意到以方便的方式打印大型数据框.
(强调我的)
如果使用RStudio,它将自动在View("data.frame")
查看器窗格(源)中以变量名称显示标签.
变量标签作为属性附加到每个变量.这些不打印(因为它们往往很长),但如果您有RStudio的预览版本,您将在修改后的查看器窗格中看到它们.
您可以使用以下命令安装包:
install.packages("haven")
Run Code Online (Sandbox Code Playgroud)
并使用以下方法导入您的Stata日期:
read_dta("path/to/file")
Run Code Online (Sandbox Code Playgroud)
有关详情,请参阅:
help("read_dta")
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
11758 次 |
最近记录: |