我对SAS的了解是不存在的,我通常在R和Stata工作.最近我下载了一个可以从巴西政府公开获得的数据集,由于某种原因,他们以原始格式提供了SAS脚本以供阅读:
DATA DOM (COMPRESS = YES);
INFILE "...¥T_DOMICILIO_S.txt" LRECL = 164 MISSOVER;
INPUT @001 TIPO_REG $2. /* TIPO DE REGISTRO */
@003 COD_UF $2. /* C?DIGO DA UF */
@005 NUM_SEQ $3. /* N?MERO SEQUENCIAL */
@008 NUM_DV $1. /* DV DO SEQUENCIAL */
…Etc etc…
RUN;
Run Code Online (Sandbox Code Playgroud)
是否有可能"将此陈述翻译成r的等价物?如果是这样,我应该寻找哪种功能?
42-*_*42- 11
有一个应用程序!无论如何,一个R包装,SAScii由不屈不挠的安东尼达米科带给你.它有两个功能:parse.SAScii和read.SAScii.我在美国gummint CDC文件上使用它取得了巨大成功.
install.packages("SAScii")
library(SAScii)
> parse.SAScii("test.sas")
varname width char divisor
1 TIPO_REG 2 TRUE 1
2 COD_UF 2 TRUE 1
3 NUM_SEQ 3 TRUE 1
4 NUM_DV 1 TRUE 1
Warning message:
In readLines(sas_ri) : incomplete final line found on 'test.sas'
Run Code Online (Sandbox Code Playgroud)
- 然后,您将需要使用read.SAScii进行第二步,但是您没有为该测试提供适当的测试文件.
输入文件'test.sas'是:
DATA DOM (COMPRESS = YES);
INFILE "...¥T_DOMICILIO_S.txt" LRECL = 164 MISSOVER;
INPUT @001 TIPO_REG $2. /* TIPO DE REGISTRO */
@003 COD_UF $2. /* C?DIGO DA UF */
@005 NUM_SEQ $3. /* N?MERO SEQUENCIAL */
@008 NUM_DV $1. /* DV DO SEQUENCIAL */
RUN;
Run Code Online (Sandbox Code Playgroud)
如果您通过Anthony Damico在Youtube上观看"twotorials"或访问他的网站,您可以看到为什么我使用"不屈不挠"这个词.
对你的问题的其他回答更好,因为它们更通用.但是你要特别询问ibge的pesquisa或者家庭...我已经编写了代码,将2002-2003和2008-2009的所有内容直接导入R而不再赘述.:)只需按照顶部的说明,运行下载脚本,一切都将正确加载到R中.
https://github.com/ajdamico/usgsd/tree/master/Pesquisa%20de%20Orcamentos%20Familiares
http://www.asdfree.com/search/label/pesquisa%20de%20orcamentos%20familiares%20%28pof%29