标签: sas

在SAS中,什么是捕获语法错误的好技巧/选项?

在增强编辑器中,着色可能会给你一个提示.但是,在大型机上我不相信编辑器中有任何可以帮助你的东西.

我用

OPTIONS OBS=0 noreplace;
Run Code Online (Sandbox Code Playgroud)

obs = 0选项指定从输入数据集读入0个观察值,NOREPLACE告诉SAS不要用现有的SAS数据集覆盖同名的数据集.如果要创建新的datastet,将使用所有属性创建它,但观察次数为0.(如果需要,请务必将选项重置为选项Obs = max replace;当找不到更多语法错误时).

我会对任何其他技术感兴趣.谢谢

有关选项的说明来自这里.

sas

10
推荐指数
1
解决办法
3160
查看次数

SAS内存使用和排序

我很好奇SAS使用内存,排序,以及为什么它看起来效率低下.

我有一个带有8GB内存的四核xeon.我有一个3GB的数据集.为什么在标准过程排序期间的任何给定时间内仅使用120MB的内存和15-20%的CPU利用率?这似乎是程序非常低效的事情.

在我看来,由于我有可用内存,它将加载整个数据集,然后继续删除所有可用的CPU周期.但只有15%?这是对可用资源的极大浪费,让我感到困扰.看起来它经常在磁盘上来回走动,这很慢.

是否有一些神奇的设置说"SAS,你可以利用一切更快"我错过了?

64位操作系统运行64位SAS,顺便说一句.

sas

10
推荐指数
1
解决办法
4718
查看次数

R glm标准误差估计与SAS PROC GENMOD的差异

我正在使用R中的glm将SAS PROC GENMOD示例转换为R. SAS代码是:

proc genmod data=data0 namelen=30;
model boxcoxy=boxcoxxy ~ AGEGRP4 + AGEGRP5 + AGEGRP6 + AGEGRP7 + AGEGRP8 + RACE1 + RACE3 + WEEKEND + 
SEQ/dist=normal;
FREQ REPLICATE_VAR;  
run;
Run Code Online (Sandbox Code Playgroud)

我的R代码是:

parmsg2 <- glm(boxcoxxy ~ AGEGRP4 + AGEGRP5 + AGEGRP6 + AGEGRP7 + AGEGRP8 + RACE1 + RACE3 + WEEKEND + 
SEQ , data=data0, family=gaussian, weights = REPLICATE_VAR)
Run Code Online (Sandbox Code Playgroud)

当我使用时,summary(parmsg2)我获得与SAS相同的系数估计值,但我的标准误差却大不相同.

SAS的摘要输出是:

Name         df   Estimate      StdErr    LowerWaldCL  UpperWaldCL      ChiSq   ProbChiSq
Intercept    1   6.5007436    .00078884      6.4991975    6.5022897    67911982 0
agegrp4 …
Run Code Online (Sandbox Code Playgroud)

r sas glm

10
推荐指数
2
解决办法
2976
查看次数

停止SAS执行

快问

是否有一个单行(或相当简短)的方法来取消进一步的SAS语句的执行与窗口环境.

这些是我所知道的方法,但它们令人厌倦,特别是在大量的评论中.我尝试了ABORTSTOP语句,但他们关闭了窗口环境但我想要的只是在某一点停止执行并继续我的快乐方式.

谢谢

sas

10
推荐指数
1
解决办法
1万
查看次数

将大型SAS数据集转换为hdf5

我有多个大型(> 10GB)SAS数据集,我想转换它们用于pandas,最好是HDF5.有许多不同的数据类型(日期,数字,文本),一些数字字段也有不同的错误代码用于缺失值(即值可以是.,.E,.C等)我希望保留列名和标签元数据.有没有人找到一种有效的方法来做到这一点?

我尝试使用MySQL作为两者之间的桥梁,但我在传输时遇到了一些超出范围的错误,而且速度非常慢.我也试过以Stata .dta格式从SAS导出,但SAS(9.3)以旧的Stata格式导出,与pandas中的read_stat()不兼容.我也尝试了sas7bdat包,但是从描述中它还没有被广泛测试,所以我想以另一种方式加载数据集并比较结果以确保一切正常.

额外的细节:我想要转换的数据集是来自WRDS的CRSP,Compustat,IBES和TFN的数据集.

python sas hdf5 pandas

10
推荐指数
1
解决办法
1747
查看次数

SAS中的单元测试框架:FUTS与SASUnit

有没有人有使用SAS的第三方单元测试框架的经验,如FUTS(http://thotwave.com/resources/futs-framework-unit-testing-sas/)或SASUnit(http://www.redscope. org/sasunit/en)?

我真的想比较和对比这些选项与任何其他已知的替代品(我目前使用我自己的自酿单元测试%断言宏,但我想切换到更强大的东西).可能需要考虑的领域包括:

  • 这些框架有多大的用户群?
  • 他们是否受到开发人员的良好支持?
  • 有没有已知的错误?
  • 是否存在可用性问题?

我在这些产品的互联网搜索中发现的大部分内容通常是开发人员自己发布的产品发布公告(开发人员也在这两个框架上编写了白皮书).但是,我没有看到很多用户社区积极使用这些产品的证据,这让我很开心自己开始使用这些产品.

unit-testing sas

9
推荐指数
1
解决办法
2680
查看次数

如何读取SAS数据集?

我有很多SAS格式的文件,我希望能够在SAS之外的程序中读取它们.除了安装基础SAS系统之外,我什么都没有.我可以手动转换每一个,但我想要一种自动执行的方法.

sas

9
推荐指数
2
解决办法
2万
查看次数

统计软件包中"图形语法"的实现

我知道Leland Wikinson的想法,正如他在"图形语法"一书中所揭示的那样,是R中ggplot2实现的基础.

但是在其他统计软件包(SAS或其他)中是否存在相同想法的其他实现?

r sas

9
推荐指数
2
解决办法
945
查看次数

使用sas获取数据步骤中的行号

有没有办法做一个过分区来获取sas上的行号?在sql我会像:

  Select region,company, ROW_NUMBER()  OVER(PARTITION BY region ORDER BY Name)
    From companyData;
Run Code Online (Sandbox Code Playgroud)

我希望最好在数据集中这样做

sas

9
推荐指数
1
解决办法
4万
查看次数

sas MACRO&符号

%let test = one;
%let one = two;

%put &test;
%put &&test;
%put &&&test;
%put &&&&test;
%put &&&&&test;
Run Code Online (Sandbox Code Playgroud)

好.我完全被这些&符号击败了.我不明白他们为什么在宏变量之前需要那么多的&符号.有没有什么技巧可以掌握&符号的用法?顺便说一下,五个结果相应的是什么?

sas ampersand sas-macro

9
推荐指数
1
解决办法
2904
查看次数

标签 统计

sas ×10

r ×2

ampersand ×1

glm ×1

hdf5 ×1

pandas ×1

python ×1

sas-macro ×1

unit-testing ×1