在增强编辑器中,着色可能会给你一个提示.但是,在大型机上我不相信编辑器中有任何可以帮助你的东西.
我用
OPTIONS OBS=0 noreplace;
Run Code Online (Sandbox Code Playgroud)
obs = 0选项指定从输入数据集读入0个观察值,NOREPLACE告诉SAS不要用现有的SAS数据集覆盖同名的数据集.如果要创建新的datastet,将使用所有属性创建它,但观察次数为0.(如果需要,请务必将选项重置为选项Obs = max replace;当找不到更多语法错误时).
我会对任何其他技术感兴趣.谢谢
有关选项的说明来自这里.
我很好奇SAS使用内存,排序,以及为什么它看起来效率低下.
我有一个带有8GB内存的四核xeon.我有一个3GB的数据集.为什么在标准过程排序期间的任何给定时间内仅使用120MB的内存和15-20%的CPU利用率?这似乎是程序非常低效的事情.
在我看来,由于我有可用内存,它将加载整个数据集,然后继续删除所有可用的CPU周期.但只有15%?这是对可用资源的极大浪费,让我感到困扰.看起来它经常在磁盘上来回走动,这很慢.
是否有一些神奇的设置说"SAS,你可以利用一切更快"我错过了?
64位操作系统运行64位SAS,顺便说一句.
我正在使用R中的glm将SAS PROC GENMOD示例转换为R. SAS代码是:
proc genmod data=data0 namelen=30;
model boxcoxy=boxcoxxy ~ AGEGRP4 + AGEGRP5 + AGEGRP6 + AGEGRP7 + AGEGRP8 + RACE1 + RACE3 + WEEKEND +
SEQ/dist=normal;
FREQ REPLICATE_VAR;
run;
Run Code Online (Sandbox Code Playgroud)
我的R代码是:
parmsg2 <- glm(boxcoxxy ~ AGEGRP4 + AGEGRP5 + AGEGRP6 + AGEGRP7 + AGEGRP8 + RACE1 + RACE3 + WEEKEND +
SEQ , data=data0, family=gaussian, weights = REPLICATE_VAR)
Run Code Online (Sandbox Code Playgroud)
当我使用时,summary(parmsg2)我获得与SAS相同的系数估计值,但我的标准误差却大不相同.
SAS的摘要输出是:
Name df Estimate StdErr LowerWaldCL UpperWaldCL ChiSq ProbChiSq
Intercept 1 6.5007436 .00078884 6.4991975 6.5022897 67911982 0
agegrp4 …Run Code Online (Sandbox Code Playgroud) 快问
是否有一个单行(或相当简短)的方法来取消进一步的SAS语句的执行与窗口环境.
这些是我所知道的方法,但它们令人厌倦,特别是在大量的评论中.我尝试了ABORT和STOP语句,但他们关闭了窗口环境但我想要的只是在某一点停止执行并继续我的快乐方式.
谢谢
我有多个大型(> 10GB)SAS数据集,我想转换它们用于pandas,最好是HDF5.有许多不同的数据类型(日期,数字,文本),一些数字字段也有不同的错误代码用于缺失值(即值可以是.,.E,.C等)我希望保留列名和标签元数据.有没有人找到一种有效的方法来做到这一点?
我尝试使用MySQL作为两者之间的桥梁,但我在传输时遇到了一些超出范围的错误,而且速度非常慢.我也试过以Stata .dta格式从SAS导出,但SAS(9.3)以旧的Stata格式导出,与pandas中的read_stat()不兼容.我也尝试了sas7bdat包,但是从描述中它还没有被广泛测试,所以我想以另一种方式加载数据集并比较结果以确保一切正常.
额外的细节:我想要转换的数据集是来自WRDS的CRSP,Compustat,IBES和TFN的数据集.
有没有人有使用SAS的第三方单元测试框架的经验,如FUTS(http://thotwave.com/resources/futs-framework-unit-testing-sas/)或SASUnit(http://www.redscope. org/sasunit/en)?
我真的想比较和对比这些选项与任何其他已知的替代品(我目前使用我自己的自酿单元测试%断言宏,但我想切换到更强大的东西).可能需要考虑的领域包括:
我在这些产品的互联网搜索中发现的大部分内容通常是开发人员自己发布的产品发布公告(开发人员也在这两个框架上编写了白皮书).但是,我没有看到很多用户社区积极使用这些产品的证据,这让我很开心自己开始使用这些产品.
我有很多SAS格式的文件,我希望能够在SAS之外的程序中读取它们.除了安装基础SAS系统之外,我什么都没有.我可以手动转换每一个,但我想要一种自动执行的方法.
我知道Leland Wikinson的想法,正如他在"图形语法"一书中所揭示的那样,是R中ggplot2实现的基础.
但是在其他统计软件包(SAS或其他)中是否存在相同想法的其他实现?
有没有办法做一个过分区来获取sas上的行号?在sql我会像:
Select region,company, ROW_NUMBER() OVER(PARTITION BY region ORDER BY Name)
From companyData;
Run Code Online (Sandbox Code Playgroud)
我希望最好在数据集中这样做
%let test = one;
%let one = two;
%put &test;
%put &&test;
%put &&&test;
%put &&&&test;
%put &&&&&test;
Run Code Online (Sandbox Code Playgroud)
好.我完全被这些&符号击败了.我不明白他们为什么在宏变量之前需要那么多的&符号.有没有什么技巧可以掌握&符号的用法?顺便说一下,五个结果相应的是什么?