我有一个数据集,其中有一些注释会排除主题。我想制作一个迷你数据集来收集这些主题。
我正在尝试为此使用SAS SQL,所以我尝试这样做:
PROC SQL;
CREATE TABLE EXCLUDE as
SELECT *
FROM data_set
WHERE UPCASE(COMMENT) like '%(INELIGIBLE | REFUSED)%';
QUIT;
Run Code Online (Sandbox Code Playgroud)
我也试过
PROC SQL;
CREATE TABLE exclude as
SELECT *
FROM Data_set
WHERE UPCASE(COMMENT) like ('%INELIGIBLE%'|'%REFUSED%')
;
QUIT;
Run Code Online (Sandbox Code Playgroud)
我不断收到错误消息,说“像运算符需要字符操作数”
如何使它成为正确的语法查询?
谢谢
您可以通过like-join对要排除的术语列表进行操作:
数据词;
输入字$ char16。;
数据线;
不容置疑
被拒绝
;
跑 ;
proc sql;
创建表排除为
选择一个。*
从data_set a
左联接
大写(a.comment)上的单词b就像cats('%',b.word,'%')
哪里缺少(b.word);
退出 ;