- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我希望有人能帮我解决这个问题。我正在尝试获取一个字符串变量,其中包含一系列带分隔符的选择列表响应。单个变量中可以没有响应、一个响应(例如 1234)或多个响应(例如 1234;9876)。不同的选项总是用分号 (;) 分隔。我想根据分隔符将这个单个变量拆分为多个变量。
例如,reasons=1234;9876 -> reason1=1234, reason2=9876
传统上,我使用扫描功能以手动方式完成此操作。问题是我最多(在这种情况下)有 10 个选择列表项连接在一个字符串中。
data want;
set got;
length reason1-reason10 $10;
if reasons ne ' ' then reason1=scan(reasons, 1, ';');
if reasons ne ' ' then reason2=scan(reasons, 2, ';');
if reasons ne ' ' then reason3=scan(reasons, 3, ';');
...
run;
等等……
我觉得数组会大大简化这个过程。但是,我现在只是在学习如何使用数组。非常感谢任何有关如何使用更高效的代码拆分此字符串变量的建议。谢谢!
最佳答案
解决此问题的最佳方法因数据集的大小和复杂性而异——可能有多少个变量?
如果变量数量较少且已知,那么您的方法就可以了。数组会略有帮助:
data got;
informat reasons $30.;
input reasons $;
datalines4;
123;456;789;101112
456;789;101112;131415
;;;;
run;
data want;
set got;
length reason1-reason10 $10;
array reason(10) $;
do _i = 1 to dim(reason);
reason[_i] = scan(reasons,_i,';');
end;
run;
您甚至不必检查它是否丢失,SCAN 会表现良好。
如果您不确定变量的数量可能是多少(并且不希望从未达到“最大值”),PROC TRANSPOSE
更好。
首先为每个扫描值输出一行,全部放在一个变量中。然后转置它。
添加一个 id
变量使这更容易:
data got;
informat reasons $30.;
input id reasons $;
datalines4;
1 123;456;789;101112
2 456;789;101112;131415
;;;;
run;
data got_pret;
set got;
do _i = 1 to countw(reasons,';');
reason=scan(reasons,_i,';');
output;
end;
keep reason id;
run;
proc transpose data=got_pret out=want prefix=reason;
by id;
var reason;
run;
这有一个很大的优势,就是不需要提前知道有多少。不过,这是又一步,因此对于巨大数据集,它可能不太受欢迎(尽管您可以使用数据步骤 view
来保存其中的一部分)。
关于arrays - 将 SAS 中的定界字符串变量拆分为单个变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31565557/
我正在实现谱聚类算法,我必须确保矩阵(拉普拉斯矩阵)是半正定矩阵。 检查矩阵是否为正定矩阵 (PD) 就足够了,因为可以在特征值中看到“半”部分。矩阵非常大(nxn,其中 n 是几千的数量级)所以特征
我是一名优秀的程序员,十分优秀!