gpt4 book ai didi

arrays - 将 SAS 中的定界字符串变量拆分为单个变量

转载 作者:行者123 更新时间:2023-12-04 02:19:40 24 4
gpt4 key购买 nike

我希望有人能帮我解决这个问题。我正在尝试获取一个字符串变量,其中包含一系列带分隔符的选择列表响应。单个变量中可以没有响应、一个响应(例如 1234)或多个响应(例如 1234;9876)。不同的选项总是用分号 (;) 分隔。我想根据分隔符将这个单个变量拆分为多个变量。

例如,reasons=1234;9876 -> reason1=1234, reason2=9876

传统上,我使用扫描功能以手动方式完成此操作。问题是我最多(在这种情况下)有 10 个选择列表项连接在一个字符串中。

data want;
set got;
length reason1-reason10 $10;
if reasons ne ' ' then reason1=scan(reasons, 1, ';');
if reasons ne ' ' then reason2=scan(reasons, 2, ';');
if reasons ne ' ' then reason3=scan(reasons, 3, ';');
...
run;

等等……

我觉得数组会大大简化这个过程。但是,我现在只是在学习如何使用数组。非常感谢任何有关如何使用更高效的代码拆分此字符串变量的建议。谢谢!

最佳答案

解决此问题的最佳方法因数据集的大小和复杂性而异——可能有多少个变量?

如果变量数量较少且已知,那么您的方法就可以了。数组会略有帮助:

data got;
informat reasons $30.;
input reasons $;
datalines4;
123;456;789;101112
456;789;101112;131415
;;;;
run;



data want;
set got;
length reason1-reason10 $10;
array reason(10) $;
do _i = 1 to dim(reason);
reason[_i] = scan(reasons,_i,';');
end;
run;

您甚至不必检查它是否丢失,SCAN 会表现良好。

如果您不确定变量的数量可能是多少(并且不希望从未达到“最大值”),PROC TRANSPOSE 更好。

首先为每个扫描值输出一行,全部放在一个变量中。然后转置它。

添加一个 id 变量使这更容易:

data got;
informat reasons $30.;
input id reasons $;
datalines4;
1 123;456;789;101112
2 456;789;101112;131415
;;;;
run;

data got_pret;
set got;
do _i = 1 to countw(reasons,';');
reason=scan(reasons,_i,';');
output;
end;
keep reason id;
run;

proc transpose data=got_pret out=want prefix=reason;
by id;
var reason;
run;

这有一个很大的优势,就是不需要提前知道有多少。不过,这是又一步,因此对于巨大数据集,它可能不太受欢迎(尽管您可以使用数据步骤 view 来保存其中的一部分)。

关于arrays - 将 SAS 中的定界字符串变量拆分为单个变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31565557/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com