arrays - 将 SAS 中的定界字符串变量拆分为单个变量-6ren

arrays - 将 SAS 中的定界字符串变量拆分为单个变量

转载作者：行者123 更新时间：2023-12-04 02:19:40

24

4

我希望有人能帮我解决这个问题。我正在尝试获取一个字符串变量，其中包含一系列带分隔符的选择列表响应。单个变量中可以没有响应、一个响应(例如 1234)或多个响应(例如 1234；9876)。不同的选项总是用分号 (;) 分隔。我想根据分隔符将这个单个变量拆分为多个变量。

例如，reasons=1234;9876 -> reason1=1234, reason2=9876

传统上，我使用扫描功能以手动方式完成此操作。问题是我最多(在这种情况下)有 10 个选择列表项连接在一个字符串中。

data want;
set got;
   length reason1-reason10 $10;
     if reasons ne ' ' then reason1=scan(reasons, 1, ';');
     if reasons ne ' ' then reason2=scan(reasons, 2, ';');
     if reasons ne ' ' then reason3=scan(reasons, 3, ';');
 ...
 run;

等等……

我觉得数组会大大简化这个过程。但是，我现在只是在学习如何使用数组。非常感谢任何有关如何使用更高效的代码拆分此字符串变量的建议。谢谢!

最佳答案

解决此问题的最佳方法因数据集的大小和复杂性而异——可能有多少个变量？

如果变量数量较少且已知，那么您的方法就可以了。数组会略有帮助:

data got;
  informat reasons $30.;
  input reasons $;
  datalines4;
123;456;789;101112
456;789;101112;131415
;;;;
run;



data want;
  set got;
  length reason1-reason10 $10;
  array reason(10) $;
  do _i = 1 to dim(reason);
    reason[_i] = scan(reasons,_i,';');
  end;
run;

您甚至不必检查它是否丢失，SCAN 会表现良好。

如果您不确定变量的数量可能是多少(并且不希望从未达到“最大值”)，PROC TRANSPOSE 更好。

首先为每个扫描值输出一行，全部放在一个变量中。然后转置它。

添加一个 id 变量使这更容易:

data got;
  informat reasons $30.;
  input id reasons $;
  datalines4;
1 123;456;789;101112
2 456;789;101112;131415
;;;;
run;

data got_pret;
  set got;
  do _i = 1 to countw(reasons,';');
    reason=scan(reasons,_i,';');
    output;
  end;
  keep reason id;
run;

proc transpose data=got_pret out=want prefix=reason;
  by id;
  var reason;
run;

这有一个很大的优势，就是不需要提前知道有多少。不过，这是又一步，因此对于巨大数据集，它可能不太受欢迎(尽管您可以使用数据步骤 view 来保存其中的一部分)。

关于arrays - 将 SAS 中的定界字符串变量拆分为单个变量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31565557/

24

4

0

文章推荐： wpf - TreeView.IsSelected 触发器无法正常工作

文章推荐： bash - 如何从 bash 替换 war 文件的 list ？

文章推荐： R - 根据模式重新排列数据

文章推荐： floating-point - SSE/AVX 浮点转换异常

java - Arraylist 分为 -
我有一个数组列表: ArrayList allText = new ArrayList(); 其内容是这样的: [Alabama - Montgomery, Alaska - Juneau, Ariz
php - 开始和结束时间，分为 1 小时段
我有一个 timestamp 格式的开始和结束时间。我想将它们分成多个时间段，例如 1 小时。 $t1 = strtotime('2010-05-06 12:00:00'); $t2 = strtot
css - span10 分为 3 列
我需要将 span10 分成 3 列，但我无法将它们排列起来。我应该在 span10 中添加一个 span12 还是使用 offset 还是？？
Pandas - 分为 24 小时区 block ，但不是午夜到午夜
我有一个时间序列。我想从早上 8 点到第二天早上 7:59 分成 24 小时的区 block 。我知道如何按日期分组，但我尝试过使用 TimeGroupers 和 DateOffsets 处理这个 8
java - Android Java 分为 4 个整数
我收到“街道号码邮政编码城市”形式的地址(作为字符串)。我想要做的是将街道和号码与邮政编码和城市分开。通常你可以按空格分割。但有些街道名称中也有空格，例如:“Emile Van Ermengemlaa
java - 将 JList 分为 2 组的优化方法
我有一个用户列表。其中一些用户处于第一状态，而其他用户处于第二状态。所以我想要的是将这个列表显示为首先，它按排序顺序显示存在 = 1 的用户，然后按排序顺序显示存在 = 2 的用户。这里的排序是根据用
javascript - 将 div 分为 3 列
我感觉我搜索了整个网络，但找不到一种方法将不同高度的 div 很好地划分为 3 列，就像 http://www.ing.nl 上那样 headertekst headerteksttesth
css - td 内的 Bootstrap 按钮下拉菜单，分为 2 行
Bootstrap 3 按钮下拉菜单出现问题。你可以在这里看到我的两个例子: http://www.bootply.com/W1dLusilMk http://www.bootply.com/GGBv
javascript - 返回的 php JSON 分为 2 个 Javascript 对象
我在 php 中执行以下操作 foreach($QuestionAsekd as $k => $v){ $grp_name = $v['NAME']; $groupValues[$gr
python - Pandas DataFrame [cell=(label,value)]，分为 2 个独立的数据框
我找到了一种用pandas解析html的绝妙方法。我的数据格式有点奇怪(见下文)。我想将这些数据拆分为 2 个单独的数据帧。注意每个单元格如何由，分隔...是否有任何真正有效的方法来分割所有这些单元
html - CSS
分为 2 列。没有

首页

博学

6Ren·AI

商城

arrays - 将 SAS 中的定界字符串变量拆分为单个变量