- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的问题的核心是——我可以使用 PROC SQL、PROC DATASETS 或其他命令直接修改一个数据集的元数据,基于另一个数据集中的数据吗?如果是,您能否告诉我更多关于使用什么代码或使用什么搜索词来尝试解决这个问题的信息?
这是背景和细节——我定期收到一个研究伙伴的研究结果数据导出(Excel),他们还给我提供了一个Excel格式的密码本。结果数据文件总是包含相同的字段,但它们的数据表需要大量清理。我需要开发一个过程,将结果数据转换为可用的 SAS 数据集,包括标记变量和将创建和应用用户定义格式的语法文件。我想尽可能高效地执行此操作。理想情况下,我希望 SAS 根据码本数据集中的变量名称 * 变量标签组合更改结果数据集中的元数据/变量属性(特别是标签)。正如我所见,这样做的一种方法是将两个 Excel 文件导入 SAS,然后使用连接函数以新字符变量的形式编写语法,然后在数据步骤中使用该新变量的文本在结果数据集上运行的语法。具体来说:
*Use concatenate function to create variable containing syntax text;
data codebook_edit;
set codebook;
format Syntax_Label $2000.;
Syntax_Label=cat("label ", trim(Field_Name), " = '", trim(Field_Label), "';");
run;
然后这会生成一个字符变量,其中包含如下所示的行:
label race = 'Race Ethnicity';
label sex = 'Sex assigned at birth';
label gender = 'Gender identity';
然后我会运行这个:
*Get syntax to label vars;
proc print data=codebook_edit noobs;
var Syntax_Label;
run;
*Apply labels;
data results_edit;
set results;
label race = 'Race Ethnicity';
label sex = 'Sex assigned at birth';
label gender = 'Gender identity';
run;
但是,我想知道是否有更好的方法来执行此操作,因为我有数百个变量并且不想创建这么长的语法文件。例如,我可以使用 PROC SQL 或 PROC DATASETS 或其他命令直接修改研究结果数据集中的元数据,基于代码簿中的数据,如果可以,您能提供一些提示吗?谢谢
最佳答案
使用元数据编写代码。因此,如果您的元数据数据集名为 CODEBOOK,并且有名为 FIELD_NAME 和 FIELD_LABEL 的变量,那么您可以像这样编写 LABEL 语句:
filename code temp;
data _null_;
set codebook end=eof;
file code;
if _n_=1 then put 'label';
put @3 field_name '=' field_label :$quote. ;
if eof then put ';' ;
end;
然后您可以使用 %INCLUDE 将该标签语句添加到您要运行它的位置。例如作为 PROC DATASETS 步骤的一部分。因此,如果您要添加标签的数据集在 MYLIB 库中称为 MYDATA,则运行此 PROC 步骤。
proc datasets lib=mylib nolist;
modify mydata ;
%include code / source2;
run;
quit;
您可以对您可能想要进行的其他更改使用类似的代码生成。
关于sas - 根据包含代码簿的单独数据集中的变量更改一个数据集中的 SAS 变量标签/属性 - PROC SQL?处理数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71164296/
在经历了DDOS攻击后,不知何故/proc/kcore非常巨大,我使用一个小的php类来检查当前的磁盘空间,以及已经使用了多少。 它显示以下内容: Total Disk Space: 39.2 GB
所以我从 ruby 移植了一个工具,可以在对象上定义回调 block ,我希望在设置回调的情况下调用它。所以基本上是这样的。 def set_block(&block) @new_kid_on
我定义了两个脚本:第一个脚本调用第二个脚本中的 proc。第二个脚本定义了一个命名空间 fooSpace , 定义了一个变量 fooValue内fooSpace , 并定义了一个过程 myProc内f
使用一个 proc 时,我的脚本工作正常(检索 sftp 提示)。但是当我尝试在 proc 中使用 proc 时,脚本卡住了,我不知道为什么。 请不要重构代码,这不是重点,我需要了解这里的问题。 工作
我想知道是否有一种方法可以识别某些proc文件中用于DMA映射的内存,例如mtrr和iomem,或者通过lspic -vv . 在我的/proc/mtrr中,只有一个无法缓存区域,它似乎几乎指向3.5
我有 2 个过程,它们一个接一个地调用。第一个过程使用 diff 功能并创建 file.txt。压缩文件后的过程。问题是当我运行脚本时,file.txt 是空的。当我注释掉压缩过程时,文件中打印了差异
我曾经认为 /proc/self 和 /proc/$$ 在 bash 终端中是一样的,但现在我发现它们是不同的。 我知道$$是当前进程的pid,/proc/self是当前运行的进程,应该是bash终端
在下面的程序中,我想在第 2 个过程中捕获数据包,而 ping 在第 1 个过程中运行。现在,如果我执行这个程序,proc 正在运行 ping 并退出它。有解决此问题的想法吗? 我的 TCL 代码:
在 proc 中,您可以获得 proc 名称(无需对其进行硬编码)吗?例如 proc my_proc { some_arg } { puts "entering proc [some way
我有一个自定义的 A10 存储库,我试图在其中创建一个能够读取 /proc/[pid]/some-file 的应用程序文件,例如stat和 status ,有点像 ps做。 看完这篇 answer很明
我是 TCL 的新人。我通过 Windows Vista 下的 DOS 窗口“tclsh85 FOD/Scripts/program1.tcl”执行 TCL 代码。 program1.tcl 包含“s
我想查看每个进程的精确内存量用作匿名页,因为匿名内存不能调出,因此精确跟踪此使用情况非常重要。 获取匿名页面总数的一种方法是读取/proc/meminfo AnonPages。 另一种方法是将 sma
在 Ruby 中,Proc.new { 'waffles' } 和 proc { 'waffles' } 之间有什么区别吗?我发现很少有人提到第二种语法。 使用 irb 进行测试,我没有发现任何明显的
我正在寻找有关Linux系统上/proc/net/nf_conntrack和/或/proc/net/ip_contrack文件内容的详细文档。 是的,我知道,有许多实用程序可以用人类可读的格式向我显示
而不是执行多个单独的 PROC FREQ一个非常大的数据集上的程序,我想通过执行单个 PROC FREQ 来提高效率与多个 TABLE声明。我们的 QA 流程需要表格标题,这很简单,只需一个 TABL
我想在 /proc/driver 下创建一个文件目录。我想使用像 proc_root_driver 这样的宏(或提供的其他东西)而不是明确使用“驱动程序/模块名称”。我用 create_proc_en
在 SQL Server 2005 中,我希望名为 LimitedUser 的用户只能运行一个过程: GRANT EXEC ON [usp_RunETL] TO [LimitedUser] 但是,该
考虑到以下两个过程: proc firstOne(): void = echo "X" proc secondOne(): void = echo "X" discard 它们
我想使用 PROC TABULATE 复制 PROC MEANS 的输出。原因是我希望将利润百分比(或利润率)作为 PROC MEANS 输出中的变量之一,但希望抑制一个或多个统计数据的计算,即会有一
我的目标是使数据适合具有正支持的任何分布。 (威 bool (2p)、 Gamma (2p)、帕累托 (2p)、对数正态 (2p)、指数 (1P))。第一次尝试,我使用了 proc univariat
我是一名优秀的程序员,十分优秀!