encryption - SAS : Scrambling Sensitive observations at character level 中的数据屏蔽-6ren

encryption - SAS : Scrambling Sensitive observations at character level 中的数据屏蔽

转载作者：行者123 更新时间：2023-12-04 04:57:32

我正在使用 SAS 中的客户数据处理敏感的客户身份信息。挑战在于以保留数字/字母/字母数字的方式屏蔽该字段。我找到了一种在 SAS(BXOR、BOR、BAND)中使用按位函数的方法，但输出中充满了 SAS 无法处理/排序/合并等的特殊字符。

我也想过根据 key 对字段本身进行加扰，但一直没能看透。以下是挑战:

1)它必须是基于 key 的
2) 必须是可逆的。
3) 掩码/加扰字段只能是数字/字母/字母数字，以便可以在 SAS 中使用。
4) 要屏蔽的字段既有字母也有数字，但长度各不相同，并且有数百万次观察。

关于如何实现这种掩蔽/加扰的任何提示都将不胜感激:(

最佳答案

这是一个简单的基于 key 的解决方案。我在这里介绍数据步骤的解决方案，然后会稍微介绍一个 FCMP 版本。我将所有内容都保留在 48 到 127 的范围内(数字、字母和常见字符，例如 @ > < 等)；这不是完全字母数字，但我无法想象为什么在这种情况下会很重要。您可以使用相同的方法将其进一步减少为真正的字母数字，但它会使 key 变得更糟(只有 62 个值)并且使用起来很笨拙(因为您有 3 个不连续的范围)。

data construct_key;
length keystr $1500;
do _t = 1 to 1500;
  _rannum = ceil(ranuni(7)*80);
  *if _rannum=12 then _rannum=-15;
  substr(keystr,_t,1)=byte(47+_rannum);

end;
call symput('keystr',keystr);
run;
%put %bquote(&keystr);



data encrypted;
set sashelp.class;
retain key "&keystr";
length name_encrypt $30;
do _t = 1 to length(name);
  substr(name_encrypt,_t,1) = byte(mod(rank(substr(name,_t,1)) + rank(substr(key,1,1))-94,80)+47);
  key = substr(key,2);
end;
keep name:;
run;

data unencrypted;
set encrypted;
retain key "&keystr";
length name_unenc $30;
do _t = 1 to length(name_encrypt);
  substr(name_unenc,_t,1) = byte(
      mod(80+rank(substr(name_encrypt,_t,1)) - rank(substr(key,1,1)),80)
+47);
  key = substr(key,2);
end;
run;

在这个解决方案中，有一个中等级别的加密——一个有 80 个可能值的 key 不足以阻止真正老练的黑客，但对于大多数目的来说已经足够了。您需要将 key 本身或种子传递给 key 算法才能解密；如果您多次使用它，请确保每次都选择一个新种子(而不是与数据相关的东西)。如果您使用零(或非正整数)作为种子，您每次都将有效地保证一个新 key ，但是您必须传递 key 本身而不是种子，这可能会带来一些数据安全问题(显然， key 本身可以是由恶意用户获取，并且必须存储在与数据不同的位置)。通过种子传递 key 可能更好，因为您可以通过电话或通过某种预先安排的种子列表口头传递它。

我不确定我是否一般推荐这种方法；更好的方法很可能是使用高级加密方法(例如 PGP)简单地加密整个 SAS 数据集。您的确切解决方案可能会有所不同，但例如，如果您有一些对于流程的大多数步骤实际上并不需要的客户信息，则最好将该信息与其余(非敏感)数据分开，并且仅合并在需要的时候。

例如，我有一个流程，我可以为客户提取样本以进行医疗保健调查。我从除了数字唯一标识符外没有客户信息的数据集中选择有效记录；将样本范围缩小到有效记录后，我会附加来自单独数据集的客户信息并创建邮件文件(存储在加密目录中)。这样可以尽可能长时间地保持数据不敏感。它并不完美 - 唯一的数字标识符仍然意味着有联系，即使它与项目之外的任何人都不知道 - 但它在我们结束时尽可能长时间地保持安全。

这是 FCMP 版本:

%let keylength=5;
%let seed=15;

proc fcmp outlib=work.funcs.test;
subroutine encrypt(value $,key $);
  length key $&keylength.;
  outargs value,key;
  do _t = 1 to lengthc(value);
    substr(value,_t,1) = byte(mod(rank(substr(value,_t,1)) + rank(substr(key,1,1))-62,96)+31);
    key = substr(key,2)||substr(key,1,1);
  end;
endsub;

subroutine unencrypt(value $,key $);
  length key $&keylength.;
  outargs value,key;
  do _t = 1 to lengthc(value);
    substr(value,_t,1) = byte(mod(96+rank(substr(value,_t,1)) - rank(substr(key,1,1)),96)+31);
    key = substr(key,2)||substr(key,1,1);
  end;
endsub;

subroutine gen_key(seed,keystr $);
  outargs keystr;
  length keystr $&keylength.;
  do _t = 1 to &keylength.;
    _rannum = ceil(ranuni(seed)*80);    
    substr(keystr,_t,1)=byte(47+_rannum);
  end;
endsub;
quit;

options cmplib=work.funcs;



data encrypted;
set sashelp.class;
length key $&keylength.;
retain key ' '; *the missing is to avoid the uninitialized variable warning;
if _n_ = 1 then call gen_key(&seed,key);
call encrypt(name,key);
drop key;
run;

data unencrypted;
set encrypted;
length key $&keylength.;
retain key ' ';
if _n_ = 1 then call gen_key(&seed,key);
call unencrypt(name,key);
run;

这更健壮一些；它允许 32 到 127 个字符而不是 48 个字符，这意味着它成功处理了空格。 (Tab 仍然无法正确解码 - 它会变成一个 'k'。)您将种子传递给调用 gen_key，然后它在该过程的其余部分使用该 key 。

毋庸置疑，这不能保证满足您的目的和/或成为一个安全的解决方案，如果您有大量的安全需求，您应该咨询安全专家。这篇文章不为任何目的提供担保，海报不承担因使用而产生的任何和所有责任。

关于encryption - SAS : Scrambling Sensitive observations at character level 中的数据屏蔽，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16582519/

文章推荐：来自另一个表的 Laravel 计数

文章推荐： .htaccess - 在 htaccess 中重定向俄语 URL 不起作用

文章推荐： php - woeid 使用 tmhoauth 获取 twitter 趋势

grid - extjs 网格分组 : selection scrambled
我目前有一个具有分组功能的网格，可以从固定存储中获取数据: Ext.define('YUK.store.FakePendingDocs', { extend: 'Ext.data.Store'
grid - extjs 网格分组 : selection scrambled
我目前有一个具有分组功能的网格，可以从固定存储中获取数据: Ext.define('YUK.store.FakePendingDocs', { extend: 'Ext.data.Store'
java - Word Scramble 游戏不会将用户猜测与原始单词进行比较，Java
大家好，我的程序无法将用户的猜测与从文件中读取的原始单词进行比较。我知道这有很多问题，目前还不太漂亮，但任何帮助将不胜感激。基本上，类 userGuess 应该从文件“Words.txt”中读取一个随
c++ - Rubik's Cube Scramble 生成器算法
我最近一直在从事一个项目，其中包括 Rubik's Cube scramble 生成器。基本上，该程序应该生成并显示随机的立方体符号，以便用户可以跟随每一步移动并获得一个相当困惑的立方体。符号包括“R
javascript - 为什么我的 JavaScript 对于这个 Scramblies 任务来说太慢了？
我正在尝试解决以下任务: Complete the function scramble(str1, str2) that returns true if a portion of str1 chara
javascript - 如何在 Javascript 中创建 Scramble 函数
我正在尝试使用 javascript 创建一个简单的 slider 游戏。这是一个简单的 4 x 4 数字 slider 游戏，每个按钮都标记为 1-15，最后一个 block 是空白 block 。
sql-server - SQL Server 2008 : Obfuscation or scrambling
是否可以在 SQLServer 2008 R2 中混淆或打乱列，而不必使用加密或一些执行子字符串的低效定制函数？最佳答案为什么不在您的应用程序中使用加密/散列/编码并将结果发布到 SQL 中？这是
css - "Scrambled"webkit 滚动条(试图重现 Google+ 的滚动条)
我正在尝试在我的网站上重现 google+ 的滚动条。由于我有时无法弄清楚的原因，此滚动条的外观困惑。乱码是指滚动条是多色的，有一条黑线横跨它，并且 scrollbar-thumb 不可见。这是向您展
encryption - SAS : Scrambling Sensitive observations at character level 中的数据屏蔽
我正在使用 SAS 中的客户数据处理敏感的客户身份信息。挑战在于以保留数字/字母/字母数字的方式屏蔽该字段。我找到了一种在 SAS(BXOR、BOR、BAND)中使用按位函数的方法，但输出中充满了 S
angularjs - Angular 翻译 : translating a placeholder with UTF text gets scrambled
翻译工作正常，直到我尝试翻译占位符: 然后我看到编码的文本: 代码示例: http://jsfiddle.net/eq4bq0mL/5/ 这与 sanitizer 有关吗？有什么解决办法吗？更新
android - 改造 : Loading xml feed from url returns scrambled response body
我在使用 Retrofit 从 url 加载 XML 提要时遇到问题。给定一个明确返回 xml 提要 f.e 的动态 url:https://anchor.fm/s/53faae8/podcast/

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

encryption - SAS : Scrambling Sensitive observations at character level 中的数据屏蔽