gpt4 book ai didi

sql - 混淆/屏蔽/打乱个人信息

转载 作者:行者123 更新时间:2023-12-02 10:26:44 29 4
gpt4 key购买 nike

我正在寻找一种自行开发的方法来扰乱生产数据以用于开发和测试。我已经构建了几个脚本来生成随机社会安全号码、轮类出生日期、打乱电子邮件等。但我在尝试打乱客户姓名时遇到了困难。我想保留真实姓名,这样我们仍然可以使用或搜索,这样随机字母生成就不再存在。到目前为止,我所尝试的是构建表中所有姓氏的临时表,然后使用临时表中的随机选择更新客户表。像这样:

DECLARE @Names TABLE (Id int IDENTITY(1,1),[Name] varchar(100))

/* Scramble the last names (randomly pick another last name) */
INSERT @Names SELECT LastName FROM Customer ORDER BY NEWID();
WITH [Customer ORDERED BY ROWID] AS
(SELECT ROW_NUMBER() OVER (ORDER BY NEWID()) AS ROWID, LastName FROM Customer)
UPDATE [Customer ORDERED BY ROWID] SET LastName=(SELECT [Name] FROM @Names WHERE ROWID=Id)

这在测试中效果很好,但在处理大量数据时完全陷入困境(> 40K 行需要 20 分钟)

所有这些都想问,如何在保留真实姓名和生产数据权重的同时打乱客户姓名?

更新:永远不会失败,您尝试将所有信息放入帖子中,但您忘记了一些重要的信息。这些数据还将用于我们公开的销售和演示环境。一些答案是我试图做的,“切换”名称,但我的问题是字面上的,如何在 T-SQL 中编码?

最佳答案

我使用generatedata 。它是一个开源的 php 脚本,可以生成各种虚拟数据。

关于sql - 混淆/屏蔽/打乱个人信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/168886/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com