gpt4 book ai didi

regex - 如何在 Azure Purview 中为数据分类创建列名称模式匹配?

转载 作者:行者123 更新时间:2023-12-02 06:59:45 26 4
gpt4 key购买 nike

如果列名称包含以下任何内容,我要做的只是将字段分类为“出生日期”:

  • 出生日期
  • 出生日期
  • 出生日期
  • YMD 出生

我不是一个巨大的正则表达式用户,但我通常可以通过一些谷歌来弄清楚。我已在自定义数据分类规则中尝试了以下所有操作:

出生日期|出生日期|出生日期|YMDBIRTH

/出生日期/|/出生日期/|/DOB/|/YMDBIRTH/

.*出生日期.*|.*出生日期.*|.*出生日期.*|.*YMDBIRTH.*

/.*出生日期.*|.*出生日期.*|.*出生日期.*|.*YMDBIRTH.*/i

这些似乎都不起作用...我开始认为这与我的扫描有关...是否存在某种滞后?

我什至只是在分类规则上使用了 YMDBIRTH,但在扫描完成后它仍然没有对列进行分类。

根据此 Microsoft 文档,我认为我在这里记录的第一个方法应该有效“DateofBirth|BirthDate|DOB|YMDBIRTH

https://learn.microsoft.com/en-us/azure/purview/create-a-custom-classification-and-classification-rule

根据文档,它说:

或者,如果数据通常位于他们知道名称的列中,例如 Employee_ID 或 EmployeeID,他们可以添加列模式正则表达式以使扫描更加准确。正则表达式示例为 Employee_ID|EmployeeID

所以使用这个,我认为应该有效: Classification Rule Screenshot

最佳答案

由于数据库中的命名约定,我们必须更具创意,因为列的名称如 fs_address 或 address1、FP_address2、address_line3。这就是我用来匹配地址相关字段的地址(如列名称)

/\w*地址\w*|\w*街道\w*|\w*城市\*w|\w*国家/地区\w*|\w*邮政\w*|\w* prov\w*/i

\w 匹配任何单词字符(相当于 [a-zA-Z0-9_])

* 与前一个标记匹配零次到无限次这允许模式将 PR_ADDRESS_line1 匹配到/\waddress\w

末尾的/i 使其不区分大小写

希望这有帮助

关于regex - 如何在 Azure Purview 中为数据分类创建列名称模式匹配?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65587726/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com