gpt4 book ai didi

google-bigquery - 用于删除字符串中的重音符号/变音符号的 BigQuery UDF

转载 作者:行者123 更新时间:2023-12-05 03:36:18 29 4
gpt4 key购买 nike

使用此 javascript 代码,我们可以删除字符串中的重音符号/变音符号。

var originalText = "éàçèñ"
var result = originalText.normalize('NFD').replace(/[\u0300-\u036f]/g, "")
console.log(result) // eacen

如果我们创建一个 BigQuery UDF,它不会(即使使用双\)。

 CREATE OR REPLACE FUNCTION project.remove_accent(x STRING)
RETURNS STRING
LANGUAGE js AS """
return x.normalize("NFD").replace(/[\u0300-\u036f]/g, "");
""";

SELECT project.remove_accent("éàçèñ") --"éàçèñ"

有什么想法吗?

最佳答案

考虑以下方法

select originalText, 
regexp_replace(normalize(originalText, NFD), r"\pM", '') output

如果应用于您问题中的示例数据 - 输出为

enter image description here

如果你愿意,你可以很容易地用 SQL UDF 包装它

关于google-bigquery - 用于删除字符串中的重音符号/变音符号的 BigQuery UDF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69665187/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com