gpt4 book ai didi

regex - 如何规范/关联Google表格中的Unicode字符?

转载 作者:行者123 更新时间:2023-12-04 14:10:34 25 4
gpt4 key购买 nike

我正在尝试为Google表格编写一个公式,该公式会将带有变音符号的Unicode字符转换为普通的ASCII字符。

我在其“REGEXREPLACE”函数中看到了Google uses RE2。我看到了RE2 offers Unicode character classes

我试图写一个公式(类似于this one):

REGEXREPLACE("público","(\pL)\pM*","$1")

但是Sheets会产生以下错误:

Function REGEXREPLACE parameter 2 value "\pL" is not a valid regular expression.



我想我可以写一个由一整套嵌套的SUBSTITUTE函数( Like this one)组成的公式,但这似乎很糟糕。

有谁能提出更好的方法来规范Google表格公式中带有变音符/重音符号的Unicode字母的建议?

最佳答案

[[:^alpha:]](否定的ASCII字符类)适用于REGEXEXTRACT公式。

但是=REGEXREPLACE("público","([[:alpha:]])[[:^alpha:]]","$1")结果为“pblic”。因此,我想公式不知道确切的ASCII字符必须替换“ú”。

解决方法

让我们用públicē这个词;我们需要替换其中的两个符号。将此单词放在单元格A1中,并将此公式放在单元格B1中:

=JOIN("",ArrayFormula(IFERROR(VLOOKUP(SPLIT(REGEXREPLACE(A1,"(.)","$1-"),"-"),D:E,2,0),SPLIT(REGEXREPLACE(A1,"(.)","$1-"),"-"))))

然后在D:E范围内创建替换目录:
    D    E  
1 ú u
2 ē e
3 ... ...

这个公式仍然很丑陋,但是更有用,因为您可以通过向表中添加更多字符来控制目录。

或使用Java脚本

也是 found a good solution,它可以在Google表格中使用。

关于regex - 如何规范/关联Google表格中的Unicode字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35640493/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com