gpt4 book ai didi

mysql - 如何识别混入汉字的全英文单词?

转载 作者:行者123 更新时间:2023-11-30 23:37:44 24 4
gpt4 key购买 nike

我使用单词边界来匹配整个英文单词。如果我匹配的字符串是纯英文的,它就可以正常工作。

例如:SELECT 'a word a' REGEXP '[[:<:]]word[[:>:]]' -> 1

但是如果字符串包含任何中文文字,

例如:SELECT 'a word哈哈抓不到我吧 a' REGEXP '[[:<:]]word[[:>:]]' -> 0

如何让我的查询更智能,从而捕捉到隐藏在中文单词中的英文单词?

我在想REGEXP '[[:<:]]word[[:>:]] | [Chinese]word[[:>:]] | [[:<:]]word[Chinese] | [Chinese]word[Chinese]'但我不知道如何在 mysql 正则表达式中使用 Unicode 点...

最佳答案

您可以使用转义的“u”加上 unicode 十六进制(例如,\u0041 是“A”)对大多数语言中的 unicode 字符进行正则表达式。然后您可以匹配一个 unicode 范围。这是所有大写的基本拉丁字母,即 A-Z:

[\u0041-\u005A]

Good resource

也请务必仔细检查您的编码。

一个匹配'a word哈哈抓不到我吧a'的例子,包括空格:

.*[\u0041-\u0054 \u0061-\u007a \u0020].*

在 ascii 中,这将是:

.*[A-Za-z ].*

关于mysql - 如何识别混入汉字的全英文单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6141364/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com