gpt4 book ai didi

python - 在 Python 中检测非英文字符的字符串

转载 作者:IT老高 更新时间:2023-10-28 22:20:10 31 4
gpt4 key购买 nike

我有一些混合了英文字母和非英文字母的字符串。例如:

w='_1991_اف_جي2'

如何使用 Regex 或 Python 中的任何其他快速方法识别这些类型的字符串?

我不希望将字符串中的字母与字母列表逐个进行比较,而是一次性快速完成。

最佳答案

您可以检查字符串是否只能使用 ASCII 字符(拉丁字母 + 一些其他字符)进行编码。如果它不能被编码,那么它有来自其他字母表的字符。

注意注释# -*- coding: ....。它应该在 python 文件的顶部(否则你会收到一些关于编码的错误)

# -*- coding: utf-8 -*-
def isEnglish(s):
try:
s.encode(encoding='utf-8').decode('ascii')
except UnicodeDecodeError:
return False
else:
return True

assert not isEnglish('slabiky, ale liší se podle významu')
assert isEnglish('English')
assert not isEnglish('ގެ ފުރަތަމަ ދެ އަކުރު ކަ')
assert not isEnglish('how about this one : 通 asfަ')
assert isEnglish('?fd4))45s&')

关于python - 在 Python 中检测非英文字符的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27084617/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com