gpt4 book ai didi

python - 如何在 Python 中使用正则表达式搜索奇怪的非 ASCII 字符?

转载 作者:太空宇宙 更新时间:2023-11-03 23:50:16 25 4
gpt4 key购买 nike

我主要使用以下正则表达式来搜索和删除这些字符。

invalid_unicode = re.compile(ur'(Û|²|°|±|É|¹|Í)')

我的源代码在ASCII编码,每当我尝试运行脚本时,它都会吐出:

SyntaxError: Non-ASCII character '\xdb' in file ./release.py on line 273, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

如果我按照给定网站上的说明进行操作,并将 utf-8 放在第二行编码中,我的脚本将不会运行。相反,它给了我这个错误:

SyntaxError: (unicode error) 'utf8' codec can't decode byte 0xdb in position 0: unexpected end of data

如何让这个正则表达式在 ASCII 编写的脚本中运行会很棒。

最佳答案

您需要找出您的编辑器使用的编码,并根据 PEP263 进行设置;或者,使事情更稳定和可移植(尽管可能不太可读)并在字符串文字中使用转义序列,即使用 u'(\xdb|\xb2|\xb0|\xb1|\xc9|\xb9|\xcd)' 作为 re.compile 调用的参数。

关于python - 如何在 Python 中使用正则表达式搜索奇怪的非 ASCII 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2039650/

25 4 0
文章推荐: python - Project Euler #101 - 如何解决 numpy 多项式溢出问题?
文章推荐: css -
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com