gpt4 book ai didi

python - 如何在希伯来语中搜索正则表达式 (Python 2.7)

转载 作者:行者123 更新时间:2023-11-28 21:48:52 25 4
gpt4 key购买 nike

我想在希伯来语中找到带有 re 的东西:

page = urlopen(url)
page_content = page.read()
founds = re.findall("מילים בעברית", page_content)

错误是:语法错误:第 12 行文件 C:/Users/User/untitled/milimBeIvrit.py 中的非 ASCII 字符 '\xec',但未声明编码;见http://python.org/dev/peps/pep-0263/详情

最佳答案

是的,re 可以处理utf-8 字符串。

您可以根据需要更改默认编码(但不是必须)

>>> import sys
>>> import re
>>> sys.getdefaultencoding()
'ascii'

我的默认编码是 ascii 并且以下仍然有效:

>>> a='אבא בא'
>>> results = re.findall("א", a)
>>> results
['\xd7\x90', '\xd7\x90', '\xd7\x90']

为了以人类可读的格式打印,使用print:

>>> for r in results:
... print r

א
א
א

请注意 idle utf8 处理有一些问题,因此可以考虑使用 IDE,例如 PyCharm .

关于python - 如何在希伯来语中搜索正则表达式 (Python 2.7),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34559143/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com