gpt4 book ai didi

python - 通过Python从网站解析数据中以utf-8进行解码

转载 作者:行者123 更新时间:2023-12-01 02:56:46 24 4
gpt4 key购买 nike

我正在尝试解析来自网站的数据,但收到错误。这是我的 python 代码

import urllib.request
import re

url = "http://ihned.cz"

req = urllib.request.Request(url)
resp = urllib.request.urlopen(req)
respData = resp.read().decode('utf-8')
#print(respData) #html kód

authors = re.findall(r'data-author="(.*?)"', str(respData))

for author in authors:
print(authors)

这是错误。

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 368: invalid continuation byte

你能帮我一下吗?谢谢。

最佳答案

该网站的来源为charset="windows-1250"。尝试解码('windows-1250')

关于python - 通过Python从网站解析数据中以utf-8进行解码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44157162/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com