gpt4 book ai didi

python - 如何跳过 url 中的 Unicode 错误

转载 作者:行者123 更新时间:2023-11-30 23:25:23 33 4
gpt4 key购买 nike

我正在尝试找出如何处理 Python 中的 Unicode 错误并跳过它们。我想我必须使用结构 try,除了 UnicodeError,但我不知道在 UnicodeError 条件中放置什么来跳过该 URL 并继续抓取。这是我的代码:

  File "imagescraper.py", line 24, in <module>
urllib.urlretrieve(image, "image0"+str(page)+str(i)+".jpg")
File "/usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib.py", line 94, in urlretrieve
return _urlopener.retrieve(url, filename, reporthook, data)
File "/usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib.py", line 228, in retrieve
url = unwrap(toBytes(url))
File "/usr/local/Cellar/python/2.7.6/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib.py", line 1055, in toBytes
" contains non-ASCII characters")
UnicodeError: URL u'http://blogging.com/wp-content/uploads/2013/11/design-p\xe1gina-de-fans.png' contains non-ASCII characters

有什么想法吗?

最佳答案

这样的事情似乎就是您想要的:

except UnicodeError:
pass

pass基本上只是一个占位符,它什么也不做。异常由 except block 处理,然后 pass 将允许您转到下一个 URL。

请注意,如果您在循环内执行此操作,请使用 continue相反,它会立即进入循环的下一个循环。

关于python - 如何跳过 url 中的 Unicode 错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23019490/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com