gpt4 book ai didi

python - urlparse.urljoin() 不处理无效的父目录

转载 作者:太空宇宙 更新时间:2023-11-03 12:09:11 27 4
gpt4 key购买 nike

在从相对目录构造绝对 URL 时,是否有一种方法可以解决“无效”父目录的问题,还是我应该只使用 .replace()

>>> from urlparse import urljoin
>>> url = urljoin('http://www.example.com/path/', '../../../index.html')
>>> url
'http://www.example.com/../../index.html'
>>> url.replace('../', '')
'http://www.example.com/index.html'

更好的是,在 Python 中抓取时是否有更清洁的方法来清理 url?

最佳答案

正如你所说,这没有意义。你可以从根目录往上走。因此,在不知道作者意图的情况下,很难规范第二部分。只有您知道如何正确 sanitizer 它。 :)

关于python - urlparse.urljoin() 不处理无效的父目录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13618875/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com