gpt4 book ai didi

python - 无论如何要抓取重定向的链接?

转载 作者:行者123 更新时间:2023-11-28 21:07:31 25 4
gpt4 key购买 nike

无论如何,我可以让 python 单击一个链接,例如 bit.ly 链接,然后抓取生成的链接吗?当我抓取某个页面时,我唯一可以抓取的链接是重定向的链接,它重定向到的地方就是我需要的信息所在的位置。

最佳答案

重定向有3种类型

  • HTTP - 作为响应 header 中的信息(代码为 301302、3xx)
  • HTML - 作为标签 <meta>在 HTML 中(维基百科:Meta refresh)
  • JavaScript - 像 window.location = new_url 这样的代码

requests执行 HTTP重定向并将所有网址保留在 r.history

import requests

r = requests.get('http://' + 'bit.ly/english-4-it')

print(r.history)
print(r.url)

结果:

[<Response [301]>, <Response [301]>]
http://helion.pl/ksiazki/english-4-it-praktyczny-kurs-jezyka-angielskiego-dla-specjalistow-it-i-nie-tylko-beata-blaszczyk,anginf.htm

顺便说一句:所以不允许在文本中放置位链接,所以我使用了连接。

关于python - 无论如何要抓取重定向的链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41310219/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com