gpt4 book ai didi

python - 我如何去一个随机的网站? - Python

转载 作者:太空宇宙 更新时间:2023-11-03 12:48:36 25 4
gpt4 key购买 nike

如何生成一个随机但有效的网站链接,而不考虑语言。实际上,它生成的网站语言越多样化越好。

我一直通过在他们的网页上使用其他人的脚本来做到这一点,我怎么能不依赖这些随机的网站转发脚本而自己制作呢?。我一直这样做:

import webbrowser
from random import choice
random_page_generator = ['http://www.randomwebsite.com/cgi-bin/random.pl',
'http://www.uroulette.com/visit']
webbrowser.open(choice(random_page_generator), new=2)

最佳答案

I've been doing it by using other people's script on their webpage, how can i not rely on these random site forwarding script and make my own?

有两种方法:

  • 创建您自己的 spider收集了大量网站,然后从该集合中进行选择。
  • 访问一些预先存在的网站集合,然后从该集合中进行选择。例如,DMOZ/ODP 让您可以 download their entire database ;* Google 曾经有一个自定义的随机站点 URL;** 等等。

没有其他解决方法(除了随机生成和测试任意字符的有效字符串,这是一个可笑的坏主意)。

为自己构建网络蜘蛛可能是一个有趣的项目。链接驱动的抓取库,如 Scrapy可以为您做很多繁重的工作,让您写下您关心的部分。


* 请注意,与 Google 或 Yahoo 之类的数据库相比,ODP 是一个非常小的数据库,因为它主要是重要网站的人工编辑集合,而不是任何人放在网络上的所有内容的自动生成集合。

** Google 的随机站点功能是由受欢迎程度和您自己的搜索历史驱动的。然而,通过给它一个空的搜索历史,你可以删除等式的那一部分。不管怎样,我认为它不存在了。

关于python - 我如何去一个随机的网站? - Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20619746/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com