gpt4 book ai didi

javascript - 网络爬虫是否遵循 robots.txt 网址或标签

转载 作者:行者123 更新时间:2023-12-03 05:11:32 25 4
gpt4 key购买 nike

我有一个严重基于 javascript 的网站。具体来说,没有 <a>标签。当点击某些按钮时,内容会动态插入到 DOM 树中,然后使用 javascript 更改 URL 来表示更新。

所以,我的问题是,我的 robots.txt 中是否有链接列表,允许的网络爬虫(Google、Bing等)会直接访问robots.txt中的链接吗? ,或者他们会遵循 a下载网站中显示的链接,并在 robots.txt 中允许?

因为在第二种情况下,网络爬虫不会在下载的/中找到任何出现的URL。网站和 robots.txt文件。

最佳答案

您可以使用 Sitemaps为爬虫提供 URL 列表。正如@Barmar 提到的,robots.txt 的目的略有不同。

关于javascript - 网络爬虫是否遵循 robots.txt 网址或标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41798295/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com