gpt4 book ai didi

Java:检查 robots.txt 是否允许 URL

转载 作者:行者123 更新时间:2023-12-02 02:07:20 25 4
gpt4 key购买 nike

假设应用程序具有:

  • robots.txt 内容,
  • 感兴趣的网址以及
  • 浏览实体元数据(例如用户代理字符串等)

如何检查robots.txt是否允许特定URL?

最佳答案

crawler-commons是一个 Java API,它可以解析给定特定机器人名称的机器人文件并返回适用于该机器人的规则。这些规则有一个 isAllowed(String url) 方法,可以执行您想要的操作。

关于Java:检查 robots.txt 是否允许 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50582167/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com