gpt4 book ai didi

java - nutch 爬虫相对 url 问题

转载 作者:行者123 更新时间:2023-11-29 06:19:13 25 4
gpt4 key购买 nike

有没有人遇到过标准 html 解析器插件处理相对 url 的方式的问题?有一个网站 - http://xxxx/asp/list_books.asp?id_f=11327并且在浏览 href 设置为的链接时'?id_r=442&id=41&order='浏览器自然会带你去 http://xxxx/asp/list_books.asp?id_r=442&id=41&order=

然而,简而言之,当从页面解析出链接时,链接最终是 http://xxxx/asp/?id_r=442&id=41&order=

当然是坏了。那么为什么 list_books.asp 不见了?

最佳答案

A bug已经为此记录。看一看。

关于java - nutch 爬虫相对 url 问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3820683/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com