gpt4 book ai didi

performance - 可以使用什么 scala 或 java 库以最有效的方式每天从 1000 个域中抓取 +10M 页面

转载 作者:行者123 更新时间:2023-12-02 04:49:53 25 4
gpt4 key购买 nike

<分区>

我正在制作网络爬虫。我已经尝试过像 scala 教程中的异步 http 客户端一样 scaling-out-with-scala-and-akkaspray但我无法让它发挥作用。现在性能对我来说不是最重要的部分,但稍后我想在不更改库的情况下轻松提高请求/秒比率。

库应该能够在 http header 上运行,并且在 dns 解析方面不应该有性能问题。哪个库最适合这项任务?

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com