gpt4 book ai didi

java - 我应该为 Web Crawler 使用哪些 jBoss 和 EJB3 功能

转载 作者:行者123 更新时间:2023-12-02 08:25:21 29 4
gpt4 key购买 nike

大家新年快乐,现在我正在尝试开发自己的机器人(web crawler),它将通过互联网行走,用于搜索引擎。我正在考虑使用 jboss 调度程序服务来调度机器人和类似的东西来获取内容:

URL u = new URL("http://www.google.kz");
InputStream in = u.openStream();

我想问我应该使用哪些 EJB3 或 jBoss 功能来有效(以正确的方式)开发我的机器人?我是 EJB3 和 jBoss 的新手。

如果你有更好的想法,你可以在这里。我正在开发搜索引擎来练习我的 Java 技能,在学术问题上,我不会与 Google 竞争:)

  • jboss-5.1.0.GA
  • XP
  • EJB3
  • eclipse 太阳神

附注我还没有决定如何解析 html,我正在考虑这样的事情 Parse HTML 。你能推荐什么?

最佳答案

您根本不需要 EJB 或 JBoss。事实上,我几乎想不出它们对于网络爬虫的用途。只有当您使用 JPA 来存储爬网结果时,您才可以利用容器管理的事务以及 JPA 实体管理器的自动注入(inject)。除此之外 - 没有。

关于java - 我应该为 Web Crawler 使用哪些 jBoss 和 EJB3 功能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4636744/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com