- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
在我的 Web 应用程序中,我有一个部分需要持续抓取 Web、处理这些数据并将其呈现给用户。所以我想知道将它分成两个单独的应用程序是否是一种好方法,其中一个应用程序将执行爬网、数据处理并将数据存储在数据库中。另一个应用程序将是一个 Web 应用程序(安装在某些 Web 服务器上),它将向用户呈现数据库中的数据并允许他与数据进行某种交互。
我认为我需要这种拆分的原因是,如果我对我的 Web 应用程序进行某些更改(例如添加新功能、更改界面等),我不希望抓取被打断。
我的应用程序堆栈是 Tapestry(Web 层)、Spring、Hibernate(基于 MySQL)和我自己独立于其他爬虫的实现。
只使用同一个数据库来集成好不好?这可能会导致同时从两个应用程序访问数据库时出现问题。或者可以在 Hibernate 级别上完成集成,以便两个应用程序可以使用相同的 Hibernate session 吗?但是一个 JVM 实例中的应用程序可以访问另一个 JVM 实例中的对象吗?
如果您对此事有任何建议,我将不胜感激。
更新
用户(从网络应用程序的界面)将输入 URL 供爬虫程序解析。爬虫应用程序只会读取带有网络应用程序填充的 URL 的表格。反之亦然,爬虫处理的数据只会呈现在用户界面上。所以,我认为我不应该担心任何类型的锁定,对吧?
谢谢,尼古拉
最佳答案
我肯定会像您计划的那样将它们分开。与请求驱动的 Web 应用程序相比,Web 抓取更像是一个“批处理”过程。 Web 抓取应用程序将在其自己的 JVM 中运行,而您的 Web 应用程序将在 servlet/Java EE 容器中运行。
爬虫多久运行一次或者它是一个持续运行的过程?您可能需要根据您的要求考虑频率。
来自网络应用程序的用户是否会更新爬虫将向其发布数据的相同表格?在这种情况下,您需要采取预防措施,否则可能会出现潜在的死锁。如果您希望您的网络应用程序根据表中的新插入自动刷新数据,那么您可以创建一个消息驱动的 bean(使用 JMS )以从爬虫应用程序异步通知网络应用程序。当新的数据插入消息到达时,您可以在页面上提交表单或使用 ajax 更新页面本身的数据。
Web 应用程序应该使用连接池,批处理应用程序可以使用 DBCP或 C3P0 .我不确定在这种情况下尝试共享数据库 session 对您有多大好处。
通过这种方式,您可以在两个应用程序之间进行集成,同时不会因等待对方处理而减慢彼此的速度。
喂!
关于java - 两个不同的 Java 应用程序共享同一个数据库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5688997/
我正在编写一个具有以下签名的 Java 方法。 void Logger(Method method, Object[] args); 如果一个方法(例如 ABC() )调用此方法 Logger,它应该
我是 Java 新手。 我的问题是我的 Java 程序找不到我试图用作的图像文件一个 JButton。 (目前这段代码什么也没做,因为我只是得到了想要的外观第一的)。这是我的主课 代码: packag
好的,今天我在接受采访,我已经编写 Java 代码多年了。采访中说“Java 垃圾收集是一个棘手的问题,我有几个 friend 一直在努力弄清楚。你在这方面做得怎么样?”。她是想骗我吗?还是我的一生都
我的 friend 给了我一个谜语让我解开。它是这样的: There are 100 people. Each one of them, in his turn, does the following
如果我将使用 Java 5 代码的应用程序编译成字节码,生成的 .class 文件是否能够在 Java 1.4 下运行? 如果后者可以工作并且我正在尝试在我的 Java 1.4 应用程序中使用 Jav
有关于why Java doesn't support unsigned types的问题以及一些关于处理无符号类型的问题。我做了一些搜索,似乎 Scala 也不支持无符号数据类型。限制是Java和S
我只是想知道在一个 java 版本中生成的字节码是否可以在其他 java 版本上运行 最佳答案 通常,字节码无需修改即可在 较新 版本的 Java 上运行。它不会在旧版本上运行,除非您使用特殊参数 (
我有一个关于在命令提示符下执行 java 程序的基本问题。 在某些机器上我们需要指定 -cp 。 (类路径)同时执行java程序 (test为java文件名与.class文件存在于同一目录下) jav
我已经阅读 StackOverflow 有一段时间了,现在我才鼓起勇气提出问题。我今年 20 岁,目前在我的家乡(罗马尼亚克卢日-纳波卡)就读 IT 大学。足以介绍:D。 基本上,我有一家提供簿记应用
我有 public JSONObject parseXML(String xml) { JSONObject jsonObject = XML.toJSONObject(xml); r
我已经在 Java 中实现了带有动态类型的简单解释语言。不幸的是我遇到了以下问题。测试时如下代码: def main() { def ks = Map[[1, 2]].keySet()
一直提示输入 1 到 10 的数字 - 结果应将 st、rd、th 和 nd 添加到数字中。编写一个程序,提示用户输入 1 到 10 之间的任意整数,然后以序数形式显示该整数并附加后缀。 public
我有这个 DownloadFile.java 并按预期下载该文件: import java.io.*; import java.net.URL; public class DownloadFile {
我想在 GUI 上添加延迟。我放置了 2 个 for 循环,然后重新绘制了一个标签,但这 2 个 for 循环一个接一个地执行,并且标签被重新绘制到最后一个。 我能做什么? for(int i=0;
我正在对对象 Student 的列表项进行一些测试,但是我更喜欢在 java 类对象中创建硬编码列表,然后从那里提取数据,而不是连接到数据库并在结果集中选择记录。然而,自从我这样做以来已经很长时间了,
我知道对象创建分为三个部分: 声明 实例化 初始化 classA{} classB extends classA{} classA obj = new classB(1,1); 实例化 它必须使用
我有兴趣使用 GPRS 构建车辆跟踪系统。但是,我有一些问题要问以前做过此操作的人: GPRS 是最好的技术吗?人们意识到任何问题吗? 我计划使用 Java/Java EE - 有更好的技术吗? 如果
我可以通过递归方法反转数组,例如:数组={1,2,3,4,5} 数组结果={5,4,3,2,1}但我的结果是相同的数组,我不知道为什么,请帮助我。 public class Recursion { p
有这样的标准方式吗? 包括 Java源代码-测试代码- Ant 或 Maven联合单元持续集成(可能是巡航控制)ClearCase 版本控制工具部署到应用服务器 最后我希望有一个自动构建和集成环境。
我什至不知道这是否可能,我非常怀疑它是否可能,但如果可以,您能告诉我怎么做吗?我只是想知道如何从打印机打印一些文本。 有什么想法吗? 最佳答案 这里有更简单的事情。 import javax.swin
我是一名优秀的程序员,十分优秀!