- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
简而言之的问题
使Python和Java相互配合的最佳方法是什么?
更详细的解释
我的情况有些复杂。我会尽力用图片和文字来解释。这是当前的系统架构:
我们有一个用Java编写的基于代理的建模仿真。它具有以下选项:在本地写入CSV文件,或通过将Java服务器连接到HDF5文件远程写入。每次模拟运行都会吐出1 GB的数据,而我们进行了数十次模拟。我们需要能够汇总同一场景的多个运行(具有不同的随机种子),以便查看一些趋势(例如,最小,最大,中位数,均值)。您可以想象,尝试在所有这些CSV文件中四处移动是一场噩梦。每次运行都会生成多个文件,就像我说的那样,其中一些文件非常庞大。这就是我们一直努力转向HDF5解决方案的原因,在该解决方案中,研究的所有数据都存储在一个位置,而不是分散在数十个纯文本文件中。此外,由于它是二进制文件格式,因此与未压缩的CSVS相比,它应该能够节省大量空间。
如图所示,我们对来自模拟的原始输出数据进行的当前后处理也发生在Java中,并读取本地输出生成的CSV文件。该后处理模块使用JFreeChart创建一些与模拟有关的图表。
问题
正如我之前提到的那样,由于我们从仿真中生成越来越多的数据,因此CSV确实是站不住脚的,并且伸缩性也不佳。此外,后处理代码的工作量超出了应做的工作,本质上执行了一个非常贫穷的人的关系数据库的工作(基于外键(唯一的代理ID)跨“表”(csv文件)进行联接) )。在该系统中,也很难以其他方式(例如Prefuse,Processing,JMonkeyEngine)将数据可视化,以使原始数据的某些子集在MatLab或SPSS中运行。
解决方案?
我的小组认为,我们确实需要一种过滤和查询所拥有数据以及执行跨表联接的方法。鉴于这是一次写入,多次读取的情况,我们确实不需要真正的关系数据库的开销;相反,我们只需要一些方法在HDF5文件上放置一个更好的前端即可。我发现了一些关于此的论文,例如描述如何使用XQuery as the query language on HDF5 files的论文,但该论文描述了必须编写一个编译器以将XQuery/XPath转换为本地HDF5调用,这超出了我们的需求。
输入PyTables。它似乎恰好满足了我们的需要(通过Python列表理解或in-kernel (C level) searches提供了两种不同的查询数据方式。
我设想的拟议架构是这样的:
我不确定如何将要查询的python代码与提供HDF5文件的Java代码以及进行数据后处理的Java代码链接在一起。显然,我将要重写许多隐式地执行查询的后处理代码,而是让出色的PyTables更优雅地完成此操作。
Java/Python选项
一个简单的Google搜索为communicating between Java and Python提供了一些选项,但是对于这个话题我还是很陌生,以至于我正在寻找一些对所提议的体系结构的实际专业知识和批评。似乎Python进程应该与Datahose在同一台计算机上运行,这样就不必通过网络传输大型.h5文件,而是将其较小得多的经过过滤的 View 传输给客户端。 Pyro似乎是一个有趣的选择-有人有经验吗?
最佳答案
这是一个史诗般的问题,有很多考虑因素。由于您没有提及任何特定的性能或体系结构限制,因此我将尽力提供最全面的建议。
使用PyTables作为其他元素和数据文件之间的中间层的初始计划似乎很可靠。但是,没有提到的一个设计约束是所有数据处理中最关键的约束之一:哪些数据处理任务可以批处理方式完成,哪些数据处理任务更像是实时流。
“我们确切地知道了我们的输入和输出并且可以进行处理”(批处理)和“我们知道我们的输入以及需要其他什么要求的东西”(实时)之间的区别使得所有架构问题都不同了。 。查看您的图,有几种关系暗示着不同的处理方式。
此外,在图上,您具有使用相同符号的不同类型的组件。这使得分析预期的性能和效率有些困难。
另一个重要的约束是您的IT基础架构。您有高速网络可用存储吗?如果这样做,中间文件将成为在基础结构的各个元素之间满足所有批处理需求的一种出色,简单且快速的数据共享方式。您提到在运行Java模拟的同一台服务器上运行PyTables-using-application。但是,这意味着服务器将承受写入和读取数据的负担。 (也就是说,仿真环境在查询数据时可能会受到无关软件的需求的影响。)
要直接回答您的问题:
关于java - Python,PyTables,Java-捆绑在一起,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1953731/
我想要的是能够在输入获得焦点或失去焦点时执行某些操作(两个事件)。 我尝试了以下方法,但这按事件单独工作(单独编码时):仅在焦点上,或仅在失去焦点时。 另外,我希望它尽可能跨平台(包括触摸设备),这是
我分别研究了TableView的Filtering和Pagination。 过滤: this帖子帮助我满足了我的需要 分页: this , this帖子也帮助了我 我想像这样将它们组合在一起: 详情-
我是 TDD 方法的新手,所以我想知道是否有人经历过这种机智可以启发我一点。我想获得一些关于如何一起使用 UML 和 TDD 方法的线索。 我已经习惯了:用 UML 设计 --> 生成骨架类(然后保持
我尝试使用入口点和 cmd 设置 Docker。 FROM debian:stretch RUN apt-get update && \ apt install gnupg ca-certificat
我想要一个 Class 对象,但我想强制它所代表的任何类扩展类 A 并实现接口(interface) B。 我能做到: Class 或者: Class 但我不能两者兼得。有办法做到这一点吗? 最佳答案
我是 Rubymine 的长期用户。 Rubymine 非常适合基于 html 的 Rails 应用程序,但我现在正在做更多的 SPA 客户端工作(例如 javascript/react)。我发现我真
我注意到我使用的某个脚本依赖于原型(prototype)。 (Lightbox 2) 它会与 jQuery 在同一页面上一起工作吗?有没有办法确保它们不冲突? 最佳答案 可以,但你需要采取 speci
我需要对表中显示的数据进行分页并通过 ajax 调用获取它 - 这是我通过使用具有以下配置的 dataTables 插件来完成的 - bServerSide : true; sAjaxSource :
我是 gtk 新手,所以想知道在 C 语言中归档和 gtk 是否可以一起使用?例如,我可以从 .txt 文件中读取,然后在相同的代码中使用 gtk 在标签或其他内容中显示它吗?如果是,怎么办? 谢谢!
有没有人设法得到Bck2Brwsr最近与 Java 8/JavaFX 8 一起工作?有没有兼容的机会?我找不到太多关于它的信息,也没有一个好的起点。使用给定的 Maven archetype我遇到了几
在我的应用程序中,用户通过 openid(与 stackoverflow 相同)登录/注销。 我想通过 oauth 向第三方应用程序开放我的应用程序。 如何创建我的 openid-consumer 应
我在启动和运行 Hibernate 和 Spring 时遇到一些问题。我有一个网络服务器项目,它使用了其他几个具有持久实体的项目。我遇到的问题是,对于存储在 WEB-INF/libs 内的另一个 ja
我有 @ControllerAdvice 类,它处理一组异常。我们还有一些其他异常,这些异常用 @ResponseStatus 注释进行注释。为了结合这两种方法,我们使用博客文章中描述的技术:http
我想在屏幕上使用进度条而不是 progressDialog。 我在我的 XML View 文件中插入了一个进度条,我想让它在加载时显示并在不加载时禁用它。 所以我使用的是可见的,但它发生了,所以其余的
CREATE TABLE `users` ( `id` int(11) AUTO_INCREMENT, `academicdegree` varchar(255),
IN() 中使用的查询返回:1, 2。然而,整个查询返回 0 行,这是不可能的,因为它们存在。我在这里做错了什么? SELECT DISTINCT li.auto_id FROM links
亲们, 我如何在使用 Jade 生成的表单上实现 jQuery 样式?我想做的是美化 表单并使它们可点击。我在 UI 方面很糟糕。期间。 我如何在表单上实现这个可选择的方法? http://jquer
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我可以: auto o1 = new Content; 但不能: std::shared_ptr o1(new Content); std::unique_ptr o1(new Content); 我
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 4 年前。 Improve this qu
我是一名优秀的程序员,十分优秀!