- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在构建一个由 spring-boot 驱动的服务,该服务使用文件系统 API 将数据写入 Hadoop。一些数据写入 parquet 文件,大块缓存在内存中,因此当服务关闭时,可能有数百 Mb 的数据必须写入 Hadoop。FileSystem
默认自动关闭,所以当服务关闭时,有时 FileSystem
在关闭所有编写器之前关闭,导致 Parquet 文件损坏。
有fs.automatic.close
文件系统中的标志 Configuration
,但是 FileSystem
实例被多个线程使用,我不知道有什么干净的方法可以在关闭之前等待它们全部完成 FileSystem
手动。我尝试使用专用的 filesysem 关闭 bean 实现 Spring SmartLifeCycle
最大 phase
所以它最后被销毁,但实际上它不是最后被销毁而是最后通知关闭,而其他bean仍在关闭过程中。
理想情况下,每个需要 FileSystem
的对象会得到一个并负责关闭它。问题是FileSystem.get(conf)
返回一个缓存实例。有FileSystem.newInstance(conf)
,但不清楚使用多个 FileSystem
的后果是什么实例性能方面。还有另一个问题 - 无法通过 FileSystem
实例到 ParquetWriter
- 它gets one使用 path.getFileSystem(conf)
.人们会认为该行会返回 FileSystem
仅分配给该文件的实例,但有一个是错误的 - 很可能是相同的缓存实例 would be returned所以关闭它是错误的。
是否有推荐的方法来管理 FileSystem
的生命周期? ?如果 FileSystem
会发生什么是用 fs.automatic.close
创建的设置为 true
并且从不手动关闭?也许 spring-boot 支持一种干净的关闭方式 FileSystem
在所有其他 bean 实际被销毁(未被销毁)之后?
谢谢!
最佳答案
您可以禁用 FileSystem
缓存使用 fs.<scheme>.impl.disable.cache
配置(找到 here ,一些讨论 here ),其中 <scheme>
在你的情况下是 hdfs
(假设您使用的是 HDFS)。这将强制ParquetWriter
新建FileSystem
调用 path.getFileSystem(conf)
时的实例.这种配置没有记录是有充分理由的——虽然广泛用于 Hadoop 本身的单元测试,但在生产系统中使用它可能非常危险。回答有关性能的问题,假设您使用的是 HDFS,每个 FileSystem
实例将创建一个单独的 TCP 连接到 HDFS NameNode。应用程序和库代码通常假设调用类似 path.getFileSystem(conf)
和 FileSystem.get(conf)
价格便宜且重量轻,因此经常使用。在生产系统中,我看到客户端系统 DDoS 是 NameNode 服务器,因为它禁用了缓存。您需要仔细管理不仅仅是 FileSystem
的生命周期您的代码创建的实例,以及您使用的库创建的实例。我通常会建议反对它。
听起来这个问题真的来自 JVM shutdown hooks 之间的不良交互。 Spring 使用的和 Hadoop 使用的,这是用于自动关闭的机制 FileSystem
实例。 Hadoop 包括它自己的 ShutdownHookManager用于在关闭期间对事件进行排序; FileSystem
有目的地将关闭放在最后,以便其他关闭 Hook (例如,在 MapReduce 任务之后进行清理)可以首先完成。但是,Hadoop 的 ShutdownHookManager
只知道已经注册到它的关闭任务,所以它不会知道 Spring 的生命周期管理。听起来确实像利用 Spring 的关闭序列和利用 fs.automatic.close=false
可能适合您的应用;我没有 Spring 经验,所以我无法在这方面为您提供帮助。您也可以使用 Hadoop 的 ShutdownHookManager
注册 Spring 的整个关闭序列。 ,使用非常高的优先级来保证Spring的关机顺序在关机队列中排在第一位。
具体回答这部分:
Is there a recommended way of managing a lifecycle of a FileSystem?
关于java - Hadoop FileSystem 应该关闭吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55168902/
我正在尝试在Elasticsearch中返回的值中考虑地理位置的接近性。我希望近距离比某些字段(例如legal_name)重要,但比其他字段重要。 从文档看来,当前的方法是使用distance_fea
我是Elasticsearch的初学者,今天在进行“多与或”查询时遇到问题。 我有一个SQL查询,需要在Elastic中进行转换: WHERE host_id = 999 AND psh_pid =
智能指针应该/可以在函数中通过引用传递吗? 即: void foo(const std::weak_ptr& x) 最佳答案 当然你可以通过const&传递一个智能指针。 这样做也是有原因的: 如果接
我想执行与以下MYSQL查询等效的查询 SELECT http_user, http_req_method, dst dst_port count(*) as total FROM my_table
我用这两个查询进行测试 用must查询 { "size": 200, "from": 0, "query": { "bool": { "must": [ { "mat
我仍在研究 Pro Android 2 的简短服务示例(第 304 页)同样,服务示例由两个类组成:如下所示的 BackgroundService.java 和如下所示的 MainActivity.j
给定标记 like this : header really_wide_table..........................................
根据 shouldJS 上的文档网站我应该能够做到这一点: ''.should.be.empty(); ChaiJS网站没有使用 should 语法的示例,但它列出了 expect 并且上面的示例似乎
我在 Stack Overflow 上读到一些 C 函数是“过时的”或“应该避免”。你能给我一些这种功能的例子以及原因吗? 这些功能有哪些替代方案? 我们可以安全地使用它们 - 有什么好的做法吗? 最
在 C++11 中,可变参数模板允许使用任意数量的参数和省略号运算符 ... 调用函数。允许该可变参数函数对每个参数做一些事情,即使每个参数的事情不是一样的: template void dummy(
我在我从事的项目之一上将Shoulda与Test::Unit结合使用。我遇到的问题是我最近更改了此设置: class MyModel :update end 以前,我的(通过)测试看起来像这样: c
我该如何做 or使用 chai.should 进行测试? 例如就像是 total.should.equal(4).or.equal(5) 或者 total.should.equal.any(4,5)
如果您要将存储库 B 中的更改 merge 到存储库 A 中,是否应该 merge .hgtags 中的更改? 存储库 B 可能具有 A 中没有的标签 1.01、1.02、1.03。为什么要将这些 m
我正在尝试执行X AND(y OR z)的查询 我需要获得该代理为上市代理或卖方的所有已售属性(property)。 我只用 bool(boolean) 值就可以得到9324个结果。当我添加 bool
我要离开 this教程,尝试使用 Mocha、Supertest 和 Should.js 进行测试。 我有以下基本测试来通过 PUT 创建用户接受 header 中数据的端点。 describe('U
我正在尝试为 Web 应用程序编写一些 UI 测试,但有一些复杂的问题希望您能帮助我解决。 首先,该应用程序有两种模式。其中一种模式是“训练”,另一种是“现场”。在实时模式下,数据直接从我们的数据库中
我有一个规范: require 'spec_helper' # hmm... I need to include it here because if I include it inside desc
我正在尝试用这个测试我在 Rails 中的更新操作: context "on PUT to :update" do setup do @countdown = Factory(:count
我还没有找到合适的答案: onclick="..." 中是否应该转义 &(& 符号)? (或者就此而言,在每个 HTML 属性中?) 我已经尝试在 jsFiddle 和 W3C 的验证器上运行转义和非
import java.applet.*; import java.awt.*; import java.awt.event.*; public class Main extends Applet i
我是一名优秀的程序员,十分优秀!