- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我使用的是 Kafka 2.1.0。
我们有一个包含 5 个代理(r5.xlarge 机器)的 Kafka 集群。我们经常观察到 GC 时间增加太多,而传入消息的速率没有任何变化,严重影响了集群的性能。现在,我不明白是什么导致 GC 时间突然增加。
我已经尝试了一些改进很少的东西,但我并不真正理解它们背后的原因。
export KAFKA_HEAP_OPTS="-Xmx10G -Xms1G"
export KAFKA_JVM_PERFORMANCE_OPTS="-XX:MetaspaceSize=96m -XX:+UseG1GC -XX:MaxGCPauseMillis=20 -XX:InitiatingHeapOccupancyPercent=35 -XX:G1HeapRegionSize=16M -XX:MinMetaspaceFreeRatio=50 -XX:MaxMetaspaceFreeRatio=80"
我想了解在 Kafka 代理中调整 GC 时最重要的参数。看到上面的配置,我哪里错了?可以做些什么来纠正这个问题?
所有生产者和消费者都工作正常,传入消息的速率保持相当稳定。到目前为止,我们还没有弄清楚 GC 时间突然增加背后的任何模式,这似乎是随机的。
更新
经过进一步分析,发现每秒的数据量确实有所增加。其中一个主题将消息输入从大约 10 KBps 增加到 200 KBps。但我相信 Kafka 可以轻松处理这么多数据。
有什么我想念的吗??
最佳答案
我会首先查看问题是否是 其他 而不是 GC 调整问题。这里有几种可能性:
硬内存泄漏会导致 GC 时间增加。 GC 完成的工作主要是通过跟踪和复制可达对象来完成的。如果存在泄漏,那么越来越多的对象将(错误地)可达。
保持太多对象可访问的缓存也会增加 GC 时间。
过度使用引用类型、终结器等可能会增加 GC 时间。
我将启用 GC 日志记录,并查找 GC 报告的内存和空间使用模式。如果您怀疑内存泄漏是因为从长远来看内存利用率呈上升趋势,请转到下一步并使用内存配置文件来追踪泄漏。
无论哪种方式,在尝试解决问题之前了解导致问题的原因都很重要。
After some further analysis, it turns out there was indeed some increase in the amount of data per sec. One of the topics had increased message input from around 10 KBps to 200 KBps. But I believed that Kafka could easily handle this much of data.
很有可能。然而,吞吐量增加 20 倍将不可避免地导致更多对象被创建和丢弃……并且 GC 将需要更频繁地运行来处理这个问题。
How come just 200 Kbps of data divided among 5 brokers was able to break GC.
是什么让您认为您已经“破坏”了 GC? GC 中 15% 的时间并不意味着它已损坏。
现在,我可以想象 GC 可能难以达到您的 20 毫秒最大暂停时间目标,并且可能因此触发偶尔的完整 GC。您的暂停时间目标是“雄心勃勃的”,尤其是当堆可能增长到 10GB 时。我会建议减小堆大小、增加暂停时间目标和/或增加 JVM 可用的物理内核数量。
By breaking I mean an increased delay in committing offsets and other producer and consumer offsets.
所以...您只是担心负载增加 20 倍会导致 GC 使用高达 15% 的可用 CPU。好吧,那没有坏。这是(IMO)预期的。垃圾收集器并不神奇。它需要使用 CPU 时间来完成它的工作。它要做的工作越多,它需要使用的 CPU 就越多。如果您的应用程序的工作负载涉及大量对象分配,则 GC 必须处理。
除了上述调优思路外,我怀疑您应该将 G1HeapRegionSize
大小设置得更小。根据"Garbage First Garbage Collector Tuning"根据 Monica Beckwith,默认情况下根据最小堆大小有 2048 个区域。但是你的设置会给 1G/16M == 64 个初始区域。
最后,如果您的总体目标是降低 GC 的 CPU 使用率,那么您应该使用 Throughput GC,而不是 G1GC。这将最小化 GC 开销。缺点是 GC 暂停最小化不再是目标,因此偶尔会出现长时间的暂停。
如果你打算继续使用 G1GC,建议使用最新版本的 Java;即 Java 11。(参见 "G1 Garbage Collector is mature in Java 9, finally")
关于java - 为什么在记录、生产者和消费者数量不变的 Kafka 经纪人中 GC 时间会增加?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53959607/
您好,我是使用 xampp 的 PHPmyadmin 新手,没有 MYSQL 背景。当我喜欢研究它是如何工作的时,我的脑海中浮现出一个想法,它让我一周都无法休眠,因为我似乎无法弄清楚如何使用 MIN(
Go docs say (强调): Programs using times should typically store and pass them as values, not pointers.
我有一组用户在 8 月 1 日有一个条目。我想找到在 8 月 1 日有条目但在 8 月 2 日没有做任何事情的用户。 现在是 10 月,所以事件已经过去很久了。 我有限的知识说: SELECT * F
我有以下代码,主要编码和取消编码时间结构。这是代码 package main import ( "fmt" "time" "encoding/json" ) type chec
您能详细解释一下“用户 CPU 时间”和“系统 CPU 时间”吗?我读了很多,但我不太理解。 最佳答案 区别在于时间花在用户空间还是内核空间。用户 CPU 时间是处理器运行程序代码(或库中的代码)所花
应用程序不计算东西,但做输入/输出、读取文件、使用网络。我希望探查器显示它。 我希望像 callgrind 中的东西一样,在每个问题中调用 clock_gettime。 或者像 oprofile 那样
目前我的 web 应用程序接收 websocket 数据来触发操作。 这会在页面重新加载时中断,因此我需要一个能够触发特定事件的客户端解决方案。 这个想法可行吗? 假设你有 TimeX = curre
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我有一个 Instant (org.joda.time.Instant) 的实例,我在一些 api 响应中得到它。我有另一个来自 (java.time.Instant) 的实例,这是我从其他调用中获得
如何集成功能 f(y) w.r.t 时间;即 'y'是一个包含 3000 个值和值 time(t) 的数组从 1 到 3000 不等。所以,在整合 f(y) 后我需要 3000 个值. 积分将是不确定
可以通过 CLI 创建命名空间,但是如何使用 Java SDK 来创建命名空间? 最佳答案 它以编程方式通过 gRPC API 完成由服务公开。 在 Java 中,生成的 gRPC 客户端可以通过 W
我有一个函数,它接受 2 组日期(开始日期和结束日期),这些日期将用于我的匹配引擎 我必须知道start_date1和end_date1是否在start_date2和end_date2内 快进:当我在
我想从 Python 脚本运行“time”unix 命令,以计算非 Python 应用程序的执行时间。我会使用 os.system 方法。有什么方法可以在Python中保存这个输出吗?我的目标是多次运
我正在寻找一种“漂亮的数字”算法来确定日期/时间值轴上的标签。我熟悉 Paul Heckbert's Nice Numbers algorithm . 我有一个在 X 轴上显示时间/日期的图,用户可以
在 PowerShell 中,您可以格式化日期以返回当前小时,如下所示: Get-Date -UFormat %H 您可以像这样在 UTC 中获取日期字符串: $dateNow = Get-Date
我正在尝试使用 Javascript 向父子窗口添加一些页面加载检查功能。 我的目标是“从父窗口”检测,每次子窗口完全加载然后执行一些代码。 我在父窗口中使用以下代码示例: childPage=wi
我正在尝试设置此 FFmpeg 命令的 drawtext 何时开始,我尝试使用 start_number 但看起来它不会成功。 ffmpeg -i 1.mp4 -acodec aac -keyint_
我收到了一个 Excel (2010) 电子表格,它基本上是一个文本转储。 单元格 - J8 具有以下信息 2014 年 2 月 4 日星期二 00:08:06 EST 单元格 - L8 具有以下信息
我收到的原始数据包含一列具有以下日期和时间戳格式的数据: 2014 年 3 月 31 日凌晨 3:38 单元格的格式并不一致,因为有些单元格有单个空格,而另一些单元格中有两个或三个字符之间的空格。所以
我想知道是否有办法在我的 Grails 应用程序顶部显示版本和构建日期。 编辑:我应该说我正在寻找构建应用程序的日期/时间。 最佳答案 在您的主模板中,或任何地方。 Server version:
我是一名优秀的程序员,十分优秀!