- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在构建一个百万行的电子表格,在这个过程中所做的任何事情,乘以一百万,加起来就会很成功。我遇到的问题之一是当我处理单元格中的公式时,我必须解析公式、调整引用,然后重新构建公式。在此过程中,我创建了 5 - 12 个字符串(取决于标记化时有多少对象),我使用这些字符串然后完成。
我发现垃圾收集器在此处理过程中占用了 70% 的时间,创建的主要对象然后超出要收集的范围是这些字符串。
是否有任何方法可以减少 GC 命中率? (如果这是 C++,我会创建一个字符串池以供重用。)
详情:
用于报告程序。我们读取模板,合并数据以生成最终报告,对最终报告进行处理,然后将其写入磁盘。该报告作为一个文档对象保存,在这种情况下,99% 是一个单一的表格,有 100 万行(当所有数据合并时),每行有 6 个单元格,每个单元格可选:一个公式,一个值,和/或格式化文本的正文。
在处理过程中,会创建大量字符串供短期使用。它杀死我的情况是调整单元格公式的地方。该模板在几个单元格中有一个公式,例如“=A5+A6”,然后根据每一行的位置进行调整。我解析出对象 {"A5"、"+"、"A6"},针对它们现在所在的行调整每个对象,然后在 StringBuilder 中将所有这些对象放回 StringBuilder 和要分配回的 toString()到单元格中的公式字符串对象。
大部分文档对象写入磁盘的难点在于,文档对象没有被读取、操作和写出一个新的。为了减少内存命中并处理我们需要遍历列而不是行的情况,我们在对象上进行适当的调整。
问题是当我们的内存不足时——在我们到达那个点之前,整个事情运行得非常快。我正在使用 YourKit 进行分析,它正在收集 String 对象。传递 StringBuilder 对象可能会有一些帮助,但不是很多,因为我将收集很多这样的对象(更少,但仍然很多)。
最佳答案
恕我直言,这次命中与处理数百万个字符串无关。我刚刚测得我每秒可以持续创建 600 万个字符串,而 GC 非常空闲。
问题似乎是您的内存不足。这使得 GC 工作得更频繁、更努力以保持程序运行。
所以不要浪费时间尝试降低分配率。
获取更多内存或减少消耗。获取更多内存通常是成本最低的方法。为了减少内存消耗,请考虑:
char
占用 2 个字节,这意味着浪费了一半的内存(假设您主要使用 ASCII)。没有你的程序,很难多说。
使用-XX:+PrintGCDetails
和-XX:+PrintGCTimeStamps
。这就是我得到的 - nearly no GC overhead:
10.075: [GC [PSYoungGen: 442272K->896K(425472K)] 442852K->1476K(769024K), 0.0016600 secs] [Times: user=0.01 sys=0.00, real=0.01 secs]
10.323: [GC [PSYoungGen: 425344K->928K(409600K)] 425924K->1508K(753152K), 0.0017150 secs] [Times: user=0.00 sys=0.00, real=0.01 secs]
10.558: [GC [PSYoungGen: 409504K->928K(394240K)] 410084K->1508K(737792K), 0.0014760 secs] [Times: user=0.01 sys=0.00, real=0.00 secs]
10.791: [GC [PSYoungGen: 394144K->928K(379904K)] 394724K->1508K(723456K), 0.0017070 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
关于java - 减少大量字符串的垃圾收集器开销,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25736467/
我是 C 新手,还没有真正掌握 C 何时决定释放对象以及何时决定保留对象。 heap_t 是指向结构堆的指针。 heap_t create_heap(){ heap_t h_t = (heap
我有一个问题,我不知道如何解决。问题是: char * ary = new Char[]; ifstream fle; fle.open(1.txt, ios_base::binary); fle.s
假设我在 C# 中有字符串:“我看不到你……” 我想删除(替换为空等)这些“’”符号。 我该怎么做? 最佳答案 那个“垃圾”看起来很像有人将 UTF-8 数据解释为 ISO 8859-1 或 Wi
我无法在解析方法中更改蜘蛛设置。但这绝对是一种方式。 例如: class SomeSpider(BaseSpider): name = 'mySpider' allowed_domains
在开始之前,我们先回顾一下堆是个什么玩意,大家可能都知道,我们每天创建的Java对象几乎都存放在堆上面,所以说堆是一个巨大的对象池一点都不过分,在这个对象池里面管理者数据巨大的对象实例。 在对
我想知道为什么 printf() 在提供数组且没有格式化选项时成功打印字符数组,但在使用整数数组时编译器会抛出警告并打印垃圾值。 这是我的代码: #include int main() { c
我正在研究 Scrapy 库并尝试制作一个小爬虫。 这是爬虫的规则: rules = ( Rule(LinkExtractor(restrict_xpaths='//div[@class="w
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Printing a string to a temporary stream object in C++
这个问题在这里已经有了答案: Are WebGL objects garbage collected? (2 个答案) 关闭 3 年前。 在 WebGL 中,纹理的创建和销毁使用: WebGLTex
我继承了以下代码: (为保护无辜者更改了一些名称。) package foo.bar.baz; import javax.swing.JPanel; //Main panel in the GUI c
如果我没记错的话,在某些情况下,Java 中的 lambda 会生成为匿名类实例。例如,在这段代码中,lambda 需要从外部捕获一个变量: final int local = 123456; lis
我正在阅读托管代码中的内存泄漏,想知道是否可以在 C# 不安全代码中创建它? unsafe { while(true) new int; } 我不确定如果它作为不安全代码运行,是否会被 GC
假设我有以下用 HTML 编写的网页(仅正文部分): ... function fn() { // do stu
我想知道是否有简单的命令可以删除在 latex 编译过程中生成的所有不必要的文件,例如.aux、.log 等 最好将它链接到常规的 Latex 构建命令,这样在我点击“编译”后,垃圾文件就会被删除。
Java 在 Java7 中引入了带有字符串的 switch case。我想知道使用这样的开关盒是否会产生垃圾。 例如在我的程序中, String s = getString(); switch(s)
Cevelop将 char junk 作为“未初始化的变量”对象。在这种情况下,解决问题的正确方法是什么? friend std::ostream& operator>(std::istream&
关闭。这个问题需要debugging details .它目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and t
我正在编写一个发送和接收纯文本的小型 boost asio tcp 服务器和客户端。通信或多或少是请求响应。在测试期间,我想我只是向服务器发送垃圾数据,向它发送 100.000 个请求。 客户端发
我正在使用 SAX 来读取/解析 XML 文档,并且它工作正常,除了这个特定的站点,在该站点中 eclipse 告诉我“文档元素之后的垃圾”并且我没有返回任何数据 http://www.zachblu
这是我的 Scrapy 爬虫代码。我正在尝试从网站中提取元数据值。没有元数据在一个页面上出现多次。 class MySpider(BaseSpider): name = "courses"
我是一名优秀的程序员,十分优秀!