- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我在负责持续解析 HTML 页面的服务器上运行 C# 进程(服务)。它依赖于 HTMLAgilityPack。症状是随着时间的推移越来越慢。
当我启动进程时,它每秒处理 n 页。几个小时后,速度下降到大约 n/2 页/秒。几天后它可以下降到 n/10。这种现象已被多次观察到,而且具有一定的确定性。任何时候重新启动该过程,一切都会恢复正常。
非常重要:我可以在同一个进程中运行其他计算,而且它们不会减慢:我可以随时使用任何我想要的东西来达到 100% 的 CPU。这个过程本身并不慢。只有 HTML 解析变慢。
我可以用最少的代码重现它(实际上原始服务中的行为有点极端,但这段代码仍然重现了该行为):
public static void Main(string[] args) {
string url = "https://en.wikipedia.org/wiki/History_of_Texas_A%26M_University";
string html = new HtmlWeb().Load(url).DocumentNode.OuterHtml;
while (true) {
//Processing
Stopwatch sw = new Stopwatch();
sw.Start();
Parallel.For(0, 10000, i => new HtmlDocument().LoadHtml(html));
sw.Stop();
//Logging
using(var writer = File.AppendText("c:\\parsing.log")) {
string text = DateTime.Now.ToString() + ";" + (int) sw.Elapsed.TotalSeconds;
writer.WriteLine(text);
Console.WriteLine(text);
}
}
}
使用这个最少的代码,它显示速度(每秒页数)作为自进程启动以来经过的小时数的函数:
已排除所有明显原因:
这可能与 RAM 和内存分配有关。我知道 HTMLAgilityPack 进行了大量的小对象内存分配(HTML 节点和字符串)。很明显,内存分配和多线程不能很好地协同工作。但是我不明白这个过程怎么会变得越来越慢。
您是否知道有关 CLR 或 Windows 的任何事情可能会导致某些 RAM 密集型(多次分配)处理变得越来越慢?例如以某种方式惩罚执行内存分配的线程?
最佳答案
我注意到使用 HTMLAgilityPack 时有类似的行为。
我发现,当一个 yield 的数据开始出现空间泄漏时,编译器生成的类中的局部变量开始引起问题。由于没有可用代码,这是我的急救箱。
确保设置 the right strategy ,改变app.config中的GC收集策略将有助于分片。
确保在不需要时将它们清空,一旦不需要它们,不要等待作用域清理内存,因为在调用方法和方法作用域中会调用 IEnumerables变量并且可以比你想象的活得更久!在 ILSpy 中打开您的代码并查看 <>d__0(0) 生成的类。你会看到生成的东西像 d__.X=X;在这种情况下,X 可以包含一个片段或整个页面。
您的局部变量被提升到堆中,因为如果它们不存在,则无法在 IEnumable 迭代中访问它们。
锁定开始成为一个问题,大项目在您的第 4 代 ram 中流血,实际上将开始阻塞 GC。 GC 正在暂停您的线程以执行垃圾收集。
HTMLAgility 最糟糕的地方在于它 fragments that ends up being a real issue
我敢肯定,当您开始考虑 HTML 片段的范围时,您会发现一切都会开始顺利进行。使用 WinDbg in SOS 查看您的执行情况并转储您的内存并查看。
如何做到这一点。
打开 WinDebug,按 F6 并附加到进程(在字段中输入进程 ID,然后按确定)
然后通过输入将执行加载到您的内存中
.loadby sos clr
然后输入
!dumpheap -stat
然后你会得到在你的应用程序中分配的内存项,内存地址和大小按类型分组并从低头到高头排序你会看到类似 System.String[] 的东西,前面有大量数字它,这是您首先要调查的内容。
现在看看谁有你可以输入的内容
!dumpheap -mt <heap address>
您将看到正在使用该内存表 (MT) 的地址及其使用的 ram 的大小。
现在它变得有趣了,而不是你输入 x100 行代码
!gcroot <address>
它将打印的是分配内存的文件和代码行、编译器生成的类和导致您痛苦的变量以及它包含的字节数。
这就是所谓的“生产调试”,如果您可以访问服务器,我想您可以访问它,它就可以工作。
关于c# - 数小时后 RAM 密集型 C# 进程变慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50282509/
如果我们想访问数组的元素 i,我们会这样做:i *(每个元素的大小)+ 数组的起始地址 = 我们需要访问的元素的内存位置。然后 CPU 直接访问 RAM 中的该位置。这是怎么发生的? 假设我要定位的内
考虑以下 python 代码 with open(sys.argv[2], 'r') as fin, \ open(sys.argv[3], 'w') as fout:
基本上我在 Centos 6.2 16GB 系统上运行我的世界服务器 我通过 rtoolkit 引导来启动我的服务器,现在我分配它使用 12GB,但它使用的 muc 比这多,我不知道为什么。我运行此命
我正在开发一个小型 x86 内核。我正在访问并尝试读取 GRUB 在多重引导 header 中提供的内存映射。我有一个 Intel i3 cpu 和 4 GiB 的 RAM。在这台机器上运行时,我正在
我有 3 GB 内存。有没有办法只为 C++ 应用程序分配 512MB 的 RAM? 否则 有没有办法暂时将我的 RAM 减少到 512MB 以进行测试? 谢谢,阿肖克 最佳答案 使用SetProce
我的一个 friend 告诉我,在 x86 架构上,DMA Controller 无法在两个不同的 RAM 位置之间传输。它只能在RAM和外设(如PCI总线)之间传输。 这是真的吗? 因为 AFAIK
做一些分析(内存和速度) 我一直被 win7 似乎分配的 RAM 正好是我要求的两倍这一事实所困扰...注意这是我第一次在 win7 上进行这样的主动分析,所以我真的不知道会发生什么。 我在 win7
我经常玩 retrofit 版的 Minecraft。这样做的一个缺点是,每当我启动 Minecraft 时,编译所有模组都需要花费大量时间。这可能需要大约 15 分钟左右的时间,在我看来,这太长了。
我想编写一个内核模块,可以通过 DMA 将数据从 RAM 传输到 RAM。有一些帖子讨论这个,但我真的不明白。有人说可能,也有人说不可能。 如果我对 ldd3 的理解是正确的,RAM 到 RAM 的复
我正在寻找一种方法来查找总内存和正在使用的内存的单个熟值输出。 gwmi Win32_OperatingSystem | select TotalVisibleMemorySize, FreePhys
我在 Heroku 上有一个网络应用程序,我试图了解添加具有 1GB RAM 的 Memcached 实例与向我的 Postgres 服务器添加 1GB RAM 之间的区别/权衡。 如果我添加一个 M
在我的例子中,我有一个包含大约 6000 个实例化类的字典,其中每个类都有 1000 个属性变量,所有类型都是字符串或字符串列表。当我建立这本字典时,我的 RAM 变得非常高。有没有一种方法可以在将字
我的问题是:如果您用完了所有可用的视频内存,并尝试创建新纹理 (SDL),是否会自动使用普通内存而不是视频内存?或者,您是否必须尝试使用使用普通 ram 的表面 (SDL)?如果您出于任何原因无法
我在从 ram 地址获取值时遇到问题。 我有一些限制,即它必须是 C 代码,并且存储信息的地址由 u32 值给出,例如 0x001c0080。 环境是ARM的,我用的是eclipse sdk。我怎样才
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a software
我正在尝试使用 GCC 编译器(标准 C)编译裸机应用程序。我使用 Cyclone V SoC 和 Cortex-A9 处理器。 eclipse DS-5。我收到这些错误 - “Region ram
如果 RAM 不是问题(我的服务器上有接近 200GB),是逐行读取更快还是将所有内容读入 RAM 并访问它?每行将是大约 200-500 个 unicode 字符的字符串。每个文件有近 200 万行
我在我的两台机器上运行以下命令: import os, sqlite3 import pandas as pd from feat_transform import filter_anevexp db
我正在尝试在我的一个项目中引入一些 CUDA 优化。但我认为我在这里做错了什么。我想实现一个简单的矩阵 vector 乘法 (result = matrix * vector)。但是当我想将结果复制回
#include #include #include #include #include #include using namespace std; char randomLetter()
我是一名优秀的程序员,十分优秀!