- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我一直在 HP Proliant 服务器上运行高度并发的应用程序。该应用程序是我用 erlang 编写的文件系统索引器。它为在文件系统上找到的每个文件夹生成一个进程,并将所有文件路径记录在碎片化的 Mnesia 数据库中。 (数据库由 disc_only_copies
类型的表组成,可以查看其文件系统的屏幕截图 here 。)
执行遍历文件系统的高强度工作的代码片段如下所示:
%%% -------- COPYRIGHT NOTICE --------------------------------------------------------------------%% @author Muzaaya Joshua, <joshmuza@gmail.com> [http://joshanderlang.blogspot.com]%% @version 1.0 free software, but modification prohibited%% @copyright Muzaaya Joshua (file_scavenger-1.0) 2011 - 2012 . All rights reserved%% @reference <a href="http://www.erlang.org">OpenSource Erlang WebSite</a>%% %%% ---------------- EDOC INTRODUCTION TO THE MODULE ----------------------------------------------%% @doc This module provides the low level APIs for reading, writing,%% searching, joining and moving within directories.The module implementation%% took place on @date at @time.%% @end-module(file_scavenger_utilities).%%% ------- EXPORTS --------------------------------------------------------------------------------compile(export_all).%%% ------- INCLUDES -----------------------------------------------------------------------------%%% -------- MACROS -------------------------------------------------------------------------------define(IS_FOLDER(X),filelib:is_dir(X)).-define(IS_FILE(X),filelib:is_file(X)).-define(FAILED_TO_LIST_DIR(X),error_logger:error_report(["*** File Scavenger Utilities Error ***** ",{error,"Failed to List Directory"},{directory,X}])).-define(NOT_DIR(X),error_logger:error_report(["*** File Scavenger Utilities Error ***** ",{error,"Not a Directory"},{alleged,X}])).-define(NOT_FILE(X),error_logger:error_report(["*** File Scavenger Utilities Error ***** ",{error,"Not a File"},{alleged,X}])).%%%--------- TYPES -------------------------------------------------------------------------------%% @type dir() = string(). %% Must be containing forward slashes, not back slashes. Must not end with a slash%% after the exact directory.e.g this is wrong: "C:/Program Files/SomeDirectory/"%% but this is right: "C:/Program Files/SomeDirectory"%% @type file_path() = string(). %% Must be containing forward slashes, not back slashes.%% Should include the file extension as well e.g "C:/Program Files/SomeFile.pdf"%% -----------------------------------------------------------------------------------------------%% @doc Enters a directory and executes the fun ForEachFileFound/2 for each file it finds%% If it finds a directory, it executes the fun %% ForEachDirFound/2. %% Both funs above take the parent Dir as the first Argument. Then, it will spawn an %% erlang process that will spread the found Directory too in the same way as the parent directory %% was spread. The process of spreading goes on and on until every File (wether its in a nested %% Directory) is registered by its full path.%% @end%%%% @spec spread_directory(dir(),dir(),funtion(),function())-> ok.spread_directory(Dir,Top_Directory,ForEachFileFound,ForEachDirFound) when is_function(ForEachFileFound),is_function(ForEachDirFound) -> case ?IS_FOLDER(Dir) of false -> ?NOT_DIR(Dir); true -> F = fun(X)-> FileOrDir = filename:absname_join(Dir,X), case ?IS_FOLDER(FileOrDir) of true -> (catch ForEachDirFound(Top_Directory,FileOrDir)), spawn(fun() -> ?MODULE:spread_directory(FileOrDir,Top_Directory,ForEachFileFound,ForEachDirFound) end); false -> case ?IS_FILE(FileOrDir) of false -> {error,not_a_file,FileOrDir}; true -> (catch ForEachFileFound(Top_Directory,FileOrDir)) end end end, case file:list_dir(Dir) of {error,_} -> ?FAILED_TO_LIST_DIR(Dir); {ok,List} -> lists:foreach(F,List) end end.
函数spread_directory/4
是通用的,它需要两个funs
。一个有趣的是:ForEachFileFound/2
与最顶层目录、找到的文件一起执行任何操作,另一个有趣的是:ForEachDirFound/2
与最顶层目录一起进行目录,它找到并以任何它想要的方式使用它的文件夹。
我用于此应用程序的启动脚本可确保 erlang 能够生成尽可能多的进程。一旦进程完成对文件夹的索引,它就会退出。
#!/usr/bin/env shecho "Starting File Scavenger System. Layer 1 on the P2P File Sharing System....."erl \ -name file_scavenger@127.0.0.1 \ +P 13421779 \ -pa ./ebin ./lib/*/ebin ./include \ -mnesia dir '"./database"' \ -mnesia dump_log_write_threshold 10000 \ -eval "application:load(file_scavenger)" \ -eval "application:start(file_scavenger)"
有一个 gen_server 将密集模块与我记录所有路径的数据库连接起来。下面显示了它开始 spread_directory 工作的片段:
handle_cast(index_dirs,#scavenger{directory_paths = Dirs} = State)-> {File,Folder} = case {State#scavenger.verbose,State#scavenger.verbose_to} of {true,tty} -> { fun(TopDir,Fl)-> io:format(" File: ~p~n",[Fl]), file_scavenger_database:insert_file(filename:basename(Fl),file,Fl,TopDir,filename:extension(Fl)) end, fun(TopDir,Fd) -> io:format(" Folder: ~p~n",[Fd]), file_scavenger_database:insert_file(Fd,folder,Fd,TopDir,undefined) end }; {true,SomeFile}-> { fun(TopDir,Fl)-> os:cmd("echo File: " ++ Fl ++ " >> " ++ SomeFile), file_scavenger_database:insert_file(filename:basename(Fl),file,Fl,TopDir,filename:extension(Fl)) end, fun(TopDir,Fd)-> os:cmd("echo Folder: " ++ Fd ++ " >> " ++ SomeFile), file_scavenger_database:insert_file(Fd,folder,Fd,TopDir,undefined) end } end, Main = fun(Dir) -> error_logger:info_msg("*** File scavenger Server indexing directory: ~p~n",[Dir]), spawn(fun() -> file_scavenger_utilities:spread_directory(Dir,Dir,File,Folder) end) end, lists:foreach(Main,Dirs), {noreply,State}; handle_cast(stop, State) -> {stop, normal, State}.
更多源详细信息可以在整个应用程序中找到。应用程序的整个源代码和构建可以在这里找到: File_scavenger-1.0.zip 。
现在,我在服务器(HP Proliant G6,包含 Intel 处理器(2 个处理器,每个 4 个核心,每个核心 2.4 GHz 速度,8 MB 缓存大小)、20 GB RAM 大小、1.5 TB 磁盘空间)上启动应用程序。现在,我们可以使用两台这样的高功率机器。系统数据库应该在两台服务器之间复制。每台服务器都运行 Solaris 10(64 位),其终端现在如下所示:
bash-3.00# sh file_scavenger.shStarting File Scavenger System. Layer 1 on the P2P File Sharing System.....Erlang R14B03 (erts-5.8.4) [source] [smp:8:8] [rq:8] [async-threads:0] [hipe] [kernel-poll:false]Eshell V5.8.4 (abort with ^G)(file_scavenger@127.0.0.1)1>=INFO REPORT==== 18-Aug-2011::09:36:04 ===Starting File Scavenger Database......=INFO REPORT==== 18-Aug-2011::09:36:04 ===Database Successfully Started....=INFO REPORT==== 18-Aug-2011::09:36:04 ===Starting File Scavenger Database......=INFO REPORT==== 18-Aug-2011::09:36:04 ===Database Successfully Started....=INFO REPORT==== 18-Aug-2011::09:36:04 ===File Scavenger Server starting with default verbose settings....(file_scavenger@127.0.0.1)1> file_scavenger_server:index_dirs().
服务器开始运行并向终端详细说明它找到的所有文件和文件夹。服务器配备过多 RAM (20 GB) 和 Swap 空间(Swap 为 16 GB)。然而,它运行了大约 18 个小时,最后,erlang 虚拟机报告了以下内容:
File: "/proc/4324/root/opt/csw/gcc4/share/locale/ja/LC_MESSAGES/gcc.mo" Folder: "/proc/4324/root/opt/csw/gcc4/share/locale/da" Folder: "/proc/4324/root/opt/csw/gcc4/share/locale/es/LC_MESSAGES" File: "/proc/4324/root/proc/4984/root/.thumbnails/normal/dc259e3897e8af4b379c6d956b6c1393.png" File: "/proc/4324/root/proc/4984/root/.thumbnails/fail/gnome-thumbnail-factory/223c19786421b7101d14075bdec46f61.png" File: "/proc/4324/root/opt/csw/gcc4/libexec/gcc/i386-pc-solaris2.10/4.5.1/install-tools/mkheaders" File: "/proc/4324/root/opt/csw/gcc4/libexec/gcc/i386-pc-solaris2.10/4.5.1/cc1plus" File: "/proc/4324/root/opt/csw/gcc4/lib/libsupc++.la"Crash dump was written to: erl_crash.dumpeheap_alloc: Cannot allocate 153052320 bytes of memory (of type "heap").Abort - core dumpedbash-3.00#
问题 1. 有了如此强大的服务器,为什么操作系统无法向应用程序(它是唯一正在运行的应用程序)提供这样的内存?
问题 2. 我启动的 Erlang 模拟器被指示能够生成所需数量的进程。值+P 13421779
。 Erlang VM 是否无法访问该内存或无法将其分配给其进程?
问题 3. 对于 Solaris,它看到一个进程:epmd
,可能包含并启动数千个微线程。我可以对 Solaris 进行哪些配置,以便永远不会停止我的应用程序,无论它有多少“内存消耗”?可用交换空间为 16 GB,RAM 20 GB,老实说,肯定有问题。
问题 4. 我可以对 Erlang 模拟器进行哪些配置,以避免这些堆内存崩溃转储,尤其是当服务器上可能需要的所有内存都可用时?如果 Erlang 仍然无法将这些内存分配给简单的文件系统索引器(以及它的高度并发),我将如何在此服务器上运行更多消耗内存的应用程序?
最后,我可以做的所有其他调整,以避免在如此强大的硬件上出现堆内存问题,都是值得欢迎的。提前致谢
最佳答案
我还没有时间查看源代码,但这里有一些评论:
Question 1. With such a powerful server, why would the operating system fail to provide such memory to the application (it was the only application running)?
因为 Erlang VM 试图消耗超过可用内存的内存。
Question 2. The Erlang Emulator i start is instructed to be able to spawn as many processes as it may need. the value +P 13421779. Is Erlang VM failing to access this memory or failing to allocate it to its processes ?
没有。如果您耗尽了进程,Erlang VM 会这么说(并且 VM 仍会启动并运行):
=ERROR REPORT==== 18-Aug-2011::10:04:04 ===
Error in process <0.31775.138> with exit value: {system_limit,[{erlang,spawn_link, [erlang,apply,[#Fun<shell.3.130303173>,[]]]},{erlang,spawn_link,1},{shell,get_command,5}, {shell,server_loop,7}]}
Question 3. To Solaris, it sees one process: epmd, perhaps containing and starting thousands of micro threads. What configurations can i make to Solaris to be able to never stop my application however much "memory hungry" it may be? Swap space available is 16 GB, RAM 20 GB, honestly, there must be something wrong.
epmd
是 Erlang 端口映射守护进程。它负责管理分布式 Erlang,与您个人的 Erlang 应用程序无关。您应该查找的进程的名称很可能是beam.smp
。这些将显示 Erlang VM 的操作系统内存消耗等。
Question 4. Which configurations can i make to the Erlang Emulator, to avoid these heap memory crash dumps especially when all the memory it may need is available on the server? How will i run more memory consuming apps on this server if Erlang still fails to allocate such memory to a simple file system indexer (well its heavily concurrent)?
Erlang VM 应该能够使用计算机中的所有可用内存。但是,这取决于您的应用程序是如何编写的。内存泄漏的原因可能有很多:
关于mysql - Erlang 及其堆内存消耗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7103621/
我有一个简单的 HATEOAS 使用 构建的提供程序 Spring 这为我提供了以下资源: { "_links" : { "self" : { "href" : "http:/
这里是 Clojure 初学者,不确定问题中的术语是否正确。 我正在使用 clj-webdriver 出租车 API 构建网络抓取工具。它需要从多个站点抓取数据。以下实际上不是项目中的代码,但我已经对
我使用pthread lib 2.8,操作系统内核是arm上的Linux 2.6.37。在我的程序中,线程 A 使用 pthread 接口(interface)将调度优先级设置为 sched_get_
我有一个大约 400MB 的二进制文件,我想将其转换为 CSV 格式。输出的 CSV 文件将约为 1GB(根据我的计算)。 我读取二进制文件并将其存储在一个结构数组中(其他处理也需要),当用户想要将其
我在编写我的专业应用程序时遇到一个串口线程问题。我有cpu消耗。当我在我的项目中添加 SerialCtrl.h(来自项目 SerialCtrl http://www.codeproject.com/A
总结:似乎 c 代码的 RAM 消耗取决于变量排序。有没有办法自动优化? 更长的版本:在这里,我粘贴了两个版本的代码,它们仅在变量排序方面有所不同。 版本 1: static unsigned lon
我有一个处理图像编辑(裁剪和调整大小)的 Windows 应用程序项目。不幸的是,这些图像处理会消耗大量内存和 CPU 资源(很容易达到 600MB 或 50% cpu),而且它只是裁剪和调整大小 2
我创建了一个实例化类 10 亿次的循环,并且非常惊讶地看到它在 0 毫秒内运行并且根据 Windows 任务管理器没有消耗 CPU 时间。 正如您从下面的代码中看到的那样,我显然没有对默认构造函数执行
我们有以下用户名验证规则: 用户名可以包含字母数字字符 用户名可以有下划线、连字符或句号 现在假设用户名是 ASCII 用户名不能以句点开头或结尾 用户名不能开始、结束或有任何空格 我们有以下相同的正
如何获取 C# 中所有进程的列表,然后获取每个进程的当前内存和 CPU 消耗? 非常感谢示例代码。 最佳答案 Process class有一个 GetProcesses 方法,可以让您枚举正在运行的进
如何从 linux 2.6.32 机器上的源代码中限制 C 程序的物理内存消耗? 我需要确定系统使用的页面替换算法的类型。 问题是,如果不限制一个进程在内存中可以拥有的页面数量,就很难分析页面错误的模
我正在编写一个 Linux 应用程序,它观察其他应用程序并跟踪资源消耗。我计划使用 Java,但编程语言对我来说并不重要。目标很重要,所以我可以切换到另一种技术或使用模块。我的应用程序将任何选定的第三
我有一个图标,旁边有一个复选框,包含在一个面板中。面板有悬停效果,点击面板时想选中框。 我想使用或阻止复选框的所有事件,仅以编程方式选择它。我希望该框在屏幕上显示为“已启用”,而“在幕后”几乎不起作用
我正在使用服务 REST,它当前有 5025 条记录,但当我使用该服务时,只出现 1,000 条记录。我可以做什么来完全消耗所有记录? 这是我的代码示例: $http({ method:
我已经搜索了几个小时但没有成功,是否可以跟踪 Blob 容器上 SAS 凭据的消耗情况? 我将向几个客户提供 SAS 凭证,并且我希望能够跟踪他们的 SAS 使用情况(操作次数、带宽使用情况...)
我创建了具有 1.75 GB RAM 的 B1 应用服务计划。我还创建了一个应用程序服务并向其部署了 docker 镜像。现在我停止了 docker 镜像,它的状态已停止,并且它是该应用程序服务计划中
与我们的合作伙伴一起为我们的客户(一家售后汽车零部件零售商)开发一个项目,他们利用 AR 和 VR 做了很多很酷的事情。我们的想法是使用 Hololens 并尝试帮助我们的客户在其大型仓库中进行物流操
这是一个简短的 Haskell 程序,可以生成 440 Hz 的声音。它使用pulseaudio作为音频后端。 import GHC.Float import Control.Arrow import
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
tab.setOnCloseRequest(e -> { if (getEditorForTextArea(getSelectedTextArea()) != null
我是一名优秀的程序员,十分优秀!