- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在尝试设置一个 c++ 程序以在 Redhat scientific linux (v5.11) 集群上运行。我已经能够编译该软件并且它在头节点上完美运行,但是在任何工作节点上运行时它会崩溃。
我已将问题追溯到部分代码,如果某些条件返回 false,则会抛出 std::runtime_error
。这是故意的,因为当软件正常运行时,它会被捕获并继续迭代。在工作节点上,软件会在第一次抛出错误时中止。 abort
代码和 backtrace
如下所示。
因为它在一个节点上工作而不在其他节点上工作,我猜测这是 gcc 版本的问题。要编译,我必须 yum install devtoolset-2
并使用 gcc 4.8.2 (Red Hat 4.8.2-15)
作为系统构建软件 gcc 4.1 .2 (Red Hat 4.1.2-55)
太旧,无法正确编译。当我在两个节点上启动应用程序时,我有以下信息:
which gcc > /opt/rh/devtoolset-2/root/usr/bin/gcc
which c++ > /opt/rh/devtoolset-2/root/usr/bin/c++
which g++ > /opt/rh/devtoolset-2/root/usr/bin/g++
which gfortran > /opt/rh/devtoolset-2/root/usr/bin/gfortran
$LD_LIBRARY_PATH > /opt/rh/devtoolset-2/root/usr/lib64:/opt/rh/devtoolset-2/root/usr/lib
就头节点和工作节点之间的区别而言,它们除了内核版本外完全相同:
我累的事情:
-V
传递环境)ssh worker
直接在工作节点上运行,并导出与头节点上相同的所有环境变量任何帮助将不胜感激!以下是我认为获得答案有助于我缩小原因范围的几个问题:
abort
如下:
terminate called after throwing an instance of 'std::runtime_error'
what(): 'custom error message'
Program received signal SIGABRT, Aborted.
0x00000038b6830265 in raise () from /lib64/libc.so.6
回溯
如下:
#0 0x00000038b6830265 in raise () from /lib64/libc.so.6
#1 0x00000038b6831d10 in abort () from /lib64/libc.so.6
#2 0x00000038bb0bec44 in __gnu_cxx::__verbose_terminate_handler() () from /usr/lib64/libstdc++.so.6
#3 0x00000038bb0bcdb6 in ?? () from /usr/lib64/libstdc++.so.6
#4 0x00000038bb0bcde3 in std::terminate() () from /usr/lib64/libstdc++.so.6
#5 0x00000038bb0bceca in __cxa_throw () from /usr/lib64/libstdc++.so.6
#6 0x00002aaaab074bdc in Some::Function::Name() () from path/to/file.so
我必须承认我对 C++ 的了解非常有限,尽管我在过去的两天里一直在努力改进我一直在与这个问题作斗争。下面是抛出和捕获错误的代码的简化示例(这显然是重复调用 Func1
的更大过程的一部分):
double Func1(int a, double b, int c)
{
for (bool OK = true ; OK && d > e && f < a ; f++)
{
try
{
for (d = 0, g = 1 ; g < 10 ; g *= 2)
{
Func2() ;
}
}
catch (runtime_error problem)
{
*log << problem.what() ;
OK = false ;
}
if (c > 1)
{
*log << f << d;
}
}
void Func2()
{
for (int j = 0 ; j < ny && (x & 5) > 0 ; j++)
{
if (Func3(j) <= 0.0)
{
throw runtime_error("custom error message") ;
}
Func4[j] = j ;
}
}
在编译后的程序上运行 ldd
(在头节点上运行,工作节点上缺少第 1 行):
linux-vdso.so.1 => (0x00007fff2b6e7000)
/users/username/software/version/Part1/Part1Extra.so (0x00002b3543587000)
libgfortran.so.3 => /usr/lib64/libgfortran.so.3 (0x00002b354385b000)
libm.so.6 => /lib64/libm.so.6 (0x0000003cc2000000)
libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x000000315f800000)
libc.so.6 => /lib64/libc.so.6 (0x0000003cc1c00000)
/users/username/software/version/Part2/Part2.so (0x00002b3543b4f000)
/users/username/software/version/Part3/Part3.so (0x00002b3543d9b000)
libstdc++.so.6 => /usr/lib64/libstdc++.so.6 (0x0000003160000000)
/lib64/ld-linux-x86-64.so.2 (0x0000003cc1800000)
/users/username/software/version/Part3/Part3Extra.so (0x00002b3543fb2000)
最佳答案
终于弄清楚发生了什么......
对于那些发现与 c++ 代码相关的意外错误的人来说,这些代码在多节点系统的一部分上正常运行但在其他部分上却不能正常运行,即使系统共享一个公共(public)文件结构,最后一点可能会产生误导,尽管我对于那些更熟悉系统管理的人来说,这肯定是显而易见的。
最初我的印象是头节点和工作节点/计算节点共享整个文件结构。这只是部分正确,因为工作节点可以访问文件系统的某些部分,但重要的是不能访问核心文件,例如 /lib
和 /lib64。
通过 yum
安装的包独立于每个计算节点。将头节点更新为正确的 gcc
版本(在本例中为 devtoolset-2
)后,我的印象是每个工作节点也已更新。此情况并非如此。
使用 gcc 4.8.2 (Red Hat 4.8.2-15)
编译的 c++ 代码在具有 libstdc++.x86_64 (v4.1.2-55.el5) 的头节点上运行
捕获抛出的 std::runtime_error
错误。在工作节点上运行时未正确捕获此错误。
问题是工作节点系统 libstdc++.x86_64
版本太旧(不幸的是我不记得确切的版本)这意味着错误没有被捕获。似乎某个版本的 libstdc++
无法从使用 gcc 4.8.2
编译的代码中捕获错误。
必须使用 yum
手动更新每个工作节点,以便其 libstdc++
版本足够高以解决此问题 (v4.1.2-55.el5
在我们的例子中)。更新 libstdc++
解决了这个问题。
在我们的例子中,工作节点无法直接连接到互联网,因此 yum
必须通过代理来完成。我们的 yum
版本也太旧,无法使用 socks5h
自动 ssh 隧道代理方法。因此,我们必须在头节点上使用 squid
包来允许连接。
最后,这花了一些时间才弄清楚,因为文件结构差异非常具有误导性。虽然节点之间不共享关键文件夹,但内容看起来与旧/新版本的包完全相同,具有完全相同的文件结构,只是内容有所修改。
再一次强调,这对系统管理员来说可能是显而易见的,但就是这样。
关于c++ runtime_error捕获在集群节点之间不一致,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45061354/
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Recreating a Dictionary from an IEnumerable 在 Dictiona
是否可以使用命令行版本的 ImageMagick 修剪图像(比如带有 alpha 的 PNG),使输出图像的宽度和高度都是偶数(不是奇数)? 准确地说,应该先修剪输出图像,然后用透明像素填充。我需要这
我有一个订单的Map,可以由许多不同的线程访问。我想控制访问,所以考虑以下简单的数据结构+包装器。 public interface OrderContainer { boolean cont
我有以下代码,现在只是 div 中的一个 Logo ,但我正在尝试添加一些导航单元格,稍后我将对其进行样式设置。问题是,我似乎无法让它们与(除此之外) Logo “一致”,它们总是下降到下一行。我做错
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 9 年前。 Improve this qu
有没有办法将种子值传递给 d3-cloud 或其他基于 javascript 的标签云,以使其在页面加载之间保持一致? 我们的客户希望使用标签云作为导航/发现辅助工具,但由于 d3-cloud 会在每
我有一条由用户使用 D3.js 绘制的路径。 我想在我的用户绘制路径上定义一个破折号数组,但是,随着它改变其形状和长度,破折号的行为不一致并且间隙在移动并变得越来越小。 这是一个代码笔: https:
只是为了研究UINavigationBar和UIStatusBar的UI,我把Navigation Bar Style改成了Black,并且取消勾选Bar visibility,即Shows Navi
我最近在我的家用机器 (OSX 10.9) 和我的远程服务器 (Ubuntu 12.04 64 位) 上安装了 unison。 我在这两个地方都安装了 2.40.102 版本。我在我的 Mac 上使用
我正在使用 migrate 创建 SQL 数据库模式并用初始数据填充它。后来使用 SQLAlchemy 来处理这个数据库。 我如何测试我的 SQLAlchemy 模型是否与 migrate 生成的真实
道歉对这一切来说还是新鲜事。我正在创建一个网页,并在两个单独的 div 中将图像和文本并排放置。我已经设法将它们放在页面上我想要的位置,但是当我调整页面大小时,文本会调整大小,但图像不会。我希望文本底
在翻阅Cassandra和HBase的阅读资料时,我发现Cassandra并不一致,但HBase是一致的。没有找到任何合适的阅读 Material 。 有人可以提供有关此主题的任何博客/文章吗? 最佳
我需要计算 MacOS 中文件夹的大小。该尺寸值必须与 Finder 一致。我尝试了几种方法来做到这一点。但结果总是与Finder不同。 以下方法是我尝试过的。 typedef struct{
问:我可以使用 C++ 中的任何编译时机制来自动验证模板类方法集是否从类特化到特化相匹配? 示例:假设我想要一个类接口(interface),它根据模板值专门化具有非常不同的行为: // forwar
我想使用 SelectKBest 选择前 K 个特征并运行 GaussianNB: selection = SelectKBest(mutual_info_classif, k=300) data_t
我想要一个位于页面中央的 div,其中包含一行(两个单词)的 h1 文本,并且该文本与 div 的长度对齐;意思是,字母留出空间(同时保持它们的大小)以占据 div 的整个宽度,并且不要超出 div。
我试图更新我的服务器,所以我通过 ssh 运行以下命令: sudo do-release-upgrade 我收到以下错误: Errors were encountered while processi
我想验证单应矩阵会给出好的结果,而这个 this answer 有答案 - 但是,我不知道如何实现答案。 那么谁能推荐我如何使用 OpenCV 计算 SVD 并验证第一个奇异值与最后一个奇异值的比率是
我最近更新到 cocoapods 0.36 并对内部规范做了一些更改,现在 podspec 不再有效。我用 0.35 验证了此规范的先前版本 (0.3.8),但使用 0.36 失败。很明显 cocoa
我有两个并排设置的 TableView ,我需要它们同时滚动。因此,当您滚动一个时,另一个也会同时滚动。 我进行了一些搜索,但找不到任何信息,但我认为这一定是有可能的。 我的 TableView 都连
我是一名优秀的程序员,十分优秀!