- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的程序是用 C++ 编写的,我使用 Eigen 库进行其中的矩阵运算。里面有一个巨大的矩阵乘积,维度分别是50000*1000和1000*50000。所以我尝试调用 MKL 库中的 BLAS 函数来提高性能。然后在调用 dgemm 函数时出现段错误。
这是代码
double alpha = 1, beta = 0;
double *s1;
MKL_INT mm1 = q, nn1 = q, kk1 = ncol1;
s1 = (double *)malloc(q*q*sizeof(double));
cout << 14 << endl;
cblas_dgemm(CblasColMajor, CblasNoTrans, CblasNoTrans,mm1, nn1, kk1, alpha, V.data(), mm1, A01.data(), kk1, beta, s1, mm1);
该代码适用于小维度。我编译代码:
icpc lapack.cpp generators.cpp SimpleRNG.cpp example.cpp -lmkl_intel_ilp64 -lmkl_sequential -lmkl_core -lpthread -lm -DMKL_ILP64 -o new_example.o
或
icpc lapack.cpp generators.cpp SimpleRNG.cpp example.cpp -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread -lm -o new_example.o
即:我尝试了 LP64 接口(interface)和 ILP64 接口(interface),但它们都不起作用,有人可以帮我解决这个问题吗?我在Linux服务器上运行程序,内存充足。
非常感谢!
最佳答案
下面的讨论假设:
sizeof(double) == 8
MKL_INT
是 int
,并且 sizeof(int) == 4
sizeof(std::size_t) == 8
CHAR_BIT == 8
这些在典型的 64 位系统中应该是正确的。
这一行发生了一些非常有趣的事情:
s1 = (double *)malloc(q*q*sizeof(double));
如果q
是50000
,那么q*q
就是2500000000
。如果 q
是 int
,那么这会导致有符号整数溢出,从而导致未定义的行为。在这种特殊情况下,编译器可能会简单地环绕(有效地减去 232),导致 -1794967296
。
但是,当您随后将 -1794967296
与 sizeof(double)
相乘时,它的类型是 std::size_t
,它是一个无符号整数类型,有趣的事情发生了。如果 size_t
是 64 位,那么编译器需要将 -1794967296
转换为一个无符号的 64 位数字,这个转换在概念上是通过添加 264 到号码,给你 18446744071914584320
。当您将其乘以 sizeof(double)
时,它会再次溢出,但无符号溢出是明确定义的,并且对于 64 位操作数返回模 264 的结果,因此最终结果是 18446744059349813248
。 (有关计算,请参阅此处的 demo)。
因此,您的原始代码最终会尝试分配 18446744059349813248
字节的内存(这几乎是 16 exabytes)。哎哟。显然分配会失败并返回一个空指针。由于您没有检查返回值,稍后您会遇到段错误。
当你将其重写为
s1 = (double *)malloc(sizeof(double) * q * q);
然后 sizeof(double) * q
首先被评估。此乘法会将 q
转换为 std::size_t
,但由于 q
为正数,因此转换不会影响其值。因此,结果是明确定义的,并且是一个 std::size_t
,其值为 400000
。第二个乘法同样定义明确 - q
再次转换为 std::size_t
,结果乘法产生 20000000000
,它不不会溢出 std::size_t
,因此您的 malloc
调用实际上需要 20GB 的内存。
关于c++ - 从 Eigen 调用 Lapack 函数时出现段错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25216564/
我已经使用 vue-cli 两个星期了,直到今天一切正常。我在本地建立这个项目。 https://drive.google.com/open?id=0BwGw1zyyKjW7S3RYWXRaX24tQ
您好,我正在尝试使用 python 库 pytesseract 从图像中提取文本。请找到代码: from PIL import Image from pytesseract import image_
我的错误 /usr/bin/ld: errno: TLS definition in /lib/libc.so.6 section .tbss mismatches non-TLS reference
我已经训练了一个模型,我正在尝试使用 predict函数但它返回以下错误。 Error in contrasts<-(*tmp*, value = contr.funs[1 + isOF[nn]])
根据Microsoft DataConnectors的信息我想通过 this ODBC driver 创建一个从 PowerBi 到 PostgreSQL 的连接器使用直接查询。我重用了 Micros
我已经为 SoundManagement 创建了一个包,其中有一个扩展 MediaPlayer 的类。我希望全局控制这个变量。这是我的代码: package soundmanagement; impo
我在Heroku上部署了一个应用程序。我正在使用免费服务。 我经常收到以下错误消息。 PG::Error: ERROR: out of memory 如果刷新浏览器,就可以了。但是随后,它又随机发生
我正在运行 LAMP 服务器,这个 .htaccess 给我一个 500 错误。其作用是过滤关键字并重定向到相应的域名。 Options +FollowSymLinks RewriteEngine
我有两个驱动器 A 和 B。使用 python 脚本,我在“A”驱动器中创建一些文件,并运行 powerscript,该脚本以 1 秒的间隔将驱动器 A 中的所有文件复制到驱动器 B。 我在 powe
下面的函数一直返回这个错误信息。我认为可能是 double_precision 字段类型导致了这种情况,我尝试使用 CAST,但要么不是这样,要么我没有做对...帮助? 这是错误: ERROR: i
这个问题已经有答案了: Syntax error due to using a reserved word as a table or column name in MySQL (1 个回答) 已关闭
我的数据库有这个小问题。 我创建了一个表“articoli”,其中包含商品的品牌、型号和价格。 每篇文章都由一个 id (ID_ARTICOLO)` 定义,它是一个自动递增字段。 好吧,现在当我尝试插
我是新来的。我目前正在 DeVry 在线学习中级 C++ 编程。我们正在使用 C++ Primer Plus 这本书,到目前为止我一直做得很好。我的老师最近向我们扔了一个曲线球。我目前的任务是这样的:
这个问题在这里已经有了答案: What is an undefined reference/unresolved external symbol error and how do I fix it?
我的网站中有一段代码有问题;此错误仅发生在 Internet Explorer 7 中。 我没有在这里发布我所有的 HTML/CSS 标记,而是发布了网站的一个版本 here . 如您所见,我在列中有
如果尝试在 USB 设备上构建 node.js 应用程序时在我的树莓派上使用 npm 时遇到一些问题。 package.json 看起来像这样: { "name" : "node-todo",
在 Python 中,您有 None单例,在某些情况下表现得很奇怪: >>> a = None >>> type(a) >>> isinstance(a,None) Traceback (most
这是我的 build.gradle (Module:app) 文件: apply plugin: 'com.android.application' android { compileSdkV
我是 android 的新手,我的项目刚才编译和运行正常,但在我尝试实现抽屉导航后,它给了我这个错误 FAILURE: Build failed with an exception. What wen
谁能解释一下?我想我正在做一些非常愚蠢的事情,并且急切地等待着启蒙。 我得到这个输出: phpversion() == 7.2.25-1+0~20191128.32+debian8~1.gbp108
我是一名优秀的程序员,十分优秀!