- Java锁的逻辑(结合对象头和ObjectMonitor)
- 还在用饼状图?来瞧瞧这些炫酷的百分比可视化新图形(附代码实现)⛵
- 自动注册实体类到EntityFrameworkCore上下文,并适配ABP及ABPVNext
- 基于Sklearn机器学习代码实战
本文分享自华为云社区《 AscendCL应用编译&运行问题案例 》,作者: 昇腾CANN.
AscendCL(Ascend Computing Language)是一套用于在昇腾平台上开发深度神经网络推理应用的C语言API库,该API库中提供运行资源管理、内存管理等基础API.
本期就分享几个关于编译、运行AscendCL应用程序的典型问题案例,并给出原因分析及解决方法.
编译 Ascend Sample仓 中的样例应用程序源码时,报错提示找不到头文件acl.h.
报错示例如下:
fatal error: acl/ acl.h: No such file or directory #include " acl/acl.h " ^~~~~~~~~~~ compilation terminated. CMakeFiles /main.dir/build.make: 62 : recipe for target ' CMakeFiles/main.dir/main.cpp.o ' failed make[ 2 ]: *** [CMakeFiles/main.dir/main.cpp.o] Error 1 CMakeFiles /Makefile2: 67 : recipe for target ' CMakeFiles/main.dir/all ' failed make[ 1 ]: *** [CMakeFiles/main.dir/all] Error 2 Makefile: 129 : recipe for target ' all ' failed
编译应用源码依赖定义AscendCL接口的头文件,样例中的编译脚本是根据“{DDK_PATH}环境变量值/runtime/include/acl”目录查找编译依赖的头文件,当前报错提示找不到头文件,则可能是{DDK_PATH}环境变量配置不正确.
1、登录编译源码的环境,使用如下命令查看{DDK_PATH}环境变量的值.
echo $DDK_PATH
回显信息示例如下:
/home/HwHiAiUser/Ascend/ascend-toolkit/latest
若无回显信息,则环境变量未配置,跳转到第3步配置该环境变量.
2、根据第1步中获取到的{DDK_PATH}环境变量值,检查“{DDK_PATH}环境变量值/runtime/include/acl”路径以及该路径下的acl.h头文件是否存在.
检查路径是否存在时,可直接切换到该目录下看是否成功,命令示例如下:
cd /home/HwHiAiUser/Ascend/ascend-toolkit/latest/runtime/include/acl
若目录存在,可直接执行以下命令检查acl.h是否存在:
ll acl.h
若路径或头文件不存在,则需跳转到第3步重新配置{DDK_PATH}环境变量 。
3、配置环境变量.
export DDK_PATH=$HOME/Ascend/ascend-toolkit/latest
例如,当开发环境为X86架构、运行环境为AArch64架构时,则涉及交叉编译,需在开发环境上安装AArch64架构的软件包,将{DDK_PATH}环境变量的路径指向AArch64架构的软件包安装目录(如下所示),便于使用与运行环境架构相同的软件包中的头文件来编译代码.
export DDK_PATH=$HOME/Ascend/ascend-toolkit/latest/arm64-linux
注意:
若找不到acl.h文件,则需要重新安装“Ascend-cann-toolkit”包.
当环境上安装多个软件版本时,请根据实际情况选择版本,其中,latest目录默认指向最后安装的软件版本.
当同一个版本下有多个acl.h文件时,是由于兼容旧版本的原因,其中部分文件是软链接,方便用户在旧版本下编译应用源码.
编译 Ascend Sample仓 中的样例应用程序源码时,报错提示找不到库文件libascendcl.so(报错中的-lascendcl,-l表示查找库文件,ascendcl前后分别加上lib和.so组成库文件的名称libascendcl.so).
报错示例如下:
/usr/bin/ld: cannot find - lascendcl collect2: error: ld returned 1 exit status CMakeFiles /main.dir/build.make: 94 : recipe for target ' /home/HwHiAiUser/sample/resnet50_firstapp/out/main ' failed make[ 2 ]: *** [/home/HwHiAiUser/sample/resnet50_firstapp/ out /main] Error 1 CMakeFiles /Makefile2: 67 : recipe for target ' CMakeFiles/main.dir/all ' failed make[ 1 ]: *** [CMakeFiles/main.dir/all] Error 2 Makefile: 129 : recipe for target ' all ' failed
编译应用源码依赖定义AscendCL接口的库文件,样例中的编译脚本会根据{NPU_HOST_LIB}环境变量指向的路径查找编译依赖的库文件,当前报错提示找不到库文件,则可能是{NPU_HOST_LIB}环境变量配置不正确.
1、登录编译源码的环境,使用如下命令查看{ NPU_HOST_LIB}环境变量的值.
echo $NPU_HOST_LIB
回显信息示例如下:
/home/HwHiAiUser/Ascend/ascend-toolkit/latest/runtime/lib64/stub
若无回显信息,则环境变量未配置,跳转到第3步配置该环境变量.
2、根据第1步中获取到的{NPU_HOST_LIB}环境变量值,检查{NPU_HOST_LIB}环境变量指向的路径以及该路径下的libascendcl.so库文件是否存在.
检查路径是否存在时,可直接切换到该目录下看是否成功,命令示例如下:
cd /home/HwHiAiUser/Ascend/ascend-toolkit/latest/runtime/lib64/stub
若目录存在,可直接执行以下命令检查libascendcl.so是否存在:
ll libascendcl.so
若路径或头文件不存在,则需跳转到第3步重新配置{NPU_HOST_LIB}环境变量.
export NPU_HOST_LIB=$HOME/Ascend/ascend-toolkit/latest/runtime/lib64/stub
例如,当开发环境为X86架构、运行环境为AArch64架构时,则涉及交叉编译,需在开发环境上安装AArch64架构的软件包,将{DDK_PATH}环境变量的路径指向AArch64架构的软件包安装目录(如下所示),便于使用与运行环境架构相同的软件包中的头文件来编译代码.
export NPU_HOST_LIB=$HOME/Ascend/ascend-toolkit/latest/ arm64-linux/runtime/lib64/stub
注意:
若找不到libascendcl.so文件,则需要重新安装“Ascend-cann-toolkit”包.
当环境上安装多个软件版本时,请根据实际情况选择版本,其中,latest目录默认指向最后安装的软件版本.
当同一个版本下有多个libascendcl.so文件时,是由于兼容旧版本的原因,其中部分文件是软链接,方便用户在旧版本下编译应用源码.
用户进程报错并退出.
查看应用类日志,提示获取Device信息失败,最终导致AscendCL初始化失败,日志片段示例如下:
[ERROR] RUNTIME( 89696 ,main): 2023 - 03 - 07 - 17 : 13 : 27.994 . 635 [runtime.cc: 1065 ] 89696 CheckHaveDevice:[INIT][DEFAULT]Call halGetDeviceInfo failed: drvRet= 4 , module type= 0 , info type= 1 . [ERROR] ASCENDCL( 89696 ,main): 2023 - 03 - 07 - 17 : 13 : 27.994 . 723 [acl.cpp: 164 ] 89696 aclInit: [INIT][DEFAULT][Init][Version]init soc version failed, ret = 507008 [ERROR] RUNTIME( 89696 ,main): 2023 - 03 - 07 - 17 : 13 : 27.994 . 774 [api_impl.cc: 3490 ] 89696 GetDevErrMsg:report error module_type= 3 , module_name= EE8888 [ERROR] RUNTIME( 89696 ,main): 2023 - 03 - 07 - 17 : 13 : 27.994 . 798 [api_impl.cc: 3490 ] 89696 GetDevErrMsg:ctx is NULL! [ERROR] RUNTIME( 89696 ,main): 2023 - 03 - 07 - 17 : 13 : 27.994 . 827 [api_impl.cc: 3546 ] 89696 GetDevMsg:Failed to GetDeviceErrMsg, retCode= 0x7070001 . [ERROR] RUNTIME( 89696 ,main): 2023 - 03 - 07 - 17 : 13 : 27.994 . 849 [logger.cc: 1348 ] 89696 GetDevMsg:GetDeviceMsg failed, getMsgType= 0 . [ERROR] RUNTIME( 89696 ,main): 2023 - 03 - 07 - 17 : 13 : 27.994 . 888 [api_c.cc: 3595 ] 89696 rtGetDevMsg:ErrCode= 107002 , desc=[context pointer null ], InnerCode= 0x7070001 [ERROR] RUNTIME( 89696 ,main): 2023 - 03 - 07 - 17 : 13 : 27.994 . 910 [error_message_manage.cc: 49 ] 89696 FuncErrorReason:report error module_type= 3 , module_name= EE8888 [ERROR] RUNTIME( 89696 ,main): 2023 - 03 - 07 - 17 : 13 : 27.994 . 932 [error_message_manage.cc: 49 ] 89696 FuncErrorReason:rtGetDevMsg execute failed, reason=[context pointer null ] EL0003: The argument is invalid. Solution: Try again with a valid argument. TraceBack (most recent call last): [Init][Version]init soc version failed, ret = 507008 [FUNC:ReportInnerError][FILE:log_inner.cpp][LINE: 145 ] ctx is NULL![FUNC:GetDevErrMsg][FILE:api_impl.cc][LINE: 3490 ] rtGetDevMsg execute failed, reason =[context pointer null ][FUNC:FuncErrorReason][FILE:error_message_manage.cc][LINE: 49 ] [ERROR] acl init failed [ERROR] Sample init resource failed
可能存在以下原因:
1.先首,确认Device是否正常启动.
cat /etc/ascend_install.info
在该文件中,Driver_Install_Path_Param表示Driver包的安装路径.
./upgrade-tool --device_index -
1
--system_version
正常查询返回信息类似如下:
。
2.其次,检查运行应用程序的用户权限是否正确.
要求运行应用程序的用户,需与Driver运行用户在一个属组内。在“cat /etc/passwd”文件中,可查看用户属组,Driver的默认运行用户为HwHiAiUser.
修改用户属组的命令示例如下:
./upgrad usermod -g 组名 用户名
3.如果以上方法解决不了问题,则需要参考如下步骤将获取日志,并在 modelzoo仓 通过提Issue反馈给华为工程师.
export ASCEND_GLOBAL_LOG_LEVEL=
0
命令示例如下,其中deviceID需要设置为指定Device的ID:
msnpureport -g debug -d deviceID
[1]昇腾文档中心: https://www.hiascend.com/zh/document 。
[2]昇腾社区在线课程: https://www.hiascend.com/zh/edu/courses 。
[3]昇腾论坛: https://www.hiascend.com/forum 。
。
点击关注,第一时间了解华为云新鲜技术~ 。
。
最后此篇关于实践分析丨AscendCL应用编译&运行案例的文章就讲到这里了,如果你想了解更多关于实践分析丨AscendCL应用编译&运行案例的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
本文分享自华为云社区《大模型LLM之分布式训练》,作者: 码上开花_Lancer。 随着语言模型参数量和所需训练数据量的急速增长,单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训
本文分享自华为云社区《五大基础算法--动态规划法》,作者: 大金(内蒙的)。 一、基本概念 动态规划法,和分治法极其相似。区别就是,在求解子问题时,会保存该子问题的解,后面的子问题求解时,可以直接拿来
pip install scp pip install pexpect 测试代码: import os import stat import paramiko # 用于调用scp命令 def s
我目前正在实现“ token ”REST 服务。 token 只是一个字符串,由一些参数构建而成,然后经过哈希处理并在一定时间后过期。 我想在我的 REST 服务中有一个可以验证 token 的端点,
打开软删除后,我在客户端上添加一条记录,推送,删除添加的记录推送,然后尝试使用与初始记录相同的主键添加新记录(然后推送),我得到一个异常(exception)。 EntityDomainManager
打开软删除后,我在客户端上添加一条记录,推送,删除添加的记录推送,然后尝试使用与初始记录相同的主键添加新记录(然后推送),我得到一个异常(exception)。 EntityDomainManager
我有一个应用程序,每 x 秒接收一次天气信息。我想将此数据保存到 XML 文件中。 我应该为每个天气通知创建一个新的 XML 文件,还是将每个通知附加到同一个 XML 文件中?我不确定 XML 标准的
我猜我们大多数人都必须在某个时候处理这个问题,所以我想我会问这个问题。 当您的 BLL 中有很多集合并且您发现自己一遍又一遍地编写相同的旧内联(匿名)谓词时,显然有必要进行封装,但实现封装的最佳方
我有一些 c# 代码已经运行了一段时间了..我不得不说,虽然我了解 OO 原则的基础知识,但显然有不止一种方法可以给猫剥皮(尽管我讨厌那个短语!)。 因此,我有一个基本抽象类作为基本数据服务类,如下所
我设计了一个 SQL 数据库系统(使用 Postgre),我有一个问题,即创建一个关系/引用的常见做法是什么,这种关系/引用即使在引用的对象被删除时也能持续存在。 比如有一个UserORM,还有Act
我们的目标是搜索用户输入的字符串并计算在其中找到多少元音。不幸的是我被困在这里,有什么帮助吗? def numVowels(s): vowels= "AEIOUaeiou" if s
我有一个适用于我的“items”int 数组的旋转函数。下面的代码完成了它,除了我不必要地传输值。我正在努力实现“就地”轮换。我的意思是 ptrs 会递增或递减,而不是从数组中获取值。我需要通过这种方
我有一个 json 存储在我的应用程序文档文件夹中,我需要在我的所有 View 中使用它。我正在加载 json 并将其添加到每个 View 中的 NSMutableArray。但现在我了解到,我可以将
我用 C++ 开始了一个项目。这种语言的内存管理对我来说是新的。 我过去常常使用 new () 创建对象,然后传递指针,虽然它可以工作,但调试起来很痛苦,人们看到代码时会用有趣的眼神看着我。我为它没有
已结束。 这个问题是 off-topic .它目前不接受答案。 想要改进这个问题? Update the question所以它是on-topic堆栈溢出。 关闭 10 年前。 Improve thi
保持类松散耦合是编写易于理解、修改和调试的代码的一个重要方面——我明白这一点。然而,作为一个新手,几乎任何时候我都会超越我所苦苦挣扎的最简单的例子。 我或多或少地了解如何将字符串、整数和简单数据类型封
我发现我需要编写大量重复代码,因为我无法从其他 Controller 调用函数。例如,这里新闻提要内容在我的代码中重复,我对一个 Controller 做一些特定的事情,然后需要像这样加载我的新闻提要
假设需要一种数字数据类型,其允许值在指定范围内。更具体地说,假设要定义一个整数类型,其最小值为0,最大值为5000。这种情况在很多情况下都会出现,例如在对数据库数据类型,XSD数据类型进行建模时。 在
假设我想循环整个数组来访问每个元素。使用 for 循环、for...in 循环或 for...of 循环是 JavaScript 开发人员的标准做法吗? 例如: var myArray = ["app
我有一个旧的 SL4/ria 应用程序,我希望用 Breeze 取代它。我有一个关于内存使用和缓存的问题。我的应用程序加载工作列表(一个典型的用户可以访问大约 1,000 个这些工作)。此外,还有很多
我是一名优秀的程序员,十分优秀!