linux - Linux 内核崩溃消息中的 "Code"是什么？-6ren

linux - Linux 内核崩溃消息中的 "Code"是什么？

转载作者：太空狗更新时间：2023-10-29 11:11:44

在 Linux 内核加载失败后，我有以下堆栈跟踪和崩溃信息:

[    3.684670] ------------[ cut here ]------------
[    3.695507] Bad FPU state detected at fpu__clear+0x91/0xc2, reinitializing FPU registers.
[    3.695508] traps: No user code available.
[    3.704745] invalid opcode: 0000 [#1] PREEMPT
[    3.715304] CPU: 0 PID: 1 Comm: swapper Not tainted 4.19.50-android-x86-geeb7e76-dirty #1
[    3.724594] Hardware name: AAEON UP-APL01/UP-APL01, BIOS UPA1AM21 09/01/2017
[    3.732622] EIP: ex_handler_fprestore+0x2e/0x65
[    3.737807] Code: 00 55 89 e5 57 8b 48 04 8d 44 08 04 89 42 30 80 3d e7 fb a0 c1 00 75 16 c6 05 e7 fb a0 c1 01 50 68 b4 38 87 c1 e8 98 ba 00 00 <0f> 0b 58 5a 90 8d 74 26 00 eb f
[    3.759027] EAX: 0000004d EBX: c103d6f9 ECX: c19a2a48 EDX: c19a2a48
[    3.766169] ESI: df4c7e04 EDI: 00000006 EBP: df4c7c6c ESP: df4c7c60
[    3.773316] DS: 007b ES: 007b FS: 0000 GS: 00e0 SS: 0068 EFLAGS: 00010292
[    3.781044] CR0: 80050033 CR2: c168c6b4 CR3: 1e902000 CR4: 001406d0
[    3.788184] Call Trace:
[    3.791026]  ? fpu__clear+0x91/0xc2
[    3.795037]  fixup_exception+0x61/0x6e
[    3.799348]  do_trap+0x35/0xe9
[    3.802864]  do_invalid_op+0xd9f/0x108a
[    3.807269]  ? atime_needs_update+0x68/0xf5
[    3.812058]  ? touch_atime+0x37/0xbd
[    3.816168]  ? __check_object_size+0x83/0x123
[    3.821153]  ? fpu__clear+0x8e/0xc2
[    3.825166]  ? generic_file_read_iter+0x28d/0x723
[    3.830544]  ? generic_file_read_iter+0x28d/0x723
[    3.835931]  ? __vfs_read+0xe9/0x11f
[    3.840043]  common_exception+0x105/0x10e
[    3.844634] EIP: fpu__clear+0x91/0xc2
[    3.848840] Code: eb 05 e8 b4 f2 fd ff ff 0d 98 a8 99 c1 74 3b 90 8d 74 26 00 eb 07 90 8d 74 26 00 eb 1c 83 c8 ff bf c0 8c a2 c1 89 c2 0f c7 1f <a1> f4 8b a2 c1 ff 0d 98 a8 99 1
[    3.870070] EAX: ffffffff EBX: df4c5900 ECX: 00000000 EDX: ffffffff
[    3.877210] ESI: df4c5900 EDI: c1a28cc0 EBP: df4c7e4c ESP: df4c7e40
[    3.884356] DS: 007b ES: 007b FS: 0000 GS: 00e0 SS: 0068 EFLAGS: 00010286
[    3.892085]  ? do_alignment_check+0x1a/0x1a
[    3.896878]  ? common_exception+0x105/0x10e
[    3.901674]  flush_thread+0x33/0x37
[    3.905684]  flush_old_exec+0x540/0x5f9
[    3.910085]  load_elf_binary+0x24b/0xec1
[    3.914584]  ? pick_next_task_fair+0xdf/0x13a
[    3.919575]  ? __schedule+0x4bb/0x63f
[    3.923780]  ? sched_debug_header+0x45/0x40a
[    3.928666]  ? preempt_schedule+0x2d/0x3c
[    3.933266]  search_binary_handler+0x89/0x1ac
[    3.938259]  load_script+0x184/0x19f
[    3.942366]  search_binary_handler+0x89/0x1ac
[    3.947354]  __do_execve_file+0x454/0x668
[    3.951954]  do_execve+0x1b/0x1d
[    3.955673]  run_init_process+0x31/0x36
[    3.960082]  ? rest_init+0x99/0x99
[    3.963992]  kernel_init+0x5e/0xdf
[    3.967905]  ret_from_fork+0x19/0x30
[    3.972014] Modules linked in:
[    3.975542] ---[ end trace 7d27fceeb3852a38 ]---
[    3.980823] EIP: ex_handler_fprestore+0x2e/0x65
[    3.986014] Code: 00 55 89 e5 57 8b 48 04 8d 44 08 04 89 42 30 80 3d e7 fb a0 c1 00 75 16 c6 05 e7 fb a0 c1 01 50 68 b4 38 87 c1 e8 98 ba 00 00 <0f> 0b 58 5a 90 8d 74 26 00 eb f
[    4.007247] EAX: 0000004d EBX: c103d6f9 ECX: c19a2a48 EDX: c19a2a48
[    4.014387] ESI: df4c7e04 EDI: 00000006 EBP: df4c7c6c ESP: c1afa3b0
[    4.021536] DS: 007b ES: 007b FS: 0000 GS: 00e0 SS: 0068 EFLAGS: 00010292
[    4.029265] CR0: 80050033 CR2: c168c6b4 CR3: 1e902000 CR4: 001406d0
[    4.036413] note: swapper[1] exited with preempt_count 1

代码 是什么意思？我还能知道导致内核崩溃的确切 x86 指令(不是 C 函数)吗？

编辑:更新了代码。我试图在虚拟化环境中运行 Linux。

最佳答案

Code是 x86 机器代码的 hexdump(大概是来自遗留 32 位内核的 32 位模式，因为它只转储了 32 位寄存器内容)。

标记为<>的字节是EIP指向的地方，所以它是ex_handler_fprestore里面的错误指令

将其提供给反汇编程序，例如https://defuse.ca/online-x86-assembler.htm#disassembly2 ，或者Linux的crashdump解码脚本https://elixir.bootlin.com/linux/latest/source/scripts/decodecode

请记住，x86 机器代码使用无法明确向后解码的可变长度编码。但这是编译器生成的代码，所以至少我们可以假设不应该有重叠指令或静态数据与代码混合(因为 x86 对此没有好处)。如果我们在编译器生成的代码中找到函数的开头，则其余指令都将“正常”。

00 byte 看起来像是先前指令的一部分或函数之间的填充:从那里解码会给我们 add BYTE PTR [ebp-0x77],dl这是合理的，in eax,0x57之后不是，对于非驱动程序功能。

更有可能的是 0x89 byte是MOV指令的操作码。

如果我们删除 00字节并从 55 开始(即 push ebp )，我们得到一个正常的函数体，包括如果使用 -Os 编译时您期望的堆栈框架设置序言或 -fno-omit-frame-pointer .

一般来说，您可以一次丢弃一个字节，直到您得到一个看起来正常的解码，该解码至少在错误指令上有一个指令边界。 (但是“看起来很正常”需要一些经验；反汇编可能在开始错误后偶然同步。这对于 x86 机器代码来说并不少见。)

# skipped the 00 byte which would desync decoding
0:  55                      push   ebp
1:  89 e5                   mov    ebp,esp
3:  57                      push   edi
4:  8b 48 04                mov    ecx,DWORD PTR [eax+0x4]      # EAX = 1st function arg, ECX = tmp
7:  8d 44 08 04             lea    eax,[eax+ecx*1+0x4]
b:  89 42 30                mov    DWORD PTR [edx+0x30],eax     # EDX = 2rd function arg
e:  80 3d e7 fb a0 c1 00    cmp    BYTE PTR ds:0xc1a0fbe7,0x0
15: 75 16                   jne    0x2d
17: c6 05 e7 fb a0 c1 01    mov    BYTE PTR ds:0xc1a0fbe7,0x1
1e: 50                      push   eax
1f: 68 b4 38 87 c1          push   0xc18738b4
24: e8 98 ba 00 00          call   0xbac1
29: 0f 0b                   ud2                     ### <=== EIP points here

# stuff after this probably isn't real code; it's unreachable
2b: 58                      pop    eax
2c: 5a                      pop    edx
2d: 90                      nop
2e: 8d 74 26 00             lea    esi,[esi+eiz*1+0x0]
32: eb                      .byte 0xeb

所以这个函数实际上以调用 noreturn 结束。带有堆栈参数的函数。 (32 位 x86 Linux 内核是用 -mregparm=3 构建的，所以前 3 个参数按顺序在 EAX、EDX、ECX 中，所以这个函数不是 regparm 或者它有超过 3 个参数。你可以看到这个函数使用EAX 和 EDX 作为传入参数:在写入之前读取它们。)

但它不是 jmp出于某种原因尾声；也许对于异常回溯，它希望堆栈上有此函数的堆栈帧。 (这可能解释了 push ebp/mov ebp,esp，即使这个内核是用 -fomit-frame-pointer 作为 -O2 的一部分构建的。)

您必须查看 ex_handler_fprestore 的 C 源代码猜猜为什么会这样。

ud2 is an illegal instruction .编译器(或内联 asm？)将它放在那里，因此如果函数返回，它就会出错。这是一个明显的迹象，表明这条执行路径应该是无法到达的，或者被标记为有意陷阱为 assert()。机制的类型。 (在 Linux 中，查找 BUG_ON() )。

关于linux - Linux 内核崩溃消息中的 "Code"是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57206372/

文章推荐： r - ShinyProxy Euler App 未运行 - 无法启动容器

文章推荐： c - "CPU dies"(与硬件无关)是什么意思？

文章推荐： linux - 如何找到我的 Rust 项目的哪一部分使用 GLIBC 2.18

文章推荐： ios - 使用 UIBezierPath 和 CAShapeLayer 时为 "invalid context 0x0"

从阵列转换导致某些 MCU 崩溃，但不会导致其他 MCU 崩溃
我有一段代码看起来像这样: void update_clock(uint8_t *time_array) { time_t time = *((time_t *) &time_array[0]
IOS 崩溃 - 崩溃 EXC_CRASH (SIGABRT) - 错误 109
应用程序崩溃了 :( 请帮助我.. 在这方面失败了。我找不到错误？该应用程序可以连接到 iTunesConnect 但它会出错。谁能根据下面的崩溃报告判断问题出在哪里？ share_with_app
崩溃，我带的实习生把图片直接存到了服务器上
小二是新来的实习生，作为技术 leader，我给他安排了一个非常简单的练手任务，把前端 markdown 编辑器里上传的图片保存到服务器端，结果他真的就把图片直接保存到了服务器上，这下可把我气坏了，就
检查输入字符串是否超过缓冲区限制(崩溃)
我正在创建一个函数，它将目录路径作为参数传递，或者如果它留空，则提示用户输入。我已经设置了我的 PATH_MAX=100 和 if 语句来检查 if ((strlen(folder path) +
FreeType FT_New_Memory_Face 崩溃
我已将“arial.ttf”文件(从我的/Windows/Fonts 文件夹中获取)加载到内存中，但是将其传递到 FT_New_Memory_Face 时会崩溃(在 FT_Open_Face 中的某处
FFmpeg RTSP 崩溃
我正在尝试在我的计算机上的两个控制台之间进行 rtsp 流。在控制台 1 上，我有: ffmpeg -rtbufsize 100M -re -f dshow -s 320x240 -i video=
c++ - SSL_set_tlsext_host_name 崩溃
我正在尝试使用 scio_beast在一个项目中。我知道它还没有完成，但这并不重要。我已经设法让它工作得很好。我现在正在尝试连接到 CloudFlare 后面的服务器，我知道我需要 SNI 才能工作
从下拉列表更改工作表时 VBA 崩溃
我有一个带有关联宏的下拉列表，如下所示: Sub Drop() If Range("Hidden1!A1") = "1" Then Sheets("Sheet1").Se
执行定义与现有命令相同的函数的脚本时，Bash 崩溃
我对 bash 很陌生。我要做的就是运行这个nvvp -vm /usr/lib64/jvm/jre-1.8.0/bin/java无需记住最后的路径。我认为 instafix 就是这样做...... n
增加系统规范时 Apache 崩溃
我在 Windows 上使用 XAMPP 已经两年左右了，它运行完美，没有崩溃没有问题。 (直到四个月前。) 大约四个月前，我们将服务器/系统升级到了更快的规范。这是旧规范的内容 - Windows
在某些后台应用程序中发生 Android 崩溃
我面临着一个非常烦人的 android 崩溃，它发生在大约 1% 的 PRODUCTION session 中，应用程序始终在后台运行。 Fatal Exception: android.app.Re
android - 华为云数据库创建对象类型()崩溃
尝试使用下面的函数: public void createObjectType() { try { mCloudDB.createObjectType(ObjectTypeIn
ColdFusion 11 崩溃
由于我正在进行的一个项目，我在 CF11 管理员中弄乱了类路径，我设法使服务器崩溃，以至于我唯一得到的是一个漂亮的蓝屏和 500 错误.我已经检查了日志，我会把我能做的贴在帖子的底部，但我希望有人会启
升级后 Metasploit 崩溃
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 10 个月前关闭。 Improve
iphone - NSPersistentStoreCoordinator 崩溃
我最近从 xcode 3.x 更新到 4.2，当我在 4.2 中运行应用程序时，我遇到了核心数据问题。我还更新到了 iOS 5，所以问题可能就在那里，我不太确定。这些应用程序在 3.x 中运行良好，
iphone - popToRootViewController 崩溃
我是一个相对较新的 iPhone 应用程序开发人员，所以我的知识有点粗略，所以如果这是一个微不足道的问题，请原谅我。我有一个导航应用程序，它通过在navigationController对象上调用p
iphone - MFMailComposeViewController 崩溃
if ([MFMailComposeViewController canSendMail]) { MFMailComposeViewController *mailViewController
iphone - UILocalNotification 崩溃
你能帮我吗？我正在设置 UILocalNotification，当我尝试设置其 userInfo 字典时，它崩溃了。 fetchedObjects 包含 88 个对象。这是代码: NSDi
iphone - NSFastEnumerationMutationHandler 崩溃
为什么我的代码中突然出现 NSFastEnumeration Mutation Handler 崩溃。我很茫然为什么会突然出现这个崩溃以及如何解决它。最佳答案崩溃错误: **** 由于未捕获的异常
iphone - deleteRowsAtIndexPaths 崩溃
当我从表中删除行时，我的应用程序崩溃了。这是我检测到错误和堆栈跟踪的来源。谢谢! //delete row from database - (void)tableView:(UITableView *

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

linux - Linux 内核崩溃消息中的 "Code"是什么？