gpt4 book ai didi

c - 写入内核模块时内核非法指令

转载 作者:太空宇宙 更新时间:2023-11-04 03:55:43 25 4
gpt4 key购买 nike

我正在制作一个 FPGA 片上系统系统,我在其中使用内核模块在运行时更改硬件配置。他们的系统使用 Linux 2.6 和 LEON3 CPU (SPARC)。一些位文件工作正常,但对于某些位文件,我收到“内核非法指令”或“无法处理虚拟地址 x 处的内核分页请求”。我很确定我的硬件是正确的,因为我已经用另一种方法对其进行了测试,而我正在更改的硬件与 CPU 无关。我猜这是一个软件/内核模块错误。这发生在我第 14 次进入内核模块的 write 方法之后。我不确定从哪里开始调试。任何帮助将不胜感激。

# cat x > /dev/y
Unable to handle kernel paging request at virtual address 00001000
tsk->{mm,active_mm}->context = 00000045
tsk->{mm,active_mm}->pgd = fc013400
\|/ ____ \|/
"@'/ ,. \`@"
/_| \__/ |_\
\__U_/
cat(86): Oops [#1]
PSR: f30000c7 PC: f0089e90 NPC: f0089e94 Y: 00000000 Not tainted
PC: <vfs_write+0xb8/0x148>
%G: 80080000 00001000 00000001 fd000100 00000dae f09c4370 fbca0000 0000fffb
%O: 00001000 00000003 00001000 fe60e5dc fe60e430 fe60e420 fbca1e80 f0089e80
RPC: <vfs_write+0xa8/0x148>
%L: fbdcad40 00000000 fbca1e78 00000004 fbc0e940 00000000 fbdd2000 f0035784
%I: 00001000 efe07b50 00001000 fbca1f40 00000000 00000000 000007af 000007af
Disabling lock debugging due to kernel taint
Caller[000007af]: 0x7af
Instruction DUMP: d204200c f602600c c416e072 <84088001> 03000010 80a08001 02
800018 b2102002 c404201c
Killed
#

内核模块编写方法:

ssize_t icap_write( struct file *filp, char *buf, size_t count, loff_t *f_pos) {
unsigned long words, data, *pdata, mem_loc_temp;

pdata = (unsigned long *)buf;
mem_loc_temp = icap_mem_loc;//reset mem_loc_temp

while((pdata < (buf + count)) && (mem_loc_temp < icap_mem_loc+4096)){
leon_store_reg(mem_loc_temp,*pdata);
pdata++;
mem_loc_temp+=4;
}
}

我认为这是我的问题。 pdata 超出范围。将其修改为以下内容是否可行?------------更新代码------------

unsigned long *pdata;
static int __init icap_init(void) {
...
pdata = (unsigned long *)kmalloc(mem_size*sizeof(char), GFP_KERNEL);
...
}

ssize_t icap_write( struct file *filp, const char *buf,
size_t count, loff_t *f_pos) {

int i, cycles, spins;
ssize_t result;

if(count%4 != 0){
printk(KERN_INFO "ERROR: count = %d is not a multiple of 4. count mod 4 = %u\n Assuming 0 padding for last word. Configuration may not have completed as expected.",count, count%4);
//return count;
}

result = copy_from_user(pdata, buf, count);
if (result) {
printk(KERN_INFO "copy_from_user failed, returned: %d\n.", result);
return -EINVAL;
}
spins = 0;
while((leon_load_reg(ctrl_mem_loc+8) & 0x10) == 0){//check done
spins++;//spin on NOT done
}
if (spins > 0)
printk(KERN_INFO "%d spins\n", spins);

leon_store_reg(ctrl_mem_loc+8, 0);//deassert start

if(count == 4096){
cycles=min((unsigned long)1024, (unsigned long)mem_size/4);
}else if((count > 0) && (count < 4096)){
cycles=min(((unsigned long)count+3)/4, (unsigned long)mem_size/4);
}else{
printk(KERN_INFO "ERROR: count > 4096\n");
cycles = 0;
}

for(i = 0; i < cycles; i++){
leon_store_reg(icap_mem_loc+4*i, pdata[i]);
}

leon_store_reg(ctrl_mem_loc, cycles);//set number of samples
leon_store_reg(ctrl_mem_loc+8, 0x1);//set start high

return count;
}

最佳答案

您可能需要将一些代码放在这里,以便我们更好地帮助您。

我的第一个猜测是您的代码某处覆盖了一个数组,当您点击第 14 个条目时,它点击了系统需要的内容并导致异常。如果可能的话,跟踪你的程序,看看它是否在写它应该写的地方。不同的文件将位于内存中的不同位置,如果这些区域不是系统关键区域,则可以解释为什么它们不会崩溃而这个会崩溃。

故障转储中的一件有趣的事情:

无法处理虚拟地址 00001000 处的内核分页请求

这是十进制的 4096 - 与 while 循环中的偏移量相同。所以也许那里发生了一些事情,但您的代码似乎没有修复它,并且可能会使情况变得更糟,因为在您的 while 循环中有 2 个条件需要注意。

随着代码的变化而更新

如果基指针未long 对齐,则将pdata 转换为unsigned long * 可能不安全。不确定您的系统是否允许未对齐的内存访问,所以要小心。

icap_mem_loc 是未知类型但似乎是整数值?如果是这样,处理整数值和指针就是在自找麻烦。

您在 while 循环中将无符号长指针与无符号字符指针进行比较 - 可能是安全的,但请注意此处的指针运算。

您是否在启用警告的情况下编译此代码?如果没有,请这样做,因为我确定它会针对上述问题大喊大叫......

如果 icap_mem_loc 为 NULL 或 0 会怎样?如果这是一个错误情况,您需要处理它 - 您的页面请求有点推断这是一个错误的情况并且您没有任何 ASSERT 或 if 条件来处理它。

最后,mem_loc_temp+=4; 4 - 你确定 long 的大小是 4 字节吗你的系统。应该是 sizeof() 或更好的,一个 longptr++ contrust 而不是消除歧义。

不是要在这里攻击你,而是指出我看到的每一个潜在的故障点,以便我们可以为你解决这个问题。

关于c - 写入内核模块时内核非法指令,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16596430/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com