RISC-V Linux汇编启动过程分析

risc-v linux的汇编启动部分比较简单，不算复杂。有两个部分比较核心：页表创建和重定向。页表创建是用c语言写的，今天先分析汇编部分，先带大家分析整体汇编启动流程，然后分析重定向。
注意：本文基于linux5.10.111内核
汇编启动流程先从整体分析汇编做的事情，有个大体框架。
路径：arch/riscv/kernel/head.s，入口是entry(_start_kernel)
从entry(_start_kernel)开始进行启动前的一些初始化，建立页表前的主要工作：
关闭所有中断/* 关闭所有中断 */ csrw csr_ie, zero csrw csr_ip, zero
加载全局指针gp/* 加载全局指针gp */.option push.option norelax la gp, __global_pointer$.option pop
disable fpu/* 禁用 fpu 以检测内核空间中浮点的非法使用*/ li t0, sr_fs csrc csr_status, t0
选择一个核启动/* 选择一个核启动 */ la a3, hart_lottery li a2, 1 amoadd.w a3, a2, (a3) bnez a3, .lsecondary_start
清楚bss段/* 清除bss */ la a3, __bss_start la a4, __bss_stop ble a4, a3, clear_bss_done
保存hart id和dtb地址/* 保存hatr id和dtb地址，hart id保存到a0，dtb地址保存到a1 */ mv s0, a0 mv s1, a1 la a2, boot_cpu_hartid
设置sp指针 la sp, init_thread_union + thread_size
上述工作完成，会开始临时页表的创建，跳转到c函数setup_vm建立临时页表 mv a0, s1 call setup_vm // 跳转到c函数setup_vm，setup_vm会创建临时页表
重定向#ifdef config_mmu la a0, early_pg_dir call relocate //重定向，实际就是开启mmu#endif
设置异常向量地址，重载c环境 call setup_trap_vector/* 重载c环境 */ la tp, init_task sw zero, task_ti_cpu(tp) la sp, init_thread_union + thread_size
最后跳转到c函数start_kernel，开始c语言部分初始化，汇编部分执行完毕tail start_kernel
完整_start_kernel汇编代码：
entry(_start_kernel) /* 关闭所有中断 */ csrw csr_ie, zero csrw csr_ip, zero /* 在源码中，这里有一个m模式处理的宏，这里没有用到，直接跳过*/ /* 加载全局指针gp */.option push.option norelax la gp, __global_pointer$.option pop /* 禁用 fpu 以检测内核空间中浮点的非法使用*/ li t0, sr_fs csrc csr_status, t0#ifdef config_smp li t0, config_nr_cpus blt a0, t0, .lgood_cores tail .lsecondary_park.lgood_cores:#endif /* 选择一个核启动 */ la a3, hart_lottery li a2, 1 amoadd.w a3, a2, (a3) bnez a3, .lsecondary_start /* 清除bss */ la a3, __bss_start la a4, __bss_stop ble a4, a3, clear_bss_doneclear_bss: reg_s zero, (a3) add a3, a3, riscv_szptr blt a3, a4, clear_bssclear_bss_done: /* 保存hatr id和dtb地址，hart id保存到a0，dtb地址保存到a1 */ mv s0, a0 mv s1, a1 la a2, boot_cpu_hartid reg_s a0, (a2) /* 初始化页表，然后重定向到虚拟地址 */ la sp, init_thread_union + thread_size mv a0, s1 call setup_vm // 跳转到c函数setup_vm，setup_vm会创建临时页表#ifdef config_mmu la a0, early_pg_dir call relocate //重定向，实际就是开启mmu#endif /* config_mmu */ call setup_trap_vector /* 重载c环境 */ la tp, init_task sw zero, task_ti_cpu(tp) la sp, init_thread_union + thread_size#ifdef config_kasan call kasan_early_init#endif /* start the kernel */ call soc_early_init tail start_kernel //跳转到c函数start_kernel，开始c语言部分初始化
汇编中非常重要的一个部分就是页表的创建，关乎着后面的程序能不能继续往下跑。setup_vm创建页表后就会开始执行relocate重定向，这个重定向主要开启mmu，下面分析relocate的汇编。
relocate relocate重定向，就是在开启mmu。开启mmu的操作就是将一级页表的地址以及权限写到satp寄存器中，这就算开启mmu了。
#ifdef config_mmu la a0, early_pg_dir //跳转到relocate前，先把第一级页表early_pg_dir的地址存入a0 call relocate //跳转到relocate,开启mmu#endif
relocate有两次开启mmu的操作，第一次开启mmu使用的是setup_vm()建立的trampoline_gd_dir页表，这页表保存的是kernel的前2m内存。第二次开启mmu使用的是early_pg_dir页表，这个页表映射了整个kernel内存以及dtb的4m空间。
如果trampoline_pg_dir或者early_pg_dir这两个页表的映射没弄好的话，开启mmu的时候就会失败，所以页表的建立十分关键。页表创建后续再深究，下面分析relocate汇编代码。
计算返回地址
返回地址就是ra加上虚拟地址和物理地址之间的偏移量，这个是固定偏移量。page_offset是kernel入口地址对应的虚拟地址，_start就是kernel入口地址的虚拟地址，page_offset - _start就得到它们之间的偏移，然后再和ra相加，就是返回地址。
/* relocate return address */ li a1, page_offset la a2, _start sub a1, a1, a2 add ra, ra, a1
将异常入口1f的虚拟地址写入stvec寄存器
因为一旦开启mmu，地址都变成了虚拟地址，原来访问的都是物理地址，开启mmu时，地址发生了改变，va != pa，从而进入异常，所以要先设置异常入口地址，此时的异常入口为1f。
/* point stvec to virtual address of intruction after satp write */ la a2, 1f add a2, a2, a1 csrw csr_tvec, a2
提前计算切换到early_pg_dir页表要写入satp的值再进入relocate之前，就已经把early_pg_dir赋值给a0了，所以a0是early_pg_dir。srl是逻辑右移，mmu使用的是sv39，虚拟地址39位，物理地址56位：
低12位是偏移量，所以page_shift等于12，将early_pg_dir地址右移12位存到a2。根据satp寄存器定义：
mode等于0x8代表使用sv39 mmu，0x0代表不进行地址翻译，即不开启mmu。这里stap_mode为sv39，即0x8。将early_pg_dir地址和satp_mode进行或运算后，即可得到写入satp寄存器的值，最后保存到a2。
/* compute satp for kernel page tables, but don't load it yet */ srl a2, a0, page_shift li a1, satp_mode //sv39 mmu or a2, a2, a1
第一次开启mmu，使用trampoline_pg_dir页表satp值的计算和上述是一样的。开启mmu之前，通过sfence.vma命令先刷新tlb。此时开启mmu，就会进入下面的标号为1的汇编段
la a0, trampoline_pg_dir srl a0, a0, page_shift or a0, a0, a1 sfence.vma csrw csr_satp, a0
进入异常1f段，重新设置异常入口为.lsecondary_park，然后切换到early_pg_dir页表，相当于第二次开启mmu。此时，如果之前建立的early_pg_dir页表不对，则会就进入.lsecondary_park。.lsecondary_park里面是个wfi指令，是个死循环。
完整relocate汇编代码：
relocate: /* relocate return address */ li a1, page_offset la a2, _start sub a1, a1, a2 add ra, ra, a1 /* point stvec to virtual address of intruction after satp write */ la a2, 1f add a2, a2, a1 csrw csr_tvec, a2 /* compute satp for kernel page tables, but don't load it yet */ srl a2, a0, page_shift li a1, satp_mode or a2, a2, a1 /* * load trampoline page directory, which will cause us to trap to * stvec if va != pa, or simply fall through if va == pa. we need a * full fence here because setup_vm() just wrote these ptes and we need * to ensure the new translations are in use. */ la a0, trampoline_pg_dir srl a0, a0, page_shift or a0, a0, a1 sfence.vma csrw csr_satp, a0.align 21: /* set trap vector to spin forever to help debug */ la a0, .lsecondary_park csrw csr_tvec, a0 /* reload the global pointer */.option push.option norelax la gp, __global_pointer$.option pop /* * switch to kernel page tables. a full fence is necessary in order to * avoid using the trampoline translations, which are only correct for * the first superpage. fetching the fence is guarnteed to work * because that first superpage is translated the same way. */ csrw csr_satp, a2 sfence.vma ret
总结以上就是risc-v linux的汇编启动流程，虽说risc-v的指令不复杂，但要理解这个汇编启动的部分，还是需要一点基础和时间。另外，大多数人工作中基本用不上汇编，只有真正用上了理解才会比较深。希望本文能够帮助到有需要的人。
以上就是risc-v linux汇编启动过程分析的详细内容。

RISC-V Linux汇编启动过程分析

推荐信息