7.从0学ARM-GNU伪指令、代码编译，lds使用

痴情uu · 发表于 2021-3-29 20:30:42

我们在学习汇编代码的时候经常会看到以下两种风格的代码：
gnu代码开头是：
.global _start_start: @汇编入口 ldr sp,=0x41000000.end @汇编程序结束MDK代码开头是：
AREA Example,CODE,READONLY ;声明代码段Example ENTRY ;程序入口Start MOV R0,#0 OVER END这两种风格的代码是要使用不同的编译器，我们之前的实例代码都是MDK风格的。
那么多对于我们初学者来说要学习哪种风的呢？答案是肯定的，学习GNU风格的汇编代码，因为做Linux驱动开发必须掌握的linux内核、uboot，而这两个软件就是GNU风格的。
为了大家不要把过多精力浪费在暂时没用的知识上，下面我们只讲GNU风格汇编。
标号只能由a～z，A～Z，0～9，“.”，_等（由点、字母、数字、下划线等组成，除局部标号外，不能以数字开头）字符组成，标号的后面加“：”。
段内标号的地址值在汇编时确定；段外标号的地址值在连接时确定。局部标号主要在局部范围内使用而且局部标号可以重复出现。它由两部组成开头是一个0-99直接的数字局部标号后面加“:”
F：指示编译器只向前搜索，代码行数增加的方向 / 代码的下一句B：指示编译器只向后搜索，代码行数减小的方向注意局部标号的跳转，就近原则 举例：
文件位置arch/arm/kernel/entry-armv.S

数据定义伪操作一般用于为特定的数据分配存储单元，同时可完成已分配存储单元的初始化。常见的数据定义伪操作有如下几种：
标号含义.byte单字节定义 0x12,‘a’,23 【必须偶数个】.short定义2字节数据 0x1234,65535.long /.word定义4字节数据 0x12345678.quad定义8字节 .quad 0x1234567812345678.float定义浮点数 .float 0f3.2.string/.asciz/.ascii定义字符串 .ascii “abcd\0”, 注意：.ascii 伪操作定义的字符串需要每行添加结尾字符 '\0'，其他不需要.space/.skip用于分配一块连续的存储区域并初始化为指定的值，如果后面的填充值省略不写则在后面填充为0;.rept重复执行接下来的指令，以.rept开始，以.endr结束
【举例】
.word
val: .word 0x11223344mov r1,#val ;将值0x11223344设置到寄存器r1中.space
label: .space size,expr ;expr可以是4字节以内的浮点数 a: space 8, 0x1.rept
.rept cnt ;cnt是重复次数 .endr注意：

变量的定义放在，stop后，.end前
标号是地址的助记符，标号不占存储空间。位置在end前就可以，相对随意。

语法结构
.if logical-expressing …… .else …….endif 类似c语言里的条件编译。
【举例】
.macro，.endm 宏定义类似c语言里的宏函数。
macro伪操作可以将一段代码定义为一个整体，称为宏指令。然后就可以在程序中通过宏指令多次调用该段代码。
语法格式：
.macro {$label} 名字{$parameter{,$parameter}…} ……..code .endm其中，$标号在宏指令被展开时，标号会被替换为用户定义的符号。
宏操作可以使用一个或多个参数，当宏操作被展开时，这些参数被相应的值替换。
注意：先定义后使用
举例：
【例1】：没有参数的宏实现子函数返回
.macro MOV_PC_LR MOV PC,LR .endm调用方式如下： MOV_PC_LR【例2】：带参数宏实现子函数返回
.macro MOV_PC_LR ,param mov r1,\param MOV PC,LR .endm调用方法如下:
标号含义.global/用来声明一个全局的符号.arm定义一下代码使用ARM指令集编译.thumb定义一下代码使用Thumb指令集编译.section.section expr 定义一个段。expr可以使.text .data. .bss.text.text {subsection} 将定义符开始的代码编译到代码段.data.data {subsection} 将定义符开始的代码编译到数据段,初始化数据段.bss.bss {subsection} 将变量存放到.bss段,未初始化数据段.align.align{alignment}{,fill}{,max} 通过用零或指定的数据进行填充来使当前位置与指定边界对齐.align 4 --- 16字节对齐 2的4次方.align (4) --- 4字节对齐.org.org offset{,expr} 指定从当前地址加上offset开始存放代码，并且从当前地址到当前地址加上offset之间的内存单元，用零或指定的数据进行填充.extern用于声明一个外部符号，用于兼容性其他汇编.code 32同.arm.code 16同.thumb.weak用于声明一个弱符号，如果这个符号没有定义，编译就忽略，而不会报错.end文件结束.include.include “filename” 包含指定的头文件, 可以把一个汇编常量定义放在头文件中.equ格式：.equ symbol, expression把某一个符号(symbol)定义成某一个值(expression).该指令并不分配空间，类似于c语言的 #define.set给一个全局变量或局部变量赋值，和.equ的功能一样
举例： .set
.set start, 0x40mov r1, #start ;r1里面是0x40举例 .equ
.equ start, 0x40 mov r1, #start ;r1里面是0x40 #define PI 3.1415等价于
.equ PI, 31415

ADR伪指令：该指令把标签所在的地址加载到寄存器中。 ADR伪指令为小范围地址读取伪指令，使用的相对偏移范围：当地址值是字节对齐 (8位) 时，取值范围为-255～255，当地址值是字对齐 (32位) 时，取值范围为-1020～1020。语法格式:

ADR{cond} register,label ADR R0, lableADRL伪指令为中等范围地址读取伪指令。使用相对偏移范围：当地址值是字节对齐时，取值范围为-64～64KB；当地址值是字对齐时，取值范围为-256～256KB
语法格式：
ADRL{cond} register,labelADRL R0，lable

LDR伪指令: LDR伪指令装载一个32位的常数和一个地址到寄存器。语法格式：

LDR{cond} register,=LDR R0，=0XFFFF0000 ； mov r1,#0x12 对比一下注意：（1）ldr伪指令和ldr指令区分下面是ldr伪指令：
ldr r1,=val @ r1 = val 是伪指令，将val标号地址赋给r1 【与MDK不一样，MDK只支持ldr r1,=val】下面是ldr指令：
ldr r2,val @ r1 = *val 是arm指令,将标号val地址里的内容给r2val: .word 0x11223344（2）如何利用ldr伪指令实现长跳转
ldr pc，=32位地址（3）编码中解决非立即数的问题用arm伪指令ldr
ldr r0,=0x999 ；0x999 不是立即数，假设我们有以下代码，包括1个main.c文件，1个start.s文件： start.s
.global _start_start: @汇编入口 ldr sp,=0x41000000 b main.global mystrcopy.textmystrcopy: //参数dest->r0,src->r2 LDRB r2, , #1 STRB r2, , #1 CMP r2, #0 //判断是不是字符串尾 BNE mystrcopy MOV pc, lrstop: b stop @死循环，防止跑飞等价于while(1).end @汇编程序结束main.c
extern void mystrcopy(char *d,const char *s);int main(void){ const char *src ="yikoulinux"; char dest={}; mystrcopy(dest,src);//调用汇编实现的mystrcopy函数 while(1); return 0;}Makefile编写方法如下：
1. TARGET=start 2. TARGETC=main3. all:4. arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGETC).o $(TARGETC).c5. arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGET).o $(TARGET).s6. #arm-none-linux-gnueabi-gcc -O0 -g -S -o $(TARGETC).s $(TARGETC).c 7. arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Ttext 0x40008000 -o $(TARGET).elf8. arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin9. clean:10. rm -rf *.o *.elf *.dis *.binMakefile含义如下：

定义环境变量TARGET=start，start为汇编文件的文件名
定义环境变量TARGETC=main，main为c语言文件
目标：all，4~8行是该指令的指令语句
将main.c编译生成main.o,$(TARGETC)会被替换成main
将start.s编译生成start.o,$(TARGET)会被替换成start
4-5也可以用该行1条指令实现
通过ld命令将main.o、start.o链接生成start.elf,-Ttext 0x40008000表示设置代码段起始地址为0x40008000
通过objcopy将start.elf转换成start.bin文件，-O binary (或--out-target=binary) 输出为原始的二进制文件,-S (或 --strip-all)输出文件中不要重定位信息和符号信息，缩小了文件尺寸，
clean目标
clean目标的执行语句，删除编译产生的临时文件

【补充】

gcc的代码优化级别，在 makefile 文件中的编译命令 4级 O0 -- O3 数字越大，优化程度越高。O3最大优化
volatile作用 volatile修饰的变量，编译器不再进行优化，每次都真正访问内存地址空间。

实际的工程文件，段复杂程度远比我们这个要复杂的多，尤其Linux内核有几万个文件，段的分布及其复杂，所以这就需要我们借助lds文件来定义内存的分布。

文件列表
main.c和start.s和上一节一致。
map.lds
OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm")/*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/OUTPUT_ARCH(arm)ENTRY(_start)SECTIONS{ . = 0x40008000; . = ALIGN(4); .text : { .start.o(.text) *(.text) } . = ALIGN(4); .rodata : { *(.rodata) } . = ALIGN(4); .data : { *(.data) } . = ALIGN(4); .bss : { *(.bss) }}解释一下上述的例子:

OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm") 指定输出object档案预设的binary 文件格式。可以使用objdump -i列出支持的binary 文件格式；
OUTPUT_ARCH(arm) 指定输出的平台为arm，可以透过objdump -i查询支持平台；
ENTRY(_start) ：将符号_start的值设置成入口地址；
. = 0x40008000: 把定位器符号置为0x40008000(若不指定, 则该符号的初始值为0)；
.text : { .start.o(.text) *(.text) } :前者表示将start.o放到text段的第一个位置，后者表示将所有(*符号代表任意输入文件)输入文件的.text section合并成一个.text section；
.rodata : { *(.data) } : 将所有输入文件的.rodata section合并成一个.rodata section；
.data : { *(.data) } : 将所有输入文件的.data section合并成一个.data section；
.bss : { *(.bss) } : 将所有输入文件的.bss section合并成一个.bss section；该段通常存放全局未初始化变量
. = ALIGN(4);表示下面的段4字节对齐

连接器每读完一个section描述后, 将定位器符号的值增加该section的大小。
来看下，Makefile应该如何写：
# CORTEX-A9 PERI DRIVER CODE# VERSION 1.0# ATHUOR 一口Linux# MODIFY DATE# 2020.11.17 MakefileCROSS_COMPILE = arm-none-linux-gnueabi-NAME =startCFLAGS=-mfloat-abi=softfp -mfpu=vfpv3 -mabi=apcs-gnu -fno-builtin -fno-builtin-function -g -O0 -c LD = $(CROSS_COMPILE)ldCC = $(CROSS_COMPILE)gccOBJCOPY = $(CROSS_COMPILE)objcopyOBJDUMP = $(CROSS_COMPILE)objdumpOBJS=start.o main.oall: $(OBJS) $(LD) $(OBJS) -T map.lds -o $(NAME).elf $(OBJCOPY) -O binary $(NAME).elf $(NAME).bin $(OBJDUMP) -D $(NAME).elf > $(NAME).dis %.o: %.S $(CC) $(CFLAGS) -c -o $@ $

7.从0学ARM-GNU伪指令、代码编译，lds使用

本帖子中包含更多资源

相关帖子

浏览过的版块