您的位置:首页 > 编程语言

学习ARM反汇编工具objdump和一个简单实例

2017-10-28 10:09 337 查看
学习ARM反汇编工具objdump和一个简单实例

                                                                         --参考朱有鹏ARM裸机编程

1、反汇编的原理&为什么需要反汇编
arm-linux-objdump -D led.elf > led_elf.dis
objdump是gcc工具链中的反汇编工具,作用是由编译链接好的elf
格式的可执行程序,来反过来得到汇编源代码。

-D表示反汇编。

>左边的是ELF的可执行程序(反汇编时候的原材料)
>右边的是反汇编生成的反汇编程序。其实就是一个汇编语言。

一般情况下我们写一个源代码

类似于我们WINDOW里面是EXE的格式,PE格式是官方的名字。

2、为什么我们需要进行反汇编,我们要的就是可执行程序。

反汇编的原因有以下:
1、逆向破解
你想盗版的原来的程序,最终得到程序的源代码。
2、调式程序的时候,反汇编代码可以帮助我们理解程序。
(我们学习时使用objdump主要目的是这个),
尤其是在理解链接脚本,链接地址等概念时候。
尤其是在理解链接的时候,用反汇编对你的理解非常大。

如果你是C语言写的源代码,反汇编之后得到的汇编语言的源代码,
可以有助于你理解C和汇编之间的关系,
非常有助于理解深入理解C语言。

3、反汇编文件的分析:

(1)第一个是标号比如000000这些是代表当前的地址

(2)第二个标号比如e59f0050:代表的是机器码的意思,其实我们写的所有的可执行程序都是机器码

只不过汇编语言就是相当于一句汇编语言对应一个机器码,这样我们编程就不用像以前那么辛苦了。

0: e59f0050 ldr r0, [pc, #80] ; 58 <delay_loop+0x10>这句话是
ldr r0, =0x11111111 // 从后面的=可以看出用的是ldr伪指令,因为需要编译器来判断这个数
编译器翻译出来就是上面的一句话,0x11111111这个数是ARM伪指令提供的。

那么到底机器把这句话放置在哪里呢?

把这句话放置在58这个地址中,后面已经有注释了:

再往下看58地址中,可以看到显示11111111

led.elf: file format elf32-littlearm

Disassembly of section .text:

00000000 <_start>:
0: e59f0050 ldr r0, [pc, #80] ; 58 <delay_loop+0x10>
4: e59f1050 ldr r1, [pc, #80] ; 5c <delay_loop+0x14>
8: e5810000 str r0, [r1]

0000000c <flash>:
c: e3e00008 mvn r0, #8
10: e59f1048 ldr r1, [pc, #72] ; 60 <delay_loop+0x18>
14: e5810000 str r0, [r1]
18: eb000008 bl 40 <delay>
1c: e3e00010 mvn r0, #16
20: e59f1038 ldr r1, [pc, #56] ; 60 <delay_loop+0x18>
24: e5810000 str r0, [r1]
28: eb000004 bl 40 <delay>
2c: e3e00020 mvn r0, #32
30: e59f1028 ldr r1, [pc, #40] ; 60 <delay_loop+0x18>
34: e5810000 str r0, [r1]
38: eb000000 bl 40 <delay>
3c: eafffff2 b c <flash>

00000040 <delay>:
40: e59f201c ldr r2, [pc, #28] ; 64 <delay_loop+0x1c>
44: e3a03000 mov r3, #0

00000048 <delay_loop>:
48: e2422001 sub r2, r2, #1
4c: e1520003 cmp r2, r3
50: 1afffffc bne 48 <delay_loop>
54: e1a0f00e mov pc, lr
58: 11111111 tstne r1, r1, lsl r1
5c: e0200240 eor r0, r0, r0, asr #4
60: e0200244 eor r0, r0, r4, asr #4
64: 00895440 addeq r5, r9, r0, asr #8

Disassembly of section .ARM.attributes:

00000000 <.ARM.attributes>:
0: 00001a41 andeq r1, r0, r1, asr #20
4: 61656100 cmnvs r5, r0, lsl #2
8: 01006962 tsteq r0, r2, ror #18
c: 00000010 andeq r0, r0, r0, lsl r0
10: 45543505 ldrbmi r3, [r4, #-1285] ; 0x505
14: 08040600 stmdaeq r4, {r9, sl}
18: Address 0x00000018 is out of bounds.

4、反汇编文件的格式和看法

标号地址、标号名字、指令地址、指令机器码
指令机器码反汇编到的指令

扩展:ARM汇编中用地址池的方式实现非法立即数。

指令和地址是一一对应的,
我们下载烧录的bin文件,内部其实就是
一条一条的指令机器码,这些指令每一条都有一个指令地址。
这个地址是连接的ld给根据我们写的链接脚本来指定的。

-Ttext  :指定我们的起始地址的。

所有的地址都从别的地址开始执行,根据你的地址来执行。

5、展望:反汇编工具帮助我们分析链接脚本

反汇编的时候得到的地址是链接器考虑了链接脚本之后得到的地址,而

我们写代码是通过指定链接脚本来让链接器给我们链接合适的地址。

但是有时候我们写的链接脚本有误,或者我们不知道

这个链接脚本会怎么样?

这时候可以通过看反汇编文件分析这个链接脚本的效果。

看是不是我们想要的,如果不是的话可以改了再看。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息