您的位置：首页 > 其它

lib文件格式分析，以及从lib文件提取obj的思路和源码

2011-12-28 19:56 387 查看

from:http://bbs.pediy.com/showthread.php?t=63585

最近在学习ida，有时候需要从lib文件里面提取sig，方便我们查看函数的名称。但是手工的办法只能一个个obj提取，虽然可以使用批处理，但是偶尔碰到错误的coff文件，还是需要人手工干预，所以写了这么一个小工具，顺带学习了一下lib文件的结构。

lib文件最开头，由8个字符串开始，值为“!<arch>\n”。接下来由4个不同类型的区段组成（不是四个区段），依次排列下来是First Section（一个）, Second Section（一个）, Long Section（一个）, Obj Section（包含有多少个obj文件，就有多少个obj section）。

区段头都是以这样的一个结构体开始。

typedef struct

{

char Name[16]; // 名称

char Time[12]; // 时间

char UserID[6]; // 用户ID

char GroupID[6]; // 组ID

char Mode[8]; // 模式

char Size[10]; // 长度

char EndOfHeader[2];// 结束符

} SectionHeader;

要从文件提取obj文件，我们一般只需要关注第二个区段。这个里面保存了如下的信息：

typedef struct

{

unsigned long ObjNum; // Obj Sec的数量

unsigned long ObjOffset[x]; // 每一个Obj Sec的偏移

unsigned long SymbolNum; // 库中符号的数量

unsigned short SymbolIdx
; // 符号在ObjOffset表中的索引

char StrTable[m]; // 符号名称字符串表

}SecondSec;

但是我们却不能直接去读取他，因为

ObjOffset[x]; // 每一个Obj Sec的偏移

长度是不固定的，取决于

ObjNum; // Obj Sec的数量

而且，first section的长度也是不固定的。这怎么办呢？

我的解决办法如下：

first section和second section都以

char szSecName[16] = {'/', 0x20, 0x20, 0x20, 0x20, 0x20, 0x20, 0x20, 0x20,0x20, 0x20, 0x20, 0x20, 0x20, 0x20, 0x20};

这样的形式开头。

我就定义了一个char，一个个字节去读取，遇到'/'就判断后面是不是15个0x20，如果读了2次这样的结构，那么说明到了second section，马上读后面的内容。这就是ObjNum，也就是obj的数量。

然后去申请一块内存，用来存储ObjOffset[x]; // 每一个Obj Sec的偏移

ULONG* m_offset = new ULONG[ObjNum]，然后从文件里面将obj偏移读取到这个数组。

请注意，这些偏移值，并不是由小到大排列的，所以得自己排列一次。

用第二个偏移减去第一个偏移，得到的就是第一个obj section的大小（不是obj文件的大小）。因为每个obj section前面还有一个SectionHeader结构体，所以obj文件真正的偏移是：

读出来的偏移 offset + sizeof(SectionHeader)，从这里开始读，才是obj文件的首地址。

下面的事情就简单了，一点点的写到各个文件，即可。

From:武汉科锐

代码在下面，没有使用多线程，所以obj文件过多的时候，运行的时候会稍慢，嘿嘿。有不正确的地方，或者有更好的算法，请多多指教！

http://img.jpg.name/twdwsdtjztwwthhy...wzwtrwtrrj.rar

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航