刨根问底Objective-C Runtime(3)- 消息 和 Category
2015-07-22 18:52
597 查看
刨根问底Objective-C Runtime(3)- 消息 和 Category
上一篇笔记讲述了objc runtime中Object & Class & Meta Class的细节,本篇笔记主要是讲述objc runtime的消息和
Category。
习题内容
下面的代码会?Compile Error / Runtime Crash / NSLog…?[code]@interface NSObject (Sark) + (void)foo; @end @implementation NSObject (Sark) - (void)foo { NSLog(@"IMP: -[NSObject(Sark) foo]"); } @end int main(int argc, const char * argv[]) { @autoreleasepool { [NSObject foo]; [[NSObject new] foo]; } return 0; }
答案:代码正常输出,输出结果如下:
[code]2014-11-06 13:11:46.694 Test[14872:1110786] IMP: -[NSObject(Sark) foo] 2014-11-06 13:11:46.695 Test[14872:1110786] IMP: -[NSObject(Sark) foo]
使用
clang -rewrite-objc main.m重写,我们可以发现
main函数中两个方法调用被转换成如下代码:
[code] ((void (*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("NSObject"), sel_registerName("foo")); ((void (*)(id, SEL))(void *)objc_msgSend)((id)((NSObject *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("NSObject"), sel_registerName("new")), sel_registerName("foo"));
我们发现上述两个方法最终转换成使用
objc_msgSend函数传递消息。
这里先看几个概念
objc_msgSend函数定义如下:
[code]id objc_msgSend(id self, SEL op, ...)
关于 id 的解释请看objc runtime系列第二篇博文: objc runtime中Object & Class & Meta Class的细节
什么是 SEL
打开objc.h文件,看下SEL的定义如下:
[code]typedef struct objc_selector *SEL;
SEL是一个指向
objc_selector结构体的指针。而 objc_selector 的定义并没有在runtime.h中给出定义。我们可以尝试运行如下代码:
[code]SEL sel = @selector(foo); NSLog(@"%s", (char *)sel); NSLog(@"%p", sel); const char *selName = [@"foo" UTF8String]; SEL sel2 = sel_registerName(selName); NSLog(@"%s", (char *)sel2); NSLog(@"%p", sel2);
输出如下:
[code]2014-11-06 13:46:08.058 Test[15053:1132268] foo 2014-11-06 13:46:08.058 Test[15053:1132268] 0x7fff8fde5114 2014-11-06 13:46:08.058 Test[15053:1132268] foo 2014-11-06 13:46:08.058 Test[15053:1132268] 0x7fff8fde5114
Objective-C在编译时,会根据方法的名字生成一个用来区分这个方法的唯一的一个ID。
只要方法名称相同,那么它们的ID就是相同的。
两个类之间,不管它们是父类与子类的关系,还是之间没有这种关系,只要方法名相同,那么它的SEL就是一样的。每一个方法都对应着一个SEL。编译器会根据每个方法的方法名为那个方法生成唯一的SEL。这些SEL组成了一个Set集合,当我们在这个集合中查找某个方法时,只需要去找这个方法对应的SEL即可。而SEL本质是一个字符串,所以直接比较它们的地址即可。
当然,不同的类可以拥有相同的selector。不同类的实例对象执行相同的selector时,会在各自的方法列表中去根据selector去寻找自己对应的IMP。
那么什么是IMP呢
继续看定义:
[code]typedef id (*IMP)(id, SEL, ...);
IMP本质就是一个函数指针,这个被指向的函数包含一个接收消息的对象id,调用方法的SEL,以及一些方法参数,并返回一个id。
因此我们可以通过SEL获得它所对应的IMP,在取得了函数指针之后,也就意味着我们取得了需要执行方法的代码入口,这样我们就可以像普通的C语言函数调用一样使用这个函数指针。
那么 objc_msgSend 到底是怎么工作的呢
在Objective-C中,消息直到运行时才会绑定到方法的实现上。编译器会把代码中
[target doSth]转换成
objc_msgSend消息函数,这个函数完成了动态绑定的所有事情。它的运行流程如下:
检查selector是否需要忽略。(ps: Mac开发中开启GC就会忽略retain,release方法。)
检查target是否为nil。如果为nil,直接cleanup,然后return。(这就是我们可以向nil发送消息的原因。)
然后在target的Class中根据Selector去找IMP
寻找IMP的过程:
先从当前class的cache方法列表(cache methodLists)里去找
找到了,跳到对应函数实现
没找到,就从class的方法列表(methodLists)里找
还找不到,就到super class的方法列表里找,直到找到基类(NSObject)为止
最后再找不到,就会进入动态方法解析和消息转发的机制。(这部分知识,下次再细谈)
那么什么是方法列表呢
上一篇博文中提到了
objc_class结构体定义,如下:
[code]struct objc_class { Class isa OBJC_ISA_***AILABILITY; #if !__OBJC2__ Class super_class OBJC2_UN***AILABLE; const char *name OBJC2_UN***AILABLE; long version OBJC2_UN***AILABLE; long info OBJC2_UN***AILABLE; long instance_size OBJC2_UN***AILABLE; struct objc_ivar_list *ivars OBJC2_UN***AILABLE; struct objc_method_list **methodLists OBJC2_UN***AILABLE; struct objc_cache *cache OBJC2_UN***AILABLE; struct objc_protocol_list *protocols OBJC2_UN***AILABLE; #endif } OBJC2_UN***AILABLE; struct objc_method_list { struct objc_method_list *obsolete OBJC2_UN***AILABLE; int method_count OBJC2_UN***AILABLE; #ifdef __LP64__ int space OBJC2_UN***AILABLE; #endif /* variable length structure */ struct objc_method method_list[1] OBJC2_UN***AILABLE; }
1) objc_method_list 就是用来存储当前类的方法链表,
objc_method存储了类的某个方法的信息。
Method
[code]typedef struct objc_method *Method;
Method 是用来代表类中某个方法的类型,它实际就指向
objc_method结构体,如下:
[code]struct objc_method { SEL method_name OBJC2_UN***AILABLE; char *method_types OBJC2_UN***AILABLE; IMP method_imp OBJC2_UN***AILABLE; } OBJC2_UN***AILABLE;
method_types是个char指针,存储着方法的参数类型和返回值类型。
SEL 和 IMP 就是我们上文提到的,所以我们可以理解为objc_class中 method list保存了一组SEL<->IMP的映射。
2)objc_cache 用来缓存用过的方法,提高性能。
Cache
[code]typedef struct objc_cache *Cache OBJC2_UN***AILABLE;
实际指向
objc_cache结构体,如下:
[code]struct objc_cache { unsigned int mask /* total = mask + 1 */ OBJC2_UN***AILABLE; unsigned int occupied OBJC2_UN***AILABLE; Method buckets[1] OBJC2_UN***AILABLE; };
mask: 指定分配cache buckets的总数。在方法查找中,Runtime使用这个字段确定数组的索引位置
occupied: 实际占用cache buckets的总数
buckets: 指定Method数据结构指针的数组。这个数组可能包含不超过mask+1个元素。需要注意的是,指针可能是NULL,表示这个缓存bucket没有被占用,另外被占用的bucket可能是不连续的。这个数组可能会随着时间而增长。
objc_msgSend每调用一次方法后,就会把该方法缓存到
cache列表中,下次的时候,就直接优先从cache列表中寻找,如果cache没有,才从methodLists中查找方法。
说完了 objc_msgSend, 那么题目中的Category又是怎么工作的呢?
继续看概念我们知道
Catagory可以动态地为已经存在的类添加新的方法。这样可以保证类的原始设计规模较小,功能增加时再逐步扩展。在runtime.h中查看定义:
[code]typedef struct objc_category *Category;
同样也是指向一个
objc_category的C
结构体,定义如下:
[code]struct objc_category { char *category_name OBJC2_UN***AILABLE; char *class_name OBJC2_UN***AILABLE; struct objc_method_list *instance_methods OBJC2_UN***AILABLE; struct objc_method_list *class_methods OBJC2_UN***AILABLE; struct objc_protocol_list *protocols OBJC2_UN***AILABLE; } OBJC2_UN***AILABLE;
通过上面的结构体,大家可以很清楚的看出存储的内容。我们继续往下看,打开objc源代码,在
objc-runtime-new.h中我们可以发现如下定义:
[code]struct category_t { const char *name; classref_t cls; struct method_list_t *instanceMethods; struct method_list_t *classMethods; struct protocol_list_t *protocols; struct property_list_t *instanceProperties; };
上面的定义需要提到的地方有三点:
name 是指 class_name 而不是 category_name
cls是要扩展的类对象,编译期间是不会定义的,而是在Runtime阶段通过name对应到对应的类对象
instanceProperties表示Category里所有的properties,这就是我们可以通过objc_setAssociatedObject和objc_getAssociatedObject增加实例变量的原因,不过这个和一般的实例变量是不一样的
为了验证上述内容,我们使用
clang -rewrite-objc main.m重写,题目中的Category被编译器转换成了这样:
[code]// @interface NSObject (Sark) // + (void)foo; /* @end */ // @implementation NSObject (Sark) static void _I_NSObject_Sark_foo(NSObject * self, SEL _cmd) { NSLog((NSString *)&__NSConstantStringImpl__var_folders_gm_0jk35cwn1d3326x0061qym280000gn_T_main_dd1ee3_mi_0); } // @end static struct _category_t _OBJC_$_CATEGORY_NSObject_$_Sark __attribute__ ((used, section ("__DATA,__objc_const"))) = { "NSObject", 0, // &OBJC_CLASS_$_NSObject, (const struct _method_list_t *)&_OBJC_$_CATEGORY_INSTANCE_METHODS_NSObject_$_Sark, 0, 0, 0, }; static struct _category_t *L_OBJC_LABEL_CATEGORY_$ [1] __attribute__((used, section ("__DATA, __objc_catlist,regular,no_dead_strip")))= { &_OBJC_$_CATEGORY_NSObject_$_Sark, };
_OBJC_$_CATEGORY_NSObject_$_Sark是按规则生成的字符串,我们可以清楚的看到是NSObject类,且Sark是NSObject类的Category
_category_t结构体第二项 classref_t 没有数据,验证了我们上面的说法
由于题目中只有
- (void)foo方法,所以结构体中存储的list只有第三项instanceMethods被填充。
_I_NSObject_Sark_foo代表了Category的foo方法,I表示实例方法
最后这个类的Category生成了一个数组,存在了
__objc_catlist里,目前数组的内容只有一个
&_OBJC_$_CATEGORY_NSObject_$_Sark
最终这些Category里面的方法是如何被加载的呢?
1.打开objc源代码,找到 objc-os.mm, 函数
_objc_init为runtime的加载入口,由libSystem调用,进行初始化操作。
2.之后调用objc-runtime-new.mm ->
map_images加载map到内存
3.之后调用objc-runtime-new.mm->
_read_images初始化内存中的map,
这个时候将会load所有的类,协议还有Category。
NSOBject的
+load方法就是这个时候调用的
这里贴上Category被加载的代码:
[code]// Discover categories. for (EACH_HEADER) { category_t **catlist = _getObjc2CategoryList(hi, &count); for (i = 0; i < count; i++) { category_t *cat = catlist[i]; Class cls = remapClass(cat->cls); if (!cls) { // Category's target class is missing (probably weak-linked). // Disavow any knowledge of this category. catlist[i] = nil; if (PrintConnecting) { _objc_inform("CLASS: IGNORING category \?\?\?(%s) %p with " "missing weak-linked target class", cat->name, cat); } continue; } // Process this category. // First, register the category with its target class. // Then, rebuild the class's method lists (etc) if // the class is realized. BOOL classExists = NO; if (cat->instanceMethods || cat->protocols || cat->instanceProperties) { addUnattachedCategoryForClass(cat, cls, hi); if (cls->isRealized()) { remethodizeClass(cls); classExists = YES; } if (PrintConnecting) { _objc_inform("CLASS: found category -%s(%s) %s", cls->nameForLogging(), cat->name, classExists ? "on existing class" : ""); } } if (cat->classMethods || cat->protocols /* || cat->classProperties */) { addUnattachedCategoryForClass(cat, cls->ISA(), hi); if (cls->ISA()->isRealized()) { remethodizeClass(cls->ISA()); } if (PrintConnecting) { _objc_inform("CLASS: found category +%s(%s)", cls->nameForLogging(), cat->name); } } } }
1) 循环调用了
_getObjc2CategoryList方法,这个方法的实现是:
[code]GETSECT(_getObjc2CategoryList, category_t *, "__objc_catlist");
方法中最后一个参数
__objc_catlist就是编译器刚刚生成的category数组
2) load完所有的categories之后,开始对Category进行处理。
从上面的代码中我们可以发现:实例方法被加入到了当前的类对象中, 类方法被加入到了当前类的Meta Class中 (cls->ISA)
Step 1. 调用
addUnattachedCategoryForClass方法
Step 2. 调用
remethodizeClass方法,
在remethodizeClass的实现里调用
attachCategoryMethods
[code]static void attachCategoryMethods(Class cls, category_list *cats, bool flushCaches) { if (!cats) return; if (PrintReplacedMethods) printReplacements(cls, cats); bool isMeta = cls->isMetaClass(); method_list_t **mlists = (method_list_t **) _malloc_internal(cats->count * sizeof(*mlists)); // Count backwards through cats to get newest categories first int mcount = 0; int i = cats->count; BOOL fromBundle = NO; while (i--) { method_list_t *mlist = cat_method_list(cats->list[i].cat, isMeta); if (mlist) { mlists[mcount++] = mlist; fromBundle |= cats->list[i].fromBundle; } } attachMethodLists(cls, mlists, mcount, NO, fromBundle, flushCaches); _free_internal(mlists); }
这里把一个类的category_list的所有方法取出来生成了method list。这里是倒序添加的,也就是说,新生成的category的方法会先于旧的category的方法插入。
之后调用
attachMethodLists将所有方法
前序添加进类的method
list中,如果原来类的方法列表是a,b,Category的方法列表是c,d。那么插入之后的方法列表将会是c,d,a,b。
小发现
看上面被编译器转换的代码,我们发现Category头文件被注释掉了,结合上面category的加载过程。这就是我们即使没有import category的头文件,都能够成功调用到Category方法的原因。
runtime加载完成后,Category的原始信息在类结构中将不会存在。
解惑
根据上面提到的知识,我们对题目中的代码进行分析。1) objc runtime加载完后,NSObject的Sark Category被加载。而NSObject的Sark Category的头文件
+ (void)foo并没有实质参与到工作中,只是给编译器进行静态检查,所有我们编译上述代码会出现警告,提示我们没有实现
+ (void)foo方法。而在代码编译中,它已经被注释掉了。
2) 实际被加入到Class的method list的方法是
- (void)foo,它是一个实例方法,所以加入到当前类对象
NSObject的方法列表中,而不是NSObject
Meta class的方法列表中。
3) 当执行
[NSObject foo]时,我们看下整个
objc_msgSend的过程:
[code]结合上一篇Meta Class的知识: 1. objc_msgSend 第一个参数是 “(id)objc_getClass("NSObject")”,获得NSObject Class的对象 2. 类方法在Meta Class的方法列表中找,我们在load Category方法时加入的是- (void)foo实例方法,所以 并不在NSOBject Meta Class的方法列表中 3. 继续往 super class中找,在上一篇博客中我们知道,NSObject Meta Class的super class是 NSObject本身。所以,这个时候我们能够找到- (void)foo 这个方法。 4. 所以正常输出结果
4) 当执行
[[NSObject new] foo],我们看下整个
objc_msgSend的过程:
[code]1. [NSObject new]生成一个NSObject对象 2. 直接在该对象的类(NSObject)的方法列表里找 3. 能够找到,所以正常输出结果
下一篇博客的主要分享的内容是关于 Objective C Runtime中成员变量与属性 ivar的学习笔记。
本文是关于Objective C Runtime的学习笔记。有不对的地方,欢迎大家指正。
感谢@唐巧_boy和@sunnyxx分享题目。
本文由@Chun发表于Chun
Tips .
版权声明:自由转载-非商用-非衍生-保持署名 | Creative Commons BY-NC-ND 3.0
分享到:4
Posted by Chun Ye Nov 6th, 2014 11:32
am objective-c runtime
刨根问底Objective-C
Runtime(4)- 成员变量与属性 »
Comments
最新最早最热5条评论
1条新浪微博
NSTopGun
当初为了搞明白category为什么不import也能用 翻了好久runtime源码 博主真是强大啊 条理清晰思路明确 赞!
2014年11月20日回复顶转发
lucas
看着好晕~ 好多不懂~
2014年12月9日回复顶转发
一休
请假个问题:
如果我NSObject的一个名为A的category实现了方法test
然后另外一个人,也写了NSObject的一个名为B的category,也实现了方法test
那么在插入methodlist的时候,应该是A的test在前面吧?
methodlist是存在了2个test方法么?object_msgSend遍历methodlist时,应该遍历到一个就结束了么
2014年12月24日回复顶转发
叶秋
我使用 `clang -rewrite-objc main.m` 时提示错误:
main.m:9:9: fatal error: 'UIKit/UIKit.h' file not found
#import <UIKit/UIKit.h>
^
1 error generated.
我错过了什么? 请指教,网上没有找到解决方法,习题内容的main.m文件应该是引入了<UIKit/UIKit.h>文件吧?
4月26日回复顶转发
菜菜
struct category_t 跟 struct objc_category 什么关系?
5月21日回复顶转发
相关文章推荐
- 刨根问底Objective-C Runtime(2)- Object & Class & Meta Class
- 刨根问底Objective-C Runtime(1)- Self & Super
- NSObject 的实现分析
- Associative机制使用场景[objective-c有两个扩展机制:category扩展方法和associative扩展属性]
- 关于pch文件
- Objective-C GCC Code Block Evaluation C Extension ({…})语法
- object-c 知识点01
- 【iOS开发系列】NSObject方法介绍
- OC学习笔记之self关键字
- Objective-C学习之旅 第二篇
- OC学习笔记之description
- OC学习笔记之多态
- Objective-C学习笔记(二)——OC基本语法概述
- OC学习之类的进阶
- JSONObject与JSONArray的使用
- 2015年Objective-C有哪些新功能?
- Objective-C学习笔记(一)——OC语言的特点
- Objective-C中应用断言_assert()
- 关于self.与_的区别
- iOS开发——高级篇——Objective-C特性:Runtime