您的位置:首页 > 运维架构 > Linux

谈谈如何学习Linux内核

2014-02-23 21:09 232 查看
节选自:http://www.linuxidc.com/Linux/2014-02/96173.htm


学习小Tips

上面说的太抽象,接下来就介绍一些我学习时候运用的一些小技巧,当然每个人都有自己的学习习惯,大家可以选择性参考,我也只列举了我使用的一些典型技巧。


如何看书

看书绝对不是一件容易的事情,有大量的技巧在其中,其中最让我感受深刻的就是:

不要从第一页开始翻

不要一页一页的翻

我介绍一些我个人看书的技巧

花些时间看看前言,在很多书的前言部分,作者会告诉你,整本书的结构应该是什么样,应该要以什么样的顺序去阅读,在阅读的时候应该站在什么样的角度去阅读,这是作者的建议,有什么比作者的建议更值得我们听取呢!?
不要寄希望与一次看懂一本书,越是好的书越是要反复的看,但是很多人对这个反复理解有问题,认为反复的看就是一页页翻,重复看几遍。其实不是这样,每次反复应该让自己换一个高度,第一次翻的时候可以站在很高的高度,看一本书甚至只需要1天的时间,重复几次后,站的高度应该越低,很可能看一个章节需要1天时间,甚至有时候看一页就需要1天的时间。
一本书的目录就像你在沙漠中的指南针,不要忽略目录的作用。每次翻开书,在决定自己看什么之前,花点时间浏览下目录,让自己回忆(了解)要看的章节的架构,带着这个结构去学习事半功倍。
带着问题去看书,这点很难,因为提什么样的问题和你选择的高度密切相关,站的高度越高,那就越不要给自己提一些细节性的问题,反之则反之。

还有很多更细致的技巧,例如如何辨别哪些是需要关注的关键词,如何将书本中不同章节的知识点串联等等,有很多我自己也做不好,所以也就不在这献丑了。


如何看代码

如果开始看代码,一定要记住,自己已经站在一个非常底层的高度度了,能够有能力阅读代码,就意味着你必须对整体的结构有比较清晰的认识,如果你都不知道这个结构,那看代码为时太早。

无论是什么样的代码,其实思路都很类似,即使Linux内核是用C这种面相过程的语言编写,但是这么多年发展下来,Linux内核已经带有了大量面对对象编程的特点。

在看代码的时候也是有两种不同的高度可以选择,我先解释其中最细致的一种:


如何阅读函数

一个函数写下来经常上百行,但是你需要一行一行的看么?肯定不能,那清晰认识一个函数的结构就很重要。

一个函数就是为了解决一个问题,函数名基本都能说明其功能,函数参数是输入,返回值就是输出,函数体就是整体的执行逻辑。在函数体内部,也基本都是类似的逻辑,先是对各种输入参数进行检查,然后书写功能逻辑,然后构造输出的结果。所以一个函数写下来总是这样的一种结构。

输出结果 函数名(输入)

{

if (输入的参数有问题)

{

异常处理,跳出

}

准备参数

功能逻辑

构造输出结果

返回输出结果

}

一个函数其实就是一个方法,阅读的难度比书写的难度要低,书写代码需要考虑的问题非常多,但是在阅读代码的时候问题就简单很多,很多书写代码过程中需要考虑的问题在阅读代码的过程中就不需要考虑

函数名:在书写代码过程中需要考虑一个函数的函数名需要能够精确表达出这个函数所具备的功能,所以经常存在各种名目规范。而阅读代码过程则可以通过阅读函数名大致了解这个函数的功能。
注释:在编写代码的时候,都会建议添加对应的函数注释,解释函数体的功能和一些注意事项;在阅读过程中可以选择性的阅读这些注释(注意:是选择性阅读,千万不要每个注释都读)
输入参数:在书写代码的时候,这部分的内容也是很头疼的内容,不仅需要确定需要哪些输入,还需要输入的形式,而且还需要精确定义每个输入参数的语义;但是在阅读代码的过程中,这部分内容基本可以忽略,我们很少会关系所看到的函数需要哪些参数输入。
输出结果:在书写代码的时候,这部分也是很头疼的一件事,因为精确定义输出结果也是非常困难和麻烦的一件事;在阅读代码过程中,也需要注意输出结果,不然一个函数执行了老半天,结果连输出结果是什么都没概念,也太失败了点。
参数检测:在编写代码过着中非常烦的一件事,每个人都希望调用函数的人会传入正确的参数,但是根本做不到,结果每次都要花费一定精力对输入参数的边界、非空等进行检查;在阅读代码过程中,根本不需要阅读这部分的代码,恰恰这部分内容在每个函数体中占据了相当一部分的位置;
参数准备:编写代码的过程中,因为函数体内部的逻辑需要进行很多准备,所以常常需要有一个参数准备的过程;而阅读代码的过程基本可以忽略这部分的逻辑,或者快速浏览这部分逻辑,这里恰恰是很多新手花费大量精力纠缠的内容,其实没必要在这里纠结,跳过就好。
功能逻辑:这部分是函数体中最为精华的部分,而且代码编写起来也是相当的麻烦,被各种逻辑弄的死去火来,最后还需要重构等等手段;在阅读代码过程中,这部分其实很难把握,因为功能逻辑可能被封装在另外一个函数内部,这时候大家会习惯性的继续深入看,结果弄的自己更加混乱,又比如有的时候几个功能逻辑点组成了一套逻辑,但是大家却将这部分逻辑割裂来看,结果总感觉读的很别扭。这部分内容需要一些经验,但是有一个指导,就是在看这部分代码的时候要注意自己所站的高度,选择采用何种策略。
构造输出结果:函数体内部还会花费大量的代码进行对最后返回结果的构造工作,就像搭积木一样;不过在阅读代码的时候,我们并不需要花费太多精力在这些逻辑上,多注意注意一些返回结果的语义。

阅读代码还有很多技巧,例如如何在带有goto语句的代码中快速理解逻辑,如何界定那些注释是可以忽略的,如何将一些代码逻辑看成一块整体内容,何时应该跳到更深的一层函数阅读等等。这些都需要平时的经验积累。


如何在大量的代码中游刃有余

看代码有一个粒度问题,我们不能一行一行的看,也不能一个一个函数的看,我之前提到了,Linux内核有大量面向对象编程的影子,所以在看大量代码的时候,必须学会面向对象编程的思维模式。这样对自己在大量代码阅读中提供大量参考意见。

或许有人会告诉你,面向对象编程就是弄明白什么是对象、如何写一个class就可以了。确实,学习面向对象编程,弄明白对象是基础,不过我觉得可以再拔高一点,理解一些更抽象的概念,在这些抽象概念的指导下去学习,可以有更多的指导意义。

层:层并不是面向对象编程特有,但是理解层是很重要的,我们遇到的典型的层就是网络协议栈,为什么我们网络协议会有那么多层,就因为需要处理的事情太多,我们不得不将内容一块块的分割,分割的时候,发现用层进行组织,可以让结构更加清晰,所以你以后会发现,大量的系统都会带有层的味道。linux内核中带有大量的层设计,如网络协议栈有层,内存管理与寻址有层,文件I/O也有层。
领域模型:领域模型就是一个系统中最为核心的几个抽象实体,一个系统,基本就是围绕着领域模型展开,在学习内核不同的子系统的时候,一定要花大量的精力在领域模型上,切记!!!在Linux内核上也有大量的领域模型,例如在虚拟文件系统部分存在4大抽象inode,dentry,file等。在进程调度系统的最核心抽象是task_struct。在进程地址空间则有mm_struct,address_space等这些核心的领域模型。我感觉可以花费80%的时间在理解这些领域模型上。
领域驱动类:领域模型内部其实是大量的属性组成,但是如果只有属性,没有一个执行的方法,那这个领域模型也不能发挥作用,面向对象编程的做法就是将这些方法编程领域驱动类,说的直白一些就是接口。在Linux中就是那些函数指针和对应的回调函数。平时看代码,大家会花费大量的时间去看各个回调函数,这个其实是吃力不讨好的办法,与其花大量的心思去看各个回调函数的实现,不如多思考下,为什么会有这些操作方法,它们是如何抽象出来的。

如果能够理解上述的这几个抽象,那在大量代码中如何游刃有余就相对容易了,有一个简单的套路:

(1) 在较高的角度,弄明白一个系统为了解决什么问题,应该有哪些抽象

(2) 在对整体结构有所了解以后,花心思看看这些抽象对应的领域模型,因为一般情况领域模型很庞大,所以看的时候也需要有步骤的进行拆解学习。

(3) 在对领域模型有所了解后,开始看领域驱动类,想明白为什么会有这些操作。

(4) 在上述准备好后,就可以花费一些时间去看各个函数的具体实现,并且在看的过程中多思考领域模型为什么这么设计。


总结

文中的内容就是我个人的一些学习Linux内核的心得,这个心得其实不仅仅可以用于学习Linux内核,在大量场景下也适用。还有很多内容可以谈,限于能力有限,很多东西没办法用文字表达出来,等什么时候能力足够了,再继续把后续内容补上。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: