您的位置:首页 > 其它

半年学习路程的一点感想及体会

2009-10-15 12:47 120 查看
时间过的好快,一晃半年过去了。觉得有必要记录些什么,但思绪很混乱,只能想到什么写什么了。请大家见谅啊,^_^!
在今年的三月初,我开始接触图像处理与计算机视觉这个领域,当时觉得这个很有意思,特别是看过一些人脸识别,物体检测与跟踪等DEMO,就更加着迷了。其实以前我是一门心思想做硬件的(嵌入式系统这一块),在研一上学期的时候,还学习过ARM,linux。本科的时候有幸参加了电子设计的比赛,在学院的科研基地学习过挺长的一段时间,那段时间是我大学里最有意义的学习阶段,知道了自己学的模电数电怎么和实际的结合,通过制作一些DEMO,培养了自己的解决问题的能力同时很大的提高了动手实践的能力。一直以来对嵌入式就抱有比较大的热情。研究生入学后,发现实验室的环境不适合做硬件的学习,缺乏项目和指导,只得作罢。(注:其实自己曾思考过,研究生是否该对一些实用理论进行学习,如果仅仅是学习硬件设计与编程(相当于积累经验的过程),何不直接工作两年,那样进步肯定更大。所以我想在硕士阶段对一些底层的东西、相对理论点的知识进行学习,有些理论是能受用终身,作为万变不离其宗的根本,避免了过多的精力投入表面功夫。不知道我这样想会不会是偏激的,但我已经选择了,呵呵)。
言归正传,在这半年的学习中,对一些理论的学习对我还是启发挺大的。特别是让我了解数学是如何隐藏在应用中的,学习的越深入,越对自己可怜的数学知识感到羞愧,唉。下面我思维跳跃下,以时间顺序记录下学习的过程:
三月中下旬,开始看冈哥的《数字图像处理》,一开始不是看这本,是图书馆瞎借的,结果很不适合入门,浪费了点时间。所以要进入一个新的领域学习,一定,一定要有个人带带。
四月份的时候开始接触了OPENCV,由于使用的是《learning opencv》这本经典书籍,对我提高有很大的帮助,或者说将我领进了图像处理的大门。(特别的感谢下海哥,他提供了这本书)。大概到四月下旬的时候,海哥让我看看SIFT的代码,我又从局部描述子切入了计算机视觉领域,而且我觉得这个模式不错,通过一个经典算法的学习,可以很快的进入一个领域,而且可以很快的向其他方面展开。SO,再次致谢海哥。
整个五月,我是淹没在了各类的计算机视觉(机器视觉)的相关书籍中,图书馆有的基本都借来浏览过了,让我对计算机视觉领域的内容有了基本的框架,但是书名我都没怎么记下除了《计算机视觉——一种现代的方法》,这本书还不错,推荐读一读。它把视觉分为了三个层次:底层,中层,高层。目前我是挣扎在中低层,^_^。在阅读书籍的时候,也穿插了一些文献的阅读,呵呵,这可是我学习生涯里第一次接触外文文献,记得当时是激动的心情同时怀着畏惧(怕看不懂)。结果老外的东西还是写的很不错的,有条理,方便理解,特别是经典算法的论文。这里不得不再次说起经典论文的重要性,读一篇好的论文是对一个相关领域的游览,里面有丰富的背景资料,参考文献。对了,我读的是D.G lowe的关于SIFT论文,这个人算是大牛了。
到了六月,由于偶然的看到关于全景摄像的介绍,产生了浓厚的兴趣,查了些中文的文献(博士毕业论文)和关于折反射成像镜的外文文献。由于还有期末考,所以一个月里用在这个上面时间并不是很多,主要是困扰在全景图像如何还原成柱面图以及透视图的问题上。当时先是自己拍脑袋想,拍不出来,后来就找文献,七七八八的找了一堆,发现没什么人写这个,可能这是个太基本的问题,郁闷。最后在一个博士的毕业论文里找到了相关思路。
七月,老板把我分到了机器人研究组(我自己取的名字)。主要是做SLAM和视觉方面的一些东西。我把全景图像的展开完善了下,然后看了一些SLAM的文献,有一些启发,还研究了SURF算子(一个不错的描述子,速度比SIFT快点)。对全景图片中直线的检测(水平线)做了些工作,垂直线的检测比较简单些。
八月,为了控制机器人的运动(在楼道中沿走廊平行运动),开始接触神经网络,这里推荐一本国外入门经典书籍《神经网络设计》哈根写的,浅显易懂,要求的数学功底不是很高。还有一本更牛的书《神经网络原理》。外文《Neural networks:a comprehensive foundation》,这本书从数学角度解释的较多,对神经网络原理性的东西进行了较多的分析,要求数学能力高点,还要有耐心。中文翻译的不太好,读起来太晦涩,我就翻了翻,没时间读。前面忘了推荐一本计算机视觉的书了,是国内的吴福朝老师的《计算机视觉中的数学方法》,本书对视觉中用到的一些数学知识介绍了下,包括几何的,矩阵的,模型推算的等等,可以看看。
随着学习的深入,发现自己知识结构有很大的缺陷。一方面是模式识别,另一方面是算法。现在看来是这样的,经过一个多月的学习,证实了当时放下视觉方面的内容,转而学习基础方面的东西是正确的,自己对以前的一些似懂非懂的问题有了更清楚的理解。我为此买了两本书,打印了一本,分别是国外的《模式分类》第二版,Duda写的,相当于一本详细的综述,对模式识别领域做了全面的介绍。还有一本是B,SHOP写的《pattern recognition and machine learning》,网上可以下到,这本书也不错,介绍的浅显易懂点,书的讲述方式与流程与上一本不同,对一些新理论的介绍比较详细,如基于核的方法,图模型等。我只读了一半,由于中间一些推导被我跳了,后面有点吃力,决定重头看,关键是真本书值得看第二次。算法方面买了本MIT的教材,《算法导论》,想必大家也都知道,我看了三分之一吧,觉得不错,我以前没有学过算法和数据结构方面的知识,这回一起补了。哈哈。在学习算法的过程中发现,在计算机视觉和模式识别一些方法的实现上都是有用到这方面的知识。
然后要说到现在了,下个月要开题了,所以要读一些文献,给自己定个方向,以前读过一些视觉和SLAM的文献,都忘的差不多了,偶尔有些笔记,但是记的不怎么好。要再温习下,不过我相信温习一遍会有新发现的,呵呵。以后我会把一些学习中的想法和观点记录在博客,欢迎大家来关注,一起进步。
这是我的第一篇博文,所以要纪念下这个日子,2009年10月15日星期四。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: