您的位置:首页 > 其它

百度工作两年总结---发于2015.8.22

2016-01-15 23:16 176 查看
看了下空间日志,上次对自己的一个反思实在12年3月份,虽然还年轻,不过,时间过得真快,慢慢的,就成为老人。13年4月入职百度,13年7月毕业,离开校园也已经两年。有时候,也会想念着大学,读研的生活,那时候,很无忧,憧憬着美好的未来,时刻想着,要为了牛逼的梦想傻逼般的坚持。时光流到如今,差点经历了半途的创业,也放弃了那份坚持,很可惜,有时也觉得应该继续坚持。
      两年的时光,多半成长在技术上,专业能力上,其他的除了对股票更了解了,多半没什么进步,可惜,股票也赔了不少钱。下次回顾往事,反思自己时,希望能撇开技术,不然,真的要虚度了。
     技术的成长,想想,看了不少书,也实践了一些,后面需要的只有实践了,理论或者书已经没有多少进步空间了。

   13年刚毕业那会,专注于驱动开发。 看了A盾,Snow Shadow两款ARK工具的代码,了解一些注册表hive解析,文件系统ntfs/fat32磁盘解析的东西,了解产品的代码,开始熟悉了杀毒软件中的主动防御,网络防护,URL防护的一些技术,分析360,分析样本,做了一些主防中驱动开发的一些东西。
    14年和同事专搞网络驱动,熟悉了TDI/NDIS,WFP的网络的一些代码,后面做网络数据包检测,慢慢的开始做应用层。开始更多的写应用层C++代码,又读了C++ Primer,Com技术内幕,杨老的COM教程,写改dump案例的格虫汇编,大话设计模式,在读书与工作的具体实践中,C++现在也算写的可以作为产品代码了。后来下班时间,看了些不属于c++的东西,像疯狂Android讲义,java web开发宝典,这些现在用不到,不知道以后是否能涉及到。不过,在创业过程中,写了个web后台,我觉得还可以,用了strust2和hibernate,也算一个不错的框架了。14年初做网络驱动,14年下半年做小工具的开发,慢慢的做应用层越来越多,开始考虑代码的优雅,试着用一些设计模式的框架,试着用com,试着用了多个类的继承多态,考虑后期扩展方便,慢慢的习惯写模块时先遵循MVC模式,这些东西不区分语言吧,所有的开发都可以用的东西。
      14年底项目要求,接手了渠道和攻防穿透的开发。应用层的开发也越来越熟练了。慢慢的开始了解一些算法的东西,做网络数据包检测,现在海量样本的处理,海量数据的挖掘,这些以后也是基本功了,我觉得。PM、运营的工作已经不止于研究一些用户的简单行为,分析一些上报的数据,这个我觉得是第一代的pm。第二代的工作应该是针对海量的数据,用一些海量的数据,起码上百万,千万,亿量的数据,做一些统计分析,挖掘。真正的硬需求在06年到11年左右杀毒软件的黄金时代,第一代pm是最需要的,这些需求现在已经很少,基本没有,后面的是领域内的深耕细化。现在,需要的是懂得这些挖掘算法的,对数据的分析,得出一些行为习惯。最后再好好写写我的一点点思考,在这个方面。15年的4月,5月份,在算法这块看的比较多,又回去看了以前的高等数学书,线性代数,概率统计,高等工程数学书,后面这些会慢慢的用的多起来。百度技术最高深的要算搜索和机器学习这块了,这块的市场确实很大,但是现在还没到风口,距离工业化应用还要有段时间。机器学习实战这本书不错,对着代码好好看了一遍,需要一些数学知识,后面打算还要看一遍,先把模式识别这本书读一遍再看。
       最近,接手北京同事的工作,发现越来越多的用了boost,就把侯杰的C++模板概览和Boost程序库完全开发指南看了遍,算是对boost了解了下,读代码没大问题了,后面就是自己不断写boost,熟悉的过程。跨平台的库,有点类似Python的各种第三方库,提高开发的效率。就像IOCP,一些网络并发的框架,读懂很容易,需要多多自己去写写。每一个程序员都有自己想去写份IPC和网络库的冲动,总觉得自己写的更好,呵呵,这个也不是坏事。

      技术也就这基本这样过来了,基本自己想去熟悉的东西都涉及到了,后面不想再花很多时间看技术书了,多去实践已有的这些东西。

慢慢的开始去涉足产品,运营的或者交际的一些东西,也想过,才毕业两年,总要花上三年去把编程这块夯实吧,这个下面的一年,继续做,但是偏向实践吧,也去专注于别的一些事情。

       股票这个东西,看书只能学到一点点,主要还是实践,虽然现在赔了一些钱,可是教训,经验还是更珍贵的,总觉得自己对钱不是很看重,更希望的是收获到什么,不会下次看到坑,依然傻傻的踩下去。

       关于创业,不想多说什么,很难的一件事,团队之间的融合比方向更重要,傻傻坚持的信念也比方向重要。

        后面一年或者几年内,技术上把前面读书积累的理论慢慢转为实践,一项项转为自己编程的习惯,比如类似IOCP的网络并发框架,设计模式,boost,算法等等。 尽量少读技术书了吧。慢慢的偏向应用层开发或者移动开发,少涉及驱动。再一年就毕业三年,把编程这块基础打牢靠吧。

           股票这块设好止损线,拿少量的钱去做一些,形成自己的交易系统。花少的时间去做,不再过多关注了。

          至于创业或者职业的成长,努力,还是要坚持。不要再可惜了。大部分的职业规划都是走M路线,工作几年升管理,可是我总觉得自己不喜欢,内心总是不喜欢稳定,冒险搏一把的冲动抑制不住。

          幸运的是,两年的生活,收获了不少百度的同事,私下都成为了朋友,关系很好。祝福你们,生活,工作都好。

                                                                                                          ------2015.8.2

简单的谈谈海量数据,产品方向的理解

给自己想的这些起了个名字,叫用户模拟系统或者机器人系统吧,目前来说技术层面已经没有任何问题,也有人在做。

对于一款客户端产品,收集了很多,各种用户的信息,这个业内也已不是秘密。

从静态来说,可以有用户的年龄,性别,职业,兴趣,资产,位置,手机上装的应用。资产这块怎么预测,从用户的电脑配置,手机配置,通过手机助手链接起来的,用户职业基本能界定,本来就是统计上的东西,不需要精确。

从动态来说,可以知道用户top最近打开的软件名,打开次数,比如炒股时打开同花顺比较多。用户访问的域名,打开pdf阅读电子书籍的总类,从用户操作鼠标/键盘的习惯简单得出用户的性格,最近看电影的种类,打开游戏的种类,打开电脑及软件的时间,比如针对FIFA的足球迷,流氓一点的,京东和淘宝购物记录也是可以拿到的。

从静态的画像到动态的模拟,无非是对用户的一个重现,就像做了一个和用户一样的机器人,这些能干什么。预测,预测你明天的开机时间,你开机后大概几小时做什么,明天九点登录淘宝买东西的概率,开发糯米的概率,最近对于一些突发事件,可能做出某些决定的概率,人大都是类似的,历史总会重演。静态画像,动态的模拟,加上时间的维度,年龄的维度基本记录了一个人的生活轨迹,成长的轨迹,如果能有一些好友信息,这一生还能有什么不知道的呢,不能预测的呢,看到一些做这个产品的案例,这些数据的获取,统计分析,预测基本都基于海量的数据获取,收集,从WEB端软件到搜索引擎到客户端产品,像BAT这些公司都是可以做到的,如果预测的购买及广告点击率能提高几个百分点,这些分析预测都是值得的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  百度 工作 创业