ICT实习第二周第一天
2014-01-13 15:59
190 查看
这周开始分配具体的任务了,主要是对hive支持的数据类型的编码方式进行调研,
我分到的是string类型数据,申跟我过了一下mapred工作流程,讲了一些关于mapred中getsplits和getrecordreader的东东,让我去看hive源码,找出outformat和recordwriter中关于string编码的部分,此是基于orcfile的,另外去github调研parquet,比较不同编码方式对列存储下string类型的的影响,找tradeoff压缩率和速度的中间点。另外还讲了关于列存储下不同行数据放在同一个block的过程。以及64Mblock下的行到列簇再到列的关系。
这周任务只要是调研,开始从百度or百度or google 往paper、github、google、hive wiki、wikipedia转变。
总之,这周开始工作内容又下潜了一个层次,开干!
我分到的是string类型数据,申跟我过了一下mapred工作流程,讲了一些关于mapred中getsplits和getrecordreader的东东,让我去看hive源码,找出outformat和recordwriter中关于string编码的部分,此是基于orcfile的,另外去github调研parquet,比较不同编码方式对列存储下string类型的的影响,找tradeoff压缩率和速度的中间点。另外还讲了关于列存储下不同行数据放在同一个block的过程。以及64Mblock下的行到列簇再到列的关系。
这周任务只要是调研,开始从百度or百度or google 往paper、github、google、hive wiki、wikipedia转变。
总之,这周开始工作内容又下潜了一个层次,开干!
相关文章推荐
- Delphi中对TRichEdit控件的每一行设置不同的颜色
- Apache ActiveMQ单点基本配置
- [MS SQL]常用SQL语句大全2-技巧
- Angular指令1
- _cdecl 与 _stdcall 和 extern 与 extern "C" 解释与理解
- 淘宝U站排名揭秘-看淘宝优站排名规则解析U站排名优化策略
- mysql图文安装教程
- io阻塞与io非阻塞
- git小抄[ZZ]
- [MS SQL]常用SQL语句大全1-基本操作
- qiangchezu car contact qq 30288891@qq.com
- Csharp: FreeTextbox 编辑器控件运行时错误: 'FTB_ResizeGalleryArea' 未定义
- rails render
- C# winfrom 模拟ftp文件管理实现代码
- 设备和解决方案提供商--传统设备厂商
- 过滤器监听器总结
- Spring : OpenSessionInViewFilter 的配置及替代方案
- Linux下sqlplus问题
- python调用cmd命令行制作刷博器
- no_swap_join_inputs 与 leading