Pig sample用法举例
2015-06-07 22:37
274 查看
some = sample data 0.1
遍历整个数据集,获取指定比例的行数的数据,获取的数据不确定,条数也不准确。
内部重写为filter data by random() <= 0.1
抽取100行数据
遍历整个数据集,获取指定比例的行数的数据,获取的数据不确定,条数也不准确。
内部重写为filter data by random() <= 0.1
抽取100行数据
data = load 'data'; grpd = group data all; sums = foreach grpd generate COUNT(data) as c; some = sample data 100/(double)sums.c;
相关文章推荐
- [Objective-C] 005_Category(类别)
- 37.给定一个数,除去其中的偶数位,从新按照高地位输出
- Pig limit用法举例
- Zabbix架构简介
- 人脸检测和haar分类器视频讲解
- 第十三周项目3-立体类族共有的抽象类
- Pig join用法举例
- 第十三周项目3-立体类族共有的抽象类
- Remove Duplicates from Sorted List II ——LeetCode
- AppStore App申请审核加速
- UNP---套接字简介
- 比CMD更强大的命令行WMIC
- jQuery对表单、表格的操作及更多应用(下:其他应用)
- POJ 2774 最长公共子串
- Pig distinct用法举例
- Java:基本语法
- Ant详解
- IOS之C语言进制转换
- hdu5266 LCA 倍增法
- Pig group用法举例