生成1000万行7位数字文件(编程珠玑)
2015-08-23 21:16
274 查看
生成1000万行7位数字文件(编程珠玑)
今天看《编程珠玑》排序的问题,输入是一个千行文件,每行是7位数字,并且无重复。搜索了下,没有现成的数据集,所以简单用python生成了下,虽然简单!思路:顺序生成,然后shuffle。
#!/usr/bin/python f = open("numbers.txt", "w"); for i in range(0, 9999999): s = str(i) s = s.zfill(7) s = s + '\n' f.write(s) f.close()
RUN:得到的数据集大小是77M
python generate-numbers.py ls -l --block-size=M numbers.txt shuf -o outoforder.txt numbers.txt head -n 10 outoforder.txt
python整型和字符串的转换:int(), str()
利用str.zfill(width)进行字符串的填补
显示文件大小 ls -l –block-size=M
使用shuf命令将文件行随机排列 ,从而得到对应的数据集。
相关文章推荐
- 用python进行数据预处理,过滤特殊符号,英文和数字。(适用于中文分词)
- python笔记 4
- Java学习笔记----容器
- C# 之 FTP服务器中文件上传与下载(二)
- c++返回引用和返回对象的区别
- java基础-API-集合框架-Map、Collections、Arrays
- Java源码分析之LinkedList
- C++ Primer 5e chapter 14.2
- python中threading的高级函数应用解析
- matlab转化为opencv代码过程中按行扩大矩阵
- C++ Primer 5e chapter 14.1
- android---从eclipse换到studio,出的各种问题
- Spring配置文件解析--集合注入方法
- 让python cookie支持特殊字符
- 解决Struts2中的XML文件没有提示的问题
- Spring 入门案例1
- eclipse将android项目生成apk并且给apk签名
- php 设计模式(转载)
- java中hex转byte问题
- 【java开发】方法重写和方法重载概述