在PostgreSQL中如何生成线性相关的测试数据
2016-12-23 14:02
351 查看
生成线性相关的测试数据。
同样可以用到generate_series和随机数。
例子
生成10万条随机数字。
根据刚才那组数据,加减5以内的随机数,生成另一组数字。
如下
线性相关性如下:
p元回归的测试数据也可以使用以上方法生成。
同样可以用到generate_series和随机数。
例子
生成10万条随机数字。
select trunc(10000 + 1000000*random()) id from generate_series(1,100000);
根据刚才那组数据,加减5以内的随机数,生成另一组数字。
select id, trunc(id + 5-random()*10) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t;
如下
postgres=# create table corr_test(c1 int, c2 int); CREATE TABLE postgres=# insert into corr_test select id, trunc(id + 5-random()*10) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t; INSERT 0 100000
线性相关性如下:
postgres=# select corr(id, trunc(id + 5-random()*10)) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t; corr ------------------- 0.999999999954681 (1 row) ... ... postgres=# select corr(id, trunc(id + 5-random()*10)) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t; corr ------------------- 0.999999999954898 (1 row)
p元回归的测试数据也可以使用以上方法生成。
相关文章推荐
- ORACLE 单一分区在频率直方图下的筛选最大边界值时的基数
- 关于SOA之问与答 基础篇
- Redis 缓存过期(maxmemory) 配置/算法 详解
- 全国省市数据库
- MySQL中char与varchar区别,varchar最大长度是多少?
- solr5.5(3)——结合mysql定时索引
- SQL Server用用户名sa和密码方式登录错误28000(18452)
- SQLite中中实现 if not exist 类似功能
- mysql中int(10)与int(11)有什么区别吗?
- Mysql 从零开始
- oracle各个版本的exp/imp兼容性
- postgres使用pg_resetxlog命令重置一个数据库集群的预写日志以及其它控制内容
- SQL SERVER 中如何用脚本管理作业
- PL/SQL 如何查看当前连接信息以及SQL PLUS如何指定IP地址
- kettle Connect Pentaho to MS SQL Server
- spring + redis 实现数据的缓存
- MySQL学习中的的疑问
- oracle 表名中包含中文如何删除
- C#数据库的使用
- Python 操作 mongodb 数据库