您的位置:首页 > 数据库

在PostgreSQL中如何生成线性相关的测试数据

2016-12-23 14:02 351 查看
生成线性相关的测试数据。

同样可以用到generate_series和随机数。

例子

生成10万条随机数字。
select trunc(10000 + 1000000*random()) id from generate_series(1,100000);


根据刚才那组数据,加减5以内的随机数,生成另一组数字。
select id, trunc(id + 5-random()*10) from
(select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t;


如下
postgres=# create table corr_test(c1 int, c2 int);
CREATE TABLE
postgres=# insert into corr_test select id, trunc(id + 5-random()*10) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t;
INSERT 0 100000


线性相关性如下:
postgres=# select corr(id, trunc(id + 5-random()*10)) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t;
corr
-------------------
0.999999999954681
(1 row)
... ...
postgres=# select corr(id, trunc(id + 5-random()*10)) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t;
corr
-------------------
0.999999999954898
(1 row)


p元回归的测试数据也可以使用以上方法生成。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: