您的位置:首页 > 编程语言 > MATLAB

数学建模 matlab 数据的拟合和回归

2020-06-04 08:00 477 查看


根据回归方法中因变量的个数和回归函数的类型:

特殊的回归方式:
逐步回归:回归过程中可以调整变量数的回归方法;
Logistic回归:以指数结构函数作为回归模型的回归方法。

一、一元回归

1.一元线性回归
例题:
近10年来,某市社会商品零售总额与职工工资总额(单位:亿元)的数据,请建立社会零售总额与职工工资总额数据的回归模型。

(1)输入数据,画出散点图


(2)采用最小二乘回归

注:相关公式

(3)采用LinearModel.fit函数进行线性回归
m2=LinearModel.fit(x,y)
运行结果:

LinearModel.fit输出的内容为典型的线性回归的参数
(4)采用regress函数进行回归

运行结果:
b =

-23.5493
2.7991
总结:
1.注意自变量需要加偏置项
2.注意X,Y是列向量还是行向量
3.regress函数
[b,bint,r,rint,stats]=regress( Y,X,alpha)
输入有Y(因变量,列向量)、X(与自变量组成的矩阵)和alpha(显著性水平,缺省时默认为0.05)。
输出b为(b0,b1),bint是b0,b1的置信区间;r是残差;rint是残差的置信区间;stats包含4个统计量:决定系数R^2(R为相关系数)、F值、F(1,n-2)分布大于F值得概率p,剩余方差 s ^2。

置信区间
含义:
置信区间是一种常用的区间估计方法,所谓置信区间就是分别以统计量的置信上限和置信下限为上下界构成的区间。
性质:

残差
1.含义
残差在数理统计中是指实际观察值与估计值(拟合值)之间的差。
相关系数
自变量之间的的相关性,越是在一条直线上,自变量之间关系越大,表现为R ^2越大。
2.一元非线性回归
例题:
为了解百货商店销售额 x与流通率y(这是反映商业活动的一个质量指标,指每元商品流转额所分摊的流通费用) 之间的关系,收集了九个商店的有关数据。请建立它们关系的数学模型。

解题步骤:
(1)输入数据。

(2)对数形式非线性回归。

运行结果:


(3)指数形式非线性回归。


运行结果:

二、多元回归

例题:
某科学基金会希望估计从事某研究的学者的年薪Y与他们的研究成果的质量指标X1、从事研究工作的时间X2、能成功获得资助的指标X3之间的关系,为此按一定的实验设计方法调查了24位研究学者,试建立Y与X1、X2、X3之间关系的数学模型,并得出有关结论和作统计分析。

解题步骤:
(1)读取数据,画散点图


这些点大致分布在一条直线旁边
(2)进行多元回归



得到回归方程:
y=17.4363+1.119x1+0.3218x2+1.332x3

三、逐步回归

逐步回归是一元回归和多元回归的结合,可以自动使得方程的因子设置最合理。
例题
(Hald,1960)Hald数据是关于水泥生产的数据。某种水泥在凝固时放出的热量 与水泥中4种化学成品所占的百分比有关。在生产中测得12组数据,试建立Y关于这些因子的“最优”回归方程。



图中,变量X1、X2、X3、X4均保留在模型中,用蓝色行显示,窗口右侧按钮上方提示:Move X3 out,单击Next Step按钮,进行下一步运算,将第3列数据对应的变量X3剔除回归方程。单击Next Step按钮后,剔除的变量X3所对应的行用红色表示,同时又得到提示:Move X4 out,单击Next Step按钮,一直重复这样的操作,直到Next Step按钮变灰,表明逐步回归结束,此时得到的模型即为逐步回归最终的结果。
总结:
1.善于利用xlsread()函数。
2.善于利用矩阵表示自变量。VarName1=[7;26;6;60]
3.逐步回归利用stepwise函数进行回归。

四、Logistic回归

例题
企业到金融商业机构贷款,金融商业机构需要对企业进行评估。评估结果为0,1两种形式,0表示企业两年后破产,将拒绝贷款;而1表示企业2年后具备还款能力,可以贷款。已知前20家企业的三项评价指标值和评估结果,试建立模型对其他5家企业进行评估。

(1)导入数据

(2)数据转化和参数回归

(3)模型验证和应用

(4)显示结果

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: