您的位置:首页 > 其它

2016数学建模国赛五天突击笔记

2016-08-29 08:12 246 查看

第一天

一.统计推断

1.参数估计:用于模型的数学形式已知,并且可以用有限个参数表示,利用样本构造估计量对各参数进行估计。

构造估计量的方法: 矩估计法、最大似然估计法

构造估计量的评选标准: 对未知参数的估计方法不同,即对估计量的构造方法不同,因此涉及到评价估计量好坏的标准,这里介绍两个评选标准:无偏性、有效性

(无偏性:设A’=g(X1,X2,…,Xn)是未知参数A的一个点估计量,若A’满足

E(A’)= A,则称A’为A的无偏估计量。同一个参数可以构造很多的无偏估计量。无偏估计就是系统误差为零的估计。

有效性:由于参数的无偏估计量有多个,我们认为在样本容量相同的情况下,无偏估计量的方差越小越好。)

参数估计的分类: 二项分布的参数估计(binofit)、正态分布的参数估计(normfit)、指数分布的参数估计(expfit)、泊松分布的参数估计(poissfit)

2 .假设检验:总体的分布函数未知或只知其形式但不知参数的情况下,提出的某些假设,用以推断总体的某些性质。(显著性检验是假设检验中最常用的一种方法)

假设检验的步骤: 第一步,提出假设H0:样本与总体或样本与样本间的差异是由抽样误差引起的。则其对立假设H1:样本与总体或样本与样本间存在本质差异。

第二步,选择合适的检验统计量F并加以计算,求出显著性概率p

第三步,分析p值。在分析过程中,可能出现两类错误:1.拒绝正确的H0称为Ⅰ型错误,这种情况出现的概率用α表示;接受错误的H0称为Ⅱ型错误,发生的概率为β,通常只考虑α,忽略β,概率α称为显著性水平(α通常取0.01或0.05);

第四步,若p<=α,拒绝H0,接受H1,则所提出的假设非常可疑,并提供否定这个假设的证据;若p>α,接受H0。

假设检验的种类: 1.σ(标准差)已知时的检验(z检验) :用matlab中的ztest命令来实现。2.σ未知时的检验(t检验) :用matlab中的ttest命令来实现。

这里引用百度百科所举的例子以便更好的理解参数估计和假设检验:

例如,我们对45钢的断裂韧性作了测定,取得了一批数据,然后要求45钢断裂韧性的平均值,或要求45钢断裂韧性的单侧下限值,或要求45钢断裂韧性的分散度(即离散系数),这就是参数估计的问题。

又如,经过长期的积累,知道了某材料的断裂韧性的平均值和标准差,经改进热处理后,又测得一批数据,试问新工艺与老工艺相比是否有显著差异,这就是假设检验的问题。

这样可以看出,参数估计是假设检验的第一步,没有参数估计,也就无法完成假设检验。

置信区间:用来估计未知参数的取值范围,同时给出区间包含真值的概率。

(以下为引用,附上链接:http://www.zybang.com/question/5659919fecbff4cd01193c1214bcb012.html

90%置信区间:当给出某个估计值的90%置信区间为【a,b】时,可以理解为我们有90%的信心可以说样本的平均值介于a到b之间,而发生错误的概率为10%.

有时也会说95%,99%的置信区间,具体含义可参考90%置信区间.

置信区间具体计算方式为: 知道样本均值(M)和标准差(ST)时:

置信区间下限:a=M - n*ST; 置信区间上限:a=M + n*ST;

当求取90% 置信区间时 n=1.645

当求取95% 置信区间时 n=1.96

当求取99% 置信区间时 n=2.576

第二天

一.线性回归分析

由给定样本实际值做出散点图,设出回归方程:y = A + Bx,但由于y是随机变量,无法准确求出A、B,只能通过减小误差近似求得拟合的回归方程,使总的拟合误差(即总残差)达到最小。。

建模:设拟合后的回归方程为:



应用最小二乘法求a、b。 通过计算:



求出使Q达最小时a和b的值。对Q求关于a和b的偏导数,并令其得0,即:


解得:



记:



则有:



所以,回归直线是一条过

,且斜率为b的直线。

(matlab命令为leastsq

4.多项式拟合:插值法。(此处附上插值法详解:http://wenku.baidu.com/link?url=hyyx5QfloJjKTbHQR5zU9fGzlIRNjwu18PMPnDJmeBEzQORkTk5PuSjTqBy1fhnofhMZECT7eB3nY7lNmjMPDqEEcrCjlr8U66Fj1UJTiha)

二.方差分析

1.用于两个及两个样本以上样本的均数差别的显著性检验。是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。

2.分类:单因素方差分析、双因素方差分析。

此处附上方差分析详解的链接:http://wenku.baidu.com/link?url=h34UDEw_1DzZmfaFFFZw4BxDY_TtfikByGHpGtb4YEfJaH4e85eDn_S-xN-aUovRtr07keumt9ofS0YM2mh7FKAokNInLhrOXHGDaLSz2JW

3.协方差:在概率论和统计学中,协方差表示的是两个变量总体误差的期望。而方差是协方差的一种特殊情况,即单一变量的情况。

表达式:Cov(X,Y)=E[(X-E(X))(Y-E(Y))]=E(XY)-E(X)E(Y)。Cov(X, Y) > 0, X , Y的变化趋势相同;Cov(X, Y)< 0, X, Y的变化趋势相反;Cov(X, Y)= 0, X, Y不相关,但不一定统计独立。(相反,若X, Y统计独立,他们的协方差一定为零

另外定义相关系数


若ρXY=0,则称X与Y不线性相关。

4.协方差分析:举个例子:当研究学习时间对学习绩效的影响,学生原来的学习基础、智力、学习兴趣就是协变量。将协变量对因变量的影响从自变量中分离出去,可以进一步提高实验精确度和统计检验灵敏度。

(这里附上用spss做协方差分析的学习链接:http://blog.sina.com.cn/s/blog_4bcf5ebd0101422s.html

第三天

一.线性规划和非线性规划

线性规划



matlab命令:[x,fval] = linprog(c, A, b, Aeq, beq, vlb, vub, x0);

2.非线性规划



matlab命令:[x, fval] = fmincon(‘fun1’, x0, A, b, Aeq, beq, vlb, vub, ‘fun2’);

二.微积分

1.函数连续需要满足三个条件:1.函数在该点有定义;2.函数的极限存在,极限存在表示左右极限存在且相等,如分段函数左右极限存在,但不相等;3.函数的极限等于该点的函数值。函数不连续一定存在间断点。

函数可导的充要条件: 左右导数存在且相等。

可以概括为这样一句话:可导必连续,连续极限必存在。(连续不一定可导,如:Y=lXl)

2.多元函数在某点的偏导数存在,并不能保证函数在该点连续;但若函数在某点处可微分,则函数在该点必定连续。

函数可微的条件必要条件:如果函数可微分,则该函数在该点的偏导数存在,且全微分满足:dz=(∂f/∂x) * dx + (∂f/∂y) * dy充分条件:如果函数的偏导数存在且连续,则函数在该点可微分。

3.微分方程:含未知函数及其导数的方程叫做微分方程。

分类:常微分方程;齐次方程;一阶线性微分方程、伯努利方程;全微分方程、偏微分方程(多元函数的微分方程);

微分方程的解通解:解中所含任意常数的个数与方程阶数相同;特解:不含任意常数的解。(注意,通解不一定是方程的全部解)

求微分方程解的方法:分离变量法(可能会丢失不分解)、常数变易法…

(因为内容太多,这里就直接附上同济大学关于微分方程的课件链接:http://www.doc88.com/p-27980621907.html

另外,再附上matlab解微分方程的讲解链接:http://wenku.baidu.com/view/e08f4514f18583d0496459bb.html?from=search

4.拉普拉斯方程:两个自变量的方程可表示为:



其中 Δ称为拉普拉斯算子,方程的解称为调和函数。如果等号右边是一个给定的函数f(x, y, z),则该方程为泊松方程。(本来想看一些拉普拉斯方程的应用的,这个方程主要应用于流体物理学,物理渣看了半天还是放弃了,感兴趣的朋友可以手动搜索一下)

第四天

一.离散数学建模思路

1.从介质一点A(x1,y1,z1)到其他介质一点B(x2,y2,z2)之间的最短(时间)距离——折线距离。由光线从空气到液体的折射现象中折现最短可以推广到许多实际问题,如产品多环节销售的利润、谣言或信息的多媒体传递后的真实性等,只不过折线的意义要根据实际情况改变。

2.连接不均匀介质点A到点B的最短路径——曲线路径。这里有一个最速下降问题,属于优化问题。问题是这样的:从给定一点释放小球到不在其铅垂线下的一点,不计摩擦,沿什么曲线下滑时间最短?最速下降问题的算法是变分问题,提到变分问题就要提到泛函…(数学渣表示跪了)

这里只简单介绍一下泛函。泛函就是以函数为自变量的函数,设对于任何y(x),有另一个数J[y]与之对应,则称J[y]为y(x)的泛函. 这里的定义域,即函数集合,通常包含要求y(x)满足的一定边界条件,并且具有连续的二阶导数. 泛函和复合函数不同,泛函必须给出区间上整个函数y(x),才可以得到一个泛函值。(看懂了吗?很好,我也不懂。感兴趣的朋友手动搜索之。)

然后变分问题是关于求泛函极大、极小值问题的。

3.研究均匀介质内的多个点之间的最短路径,有Steniner树理论

应用有:电信网络营业点的选址问题、电路板的布线问题等。

4.更复杂的各节点连接形成网络图,可利用Dijkstra算法

二.连续数学建模思路

1.单个群体的指数增长和指数衰减

模型:


2.单个群体的Logistic增长:增长率受环境约束

模型:


3.两个群体的Lotka—Volterra扑食—食饵模型:两个群体添加相互竞争变化

模型:


第五天

列联分析

1.列联分析多用于分类数据的处理。

2.步骤

①.从问题抽象出多种类别的因素,他们之间或相互影响或相对独立,并将数据以列联表的形式给出。

②.求每一区域的期望频数。将观察值与期望频数作比较。

③.进行一致性检验(在类别中分别抽取),显著性水平检验(先抽取,再分类)、独立性检验(先分类,再抽取),得出结论。设f0为观察值频数,fe为期望值频数:



之后几天就是看各种竞赛题找感觉、看历年的优秀论文总结精炼的格式。自我感觉这两个任务很重要,对于没有数学建模竞赛经验的新手是快速提高论文水平的有效途径。
三天两夜的比赛开始了,我们组一人负责数据的处理包括使用软件处理数据,其他两人负责建模和编写论文。对于时间的掌控需要紧凑,不要前两天轻松,到最后一天才紧张,这样对写论文很不利。再就是最后论文的提交,一定要仔细认真的弄明白过程,毕竟已经准备了这么久,最后如果因为操作问题导致不能提交论文真的很不值。
我的经验就是越到最后更要认真。也许你觉得不难,但你真的可能做不到。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  数学建模