2019人教A版数学选修2-3学案:3.1回归分析的基本思想及其初步应用
《2019人教A版数学选修2-3学案:3.1回归分析的基本思想及其初步应用》由会员分享,可在线阅读,更多相关《2019人教A版数学选修2-3学案:3.1回归分析的基本思想及其初步应用(16页珍藏版)》请在七七文库上搜索。
1、31 回归分析的基本思想及其初步应用1.了解随机误差、残差、残差图的概念 2.会通过分析残差判断线性回归模型的拟合效果3掌握建立线性回归模型的步骤1回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报2线性回归模型(1)在线性回归直线方程 x 中, , ,其中y a b b n i 1 (xi x)(yi y) n i 1 (xi x)2 a y b x xi, yi,(x,y )称为样本点的中心,回归直线过样本点的中心x 1n n i 1 y 1n n i 1(2)线性回归模型 ybxae,其
2、中 e 称为随机误差,自变量 x 称为解释变量,因变量 y称为预报变量注意 (1)非确定性关系:线性回归模型 ybxae 与确定性函数 yabx 相比,它表示 y 与 x 之间是统计相关关系(非确定性关系),其中的随机误差 e 提供了选择模型的准则以及在模型合理的情况下探求最佳估计值 a,b 的工具(2)线性回归方程 x 中 , 的意义是:以 为基数, x 每增加 1 个单位,y 相应地平均y b a a b a 增加 个单位b 3刻画回归效果的方式方式方法 计算公式 刻画效果R2R21 n i 1 (yi y i)2 n i 1 (yi y)2R2 越接近于 1,表示回归的效果越好残差图i
3、称为相应于点(x i,y i)的残差,e 残差点比较均匀地落在水平的iy i ie y 带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高残差平方和 (yi i)2 n i 1 y 残差平方和越小,模型的拟合效果越好判断正误(正确的打“” ,错误的打 “”)(1)求线性回归方程前可以不进行相关性检验( )(2)在残差图中,纵坐标为残差,横坐标可以选为样本编号( )(3)利用线性回归方程求出的值是准确值( )答案:(1) (2) (3) 变量 x 与 y 之间的回归方程表示( )Ax 与 y 之间的函数关系Bx 与 y 之间的不确定性关
4、系Cx 与 y 之间的真实关系形式Dx 与 y 之间的真实关系达到最大限度的吻合答案:D在两个变量 y 与 x 的回归模型中,分别选择了 4 个不同的模型,它们的相关指数 R2 如下,其中拟合效果最好的模型是( )A模型 1 的相关指数 R2 为 0.98B模型 2 的相关指数 R2 为 0.80C模型 3 的相关指数 R2 为 0.50D模型 4 的相关指数 R2 为 0.25答案:A已知线性回归方程 0.75x0.7,则 x11 时,y 的估计值为 _y 答案:8.95探究点 1 线性回归方程在某种产品表面进行腐蚀刻线试验,得到腐蚀深度 y 与腐蚀时间 x 之间的一组观察值如下表.x(s)
5、 5 10 15 20 30 40 50 60 70 90 120y(m) 6 10 10 13 16 17 19 23 25 29 46(1)画出散点图;(2)求 y 对 x 的线性回归方程;(3)利用线性回归方程预测时间为 100 s 时腐蚀深度为多少【解】 (1)散点图如图所示(2)从散点图中,我们可以看出 y 对 x 的样本点分布在一条直线附近,因而求回归直线方程有意义x (51015120)111 ,y (6101046) ,51011 111 21411y x 0.304 5.36.a b 21411 51011故腐蚀深度对腐蚀时间的线性回归方程为 y0.304x5.36.(3)根
6、据(2)求得的线性回归方程,当腐蚀时间为 100 s 时, 5.360.30410035.76(m),y 即腐蚀时间为 100 s 时腐蚀深度大约为 35.76 m. 求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系(2)求回归系数:若存在线性相关关系,则求回归系数(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系如果已测得炉料熔化完毕时钢水的含碳量 x 与冶炼时间 y(从炼料熔化完毕到出钢的时间) 的数据(x i,y i)(i1,2,
7、10)并已计算出1 589,i1 720,10i 1y故冶炼时间 y 对钢水的含碳量 x 的回归直线方程为 1.267x30.47.y 探究点 2 线性回归分析假定小麦基本苗数 x 与成熟期有效穗 y 之间存在相关关系,今测得 5 组数据如下:(1)以 x 为解释变量,y 为预报变量,作出散点图;(2)求 y 与 x 之间的回归方程,对于基本苗数 56.7 预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求相关指数 R2,并说明残差变量对有效穗的影响占百分之几?【解】 (1)散点图如下(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它x 15.0 25.
8、8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2们之间的关系设回归方程为 x , 30.36, 43.5,y b a x y (1)该类题属于线性回归问题,解答本题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数 R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析(2)刻画回归效果的三种方法残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适;残差平方和法:残差平方和 (yi i)2越小,模型的拟合效果越好;ni 1 y 关于 x 与 y 有如下数据:x 2
9、4 5 6 8y 30 40 60 50 70由(2)可得 yi i与 yi 的关系如下表:y y yi iy 1 5 8 9 3yi y 20 10 10 0 20由于 R 0.845,R 0.82,0.8450.82,21 2所以 R R .21 2所以(1)的拟合效果好于(2) 的拟合效果探究点 3 非线性回归分析某地今年上半年患某种传染病的人数 y(人) 与月份 x(月)之间满足函数关系,模型为yae bx,确定这个函数解析式月份 x/月 1 2 3 4 5 6人数 y/人 52 61 68 74 78 83【解】 设 uln y ,cln a ,得 x,u c b 则 u 与 x 的
10、数据关系如下表:x 1 2 3 4 5 6u ln y 3.95 4.11 4.22 4.304 4.356 7 4.418 8非线性回归方程的步骤(1)确定变量,作出散点图(2)根据散点图,选择恰当的拟合函数(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果(5)根据相应的变换,写出非线性回归方程某种书每册的成本费 y(元) 与印刷册数 x(千册)有关,经统计得到数据如下:x(千册) 1 2 3 5 10 20 30 50 100 200y(元 ) 10.15 5.52 4.08 2.85 2.11
11、1.62 1.41 1.30 1.21 1.15检验每册书的成本费 y(元)与印刷册数的倒数 之间是否具有线性相关关系,如有,求出 y1x对 x 的回归方程,并画出其图形解:首先作变量置换 u ,题目中所给的数据变成如下表所示的 10 对数据1xui 1 0.5 0.33 0.2 0.1 0.05 0.03 0.02 0.01 0.005yi 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15然后作相关性检测经计算得 r0.999 80.75,从而认为 u 与 y 之间具有线性相关关系,由公式得1.125, 8.973,所以 1.1258.97
12、3u,最后回代 u ,可得 1.125 .a b y 1x y 8.973x这就是题目要求的 y 对 x 的回归方程回归方程的图形如图所示,它是经过平移的反比例函数图象的一个分支1关于回归分析,下列说法错误的是( )A回归分析是研究两个具有相关关系的变量的方法B散点图中,解释变量在 x 轴,预报变量在 y 轴C回归模型中一定存在随机误差D散点图能明确反映变量间的关系解析:选 D.用散点图反映两个变量间的关系时,存在误差2下列关于统计的说法:将一组数据中的每个数据都加上或减去同一个常数,方差恒不变;回归方程 x 必经过点(x,y);y b a 线性回归模型中,随机误差 ey i i;y 设回归方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2019 人教 数学 选修 3.1 回归 分析 基本 思想 及其 初步 应用
链接地址:https://www.77wenku.com/p-76671.html