8.2一元线性回归模型及其应用 学案(教师版)
《8.2一元线性回归模型及其应用 学案(教师版)》由会员分享,可在线阅读,更多相关《8.2一元线性回归模型及其应用 学案(教师版)(46页珍藏版)》请在七七文库上搜索。
1、8.2一元线性回归模型及其应用【知识点梳理】1一元线性回归模型我们称为Y关于x的一元线性回归模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bxa之间的随机误差2线性回归方程与最小二乘法回归直线方程过样本点的中心(,),是回归直线方程最常用的一个特征我们将x称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计(least squares estimate ),其中3残差的概念对于响应变量Y,通过观测得到的数据称为观测值,
2、通过经验回归方程得到的称为预测值,观测值减去预测值称为残差残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析4刻画回归效果的方式(1)残差图法作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好(2)残差平方和法残差平方和 (yii)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差(3)利用R2刻画回归效果决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预
3、报变量的能力R21,R2越大,即拟合效果越好,R2越小,模型拟合效果越差【典型例题】题型一求回归直线方程例1(2022甘肃临泽县第一中学高二阶段练习(文)已知变量和正相关,则由如下表所示的观测数据算得的线性回归方程为ABCD【答案】B【解析】【分析】先求出样本的中心点的坐标,再代入选项检验即得正确答案.【详解】由题得,所以样本中心点的坐标为(0,0),代入选项检验得选B.故答案为B【点睛】(1)本题主要考查回归方程直线的性质,意在考查学生对该知识的掌握水平.(2) 称为样本点的中心,回归直线过样本点的中心.这是回归方程的一个重要考点,要理解掌握并灵活运用.规律方法求线性回归方程的一般步骤(1)
4、收集样本数据,设为(xi,yi)(i1,2,n)(数据一般由题目给出)(2)作出散点图,确定x,y具有线性相关关系(3)把数据制成表格xi,yi,x,xiyi.(4)计算,x,xiyi.(5)代入公式计算,公式为(6)写出线性回归方程x.例2(2019新疆乌鲁木齐市第二十中学高二期中)随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限与所支出的总费用(万元)有如表的数据资料:使用年限23456总费用2.23.85.56.57.0(1
5、)在给出的坐标系中作出散点图;(2)求线性回归方程中的、;(3)估计使用年限为年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式, .)【答案】(1)见解析; (2) ; (3)估计使用12年时,支出总费用是14.84万元.【解析】【分析】(1)在坐标系中描点可得散点图;(2)代入公式可求;(3)根据方程代入x=12可得费用.【详解】(1)散点图如图,由图知与间有线性相关关系 (2),; (3)线性回归直线方程是,当(年)时,(万元)即估计使用12年时,支出总费用是14.84万元【点睛】本题主要考查回归直线在生活中的应用,明确所给公式中各个模块的含义,代入公式可求.题目难度不大,侧
6、重于应用性.例3(2022全国高二单元测试)有一位同学家里开了一个小卖部,他为了研究气温对热茶销售的影响,经过统计,得到一个卖出热茶杯数与当天气温的对比表如下:气温x/-504712151923273136热茶销售杯数y/杯15615013212813011610489937654(1)画出散点图;(2)你能从散点图中发现气温与热茶的销售杯数之间关系的一般规律吗?(3)如果近似成线性关系的话,请画出一条直线来近似地表示这种线性关系;(4)试求出回归直线方程;(5)利用(4)的回归方程,若某天的气温是2 ,预测这一天卖出热茶的杯数.【答案】(1)见解析;(2)见解析;(3)见解析;(4);(5)
7、143【解析】【详解】分析:(1)以x轴表示气温,以y轴表示热茶杯数,可作散点图;(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少;(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系;(4)由题中所给的数据求得回归方程即可;(5)结合回归方程的预测作用和(4)中的结论整理计算即可求得最终结果.详解:(1)以x轴表示气温,以y轴表示热茶杯数,可作散点图如下图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越
8、高,卖出去的热茶杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系,如图所示.(4)因335,778.所-2.35,所以回归直线方程(5)由(4)的方程,当x=22 ,这一天大约可以卖出143杯热茶.点睛:(1)正确运用计算,的公式和准确的计算,是求线性回归方程的关键(2)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值题型二利用回归直线方程对总体进行估计例4(2022江西抚州高二期末(理)保护生态环境,提倡环保出行,节约资源和保护环境,某地区从2016年开始大力提倡新
9、能源汽车,每年抽样1000汽车调查,得到新能源汽车y辆与年份代码x年的数据如下表:年份20162017201820192020年份代码第x年12345新能源汽车y辆305070100110(1)建立y关于x的线性回归方程;(2)假设该地区2022年共有30万辆汽车,用样本估计总体来预测该地区2022年有多少新能源汽车参考公式:回归方程斜率和截距的最小二乘估计公式分别为,【答案】(1)(2)27900【解析】【分析】(1)第一步分别算第x,y的平均值,第二步利用,即可得到方程.(2)由第一问的结果,带入方程即可算出预估的结果.(1),因为,所以,所以(2)预测该地区2022年抽样1000汽车调查
10、中新能源汽车数,当时,该地区2022年共有30万辆汽车,所以新能源汽车.规律方法本题已知y与x是线性相关关系,所以可求出回归方程进行估计和预测否则,若两个变量不具备相关关系或它们之间的相关关系不显著,即使求出回归方程也毫无意义.例5(2021陕西西安中学高二期中(理)偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差(实际成绩平均分偏差).在某次考试成绩统计中,某老师为了对学生数学偏差(单位:分)与物理偏差(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:学生序号12345678数学偏差20151332
11、-5-10-18物理偏差6.53.53.51.50.5-0.5-2.5-3.5(1)若与之间具有线性相关关系,求关于的线性回归方程;(2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.(下面是参考数据和参考公式),回归直线方程为,其中【答案】(1)(2)【解析】【分析】(1)根据最小二乘法即可求出关于的线性回归方程;(2)设该同学的物理成绩为,则物理偏差为,数学偏差为,根据回归方程可知,即可解出(1)由题意可得,所以,故线性回归方程为.(2)由题意,设该同学的物理成绩为,则物理偏差为:.而数学偏差为128-120=8,解得,所
12、以,可以预测这位同学的物理成绩为94.例6(2021广东揭阳高二期末)从2018年1月1日起,广东、等18个保监局所辖地区将纳入商业车险改革试点范围,其中最大的变化是上一年的出险次数决定了下一年的保费倍率,具体关系如下表:上一年的出险次数次以上(含次)下一年保费倍率连续两年没有出险打折,连续三年没有出险打折有评估机构从以往购买了车险的车辆中随机抽取1000 辆调查,得到一年中出险次数的频数分布如下(并用相应频率估计车辆每年出险次数的概率):一年中出险次数012345次以上(含5次)频数5003801001541(1)求某车在两年中出险次数不超过2次的概率;(2)经验表明新车商业车险保费与购车价
13、格有较强的线性相关关系,估计其回归直线方程为:.(其中(万元)表示购车价格,(元)表示商业车险保费).李先生2016 年1月购买一辆价值20万元的新车.根据以上信息,试估计该车辆在2017 年1月续保时应缴交的保费,并分析车险新政是否总体上减轻了车主负担.(假设车辆下一年与上一年都购买相同的商业车险产品进行续保)【答案】(1)0.8744;(2)3846元,减轻了车主负担.【解析】【分析】(1)利用互斥事件的概率公式列式计算即得;(2)求出下一年车险保费倍率X的分布列,并求出期望,即可得出车主下一年的保费,并根据期望是否大于1得出结论.【详解】(1)设某车在两年中出险次数为N,则,所以某车在两
14、年中出险次数不超过2次的概率为;(2)设该车辆2017 年的保费倍率为X ,则X 为随机变量,X的取值为0.85 ,1,1.25 ,1.5 ,1.75 , 2,X 的分布列为:X0.8511.251.51.752P0.500.380.100.0150.0040.001下一年保费倍率X 的期望为:,该车辆估计2017年应缴保费为:元,因,则车险新政总体上减轻了车主负担.题型三线性回归分析例7(2021山东日照青山学校高二期末)共享单车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点6天的使用单车用户的数据如下,用两种模型;分别进行拟合,得到相应的回归方程,进行残差分析得到如表所示的残差值及
15、一些统计量的值:日期x(天)123456用户y(人)132243455568模型的残差值1.12.87.51.21.90.4模型的残差值0.35.44.33.21.63.8(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型,的拟合效果,应选择哪一个模型?并说明理由;(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.(参考公式:,)【答案】(1)该选模型,理由见解析(2)【解析】【分析】(1)求出两模型的残差值的绝对值之和进行比较即可,(2)先剔除异常数据,然后利用回归方程的公式结合已知数据进行计算即可(1)应该选择模型模
16、型的残差值的绝对值之和为1.1+2.8+7.5+1.2+1.9+0.414.9模型的残差值的绝对值之和为0.3+5.4+4.3+3.2+1.6+3.818.6.14.918.6,模型的拟合效果较好,应该选模型.(2)剔除异常数据,即剔除第3天的数据后,得,.,.y关于x的回归方程为.规律方法(1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析(2)刻画回归效果的三种方法残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适残差平方
17、和法:残差平方和 (yii)2越小,模型的拟合效果越好决定系数法:R21越接近1,表明回归的效果越好例8(2021河南南阳中学高三阶段练习(文)2021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:序号1234567891
18、01112x2346810132122232425y1522274048546068.56867.56665当时,建立了y与x的两个回归模型:模型:,模型:;当时,确定y与x满足的线性回归方程为(1)根据下列表格中的数据,比较当时模型,的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;回归模型模型模型回归方程79.1320.2(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益国家补贴)的大小附:
19、刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好用最小二乘法求线性回归方程的截距:【答案】(1)对A型材料进行应用改造的投入为17亿元时的直接收益为(亿元);(2)投入17亿元比投入20亿元时收益小.【解析】【分析】(1)根据模型和相关系数公式计算比较即可,然后将x17代入较好的模型即可预测直接收益;(2)根据回归方程过样本中心点()求出,再令x20算出预测的直接收益,即可算出投入20亿元时的总收益,与(1)中的投入17亿元的直接收益比较即可.(1)对于模型,对应的,故对应的,故对应的相关指数,对于模型,同理对应的相关指数,故模型拟合精度更高、更可靠.故对A型材料进行应用改造的投入为
20、17亿元时的直接收益为(亿元).另解:本题也可以根据相关系数的公式,直接比较79.13和20.2的大小,从而说明模型拟合精度更高、更可靠.(2)当时,后五组的,由最小二乘法可得,故当投入20亿元时公司收益(直接收益国家补贴)的大小为:,故投入17亿元比投入20亿元时收益小.例9(2022陕西高新一中高三阶段练习(理)2021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜刘伯明汤洪波名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公
21、司为了将型材料更好地投入商用,拟对型材料进行应用改造.根据市场调研与模拟,得到应用改造投入(亿元)与产品的直接收益(亿元)的数据统计如下:序号123456723468101315222740485460当时,建立了y与x的两个回归模型:模型:,模型:;当时,确定y与x满足的线性回归方程为.回归模型模型模型79.1320.2(1)根据表格中的数据,比较当时模型,的相关指数的大小,并选择拟合精度更高更可靠的模型,预测对型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 8.2一元线性回归模型及其应用 学案教师版 8.2 一元 线性 回归 模型 及其 应用 教师版
链接地址:https://www.77wenku.com/p-231432.html