鲁京津琼专用2020版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系统计案例课件
《鲁京津琼专用2020版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系统计案例课件》由会员分享,可在线阅读,更多相关《鲁京津琼专用2020版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系统计案例课件(96页珍藏版)》请在七七文库上搜索。
1、11.3 变量间的相关关系、统计案例,第十一章 统计与统计案例,ZUIXINKAOGANG,最新考纲,1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系. 2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.通过对典型案例的探究,了解独立性检验的基本思想、方法及其初步应用. 4.通过对典型案例的探究,进一步了解回归分析的基本思想、方法及简单应用.,NEIRONGSUOYIN,内容索引,基础知识 自主学习,题型分类 深度剖析,课时作业,1,基础知识 自主学习,PART ONE,(1
2、)正相关 在散点图中,点散布在从_到_的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从_到_的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在_,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.,1.两个变量的线性相关,知识梳理,ZHISHISHULI,左下角,右上角,左上角,右下角,一条直线附近,2.回归方程 (1)最小二乘法 求回归直线,使得样本数据的点到它的_的方法叫做最小二乘法. (2)回归方程,距离的平方和最小,3.回归分析 (1)定义:对具有_的两个变量进行统计分析的
3、一种常用方法. (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中( )称为样本点的中心. (3)相关系数 当r0时,表明两个变量_; 当r0时,表明两个变量_. r的绝对值越接近于1,表明两个变量的线性相关性_.r的绝对值越接近于0,表明两个变量之间_.通常|r|大于_时,认为两个变量有很强的线性相关性.,相关关系,正相关,负相关,越强,几乎不存在线性相关关系,0.75,4.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的_,像这样的变量称为分类变量. (2)列联表:列出的两个分类变量的_,称为列联表.假设有两个分类变量X和Y,它
4、们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为,22列联表,不同类别,频数表,(3)独立性检验 利用随机变量_来判断“两个分类变量_”的方法称为独立性检验.,abcd,K2,有关系,1.变量的相关关系与变量的函数关系有什么区别?,提示 相同点:两者均是指两个变量的关系. 不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系. 函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.,2.如何判断两个变量间的线性相关关系?,提示 散点图中点的分布从整体上看大致在一条直线附近,或者通过计算相关系数作出判断.,【概念方法微思考】,3.独立性检验的
5、基本步骤是什么?,提示 列出22列联表,计算k值,根据临界值表得出结论.,4.线性回归方程是否都有实际意义?根据回归方程进行预报是否一定准确?,提示 (1)不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义. (2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.,题组一 思考辨析,1.判断下列结论是否正确(请在括号中打“”或“”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关 关
6、系.( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( ) (4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得线性回归方程 2.352x147.767,则气温为2时,一定可卖出143杯热饮.( ) (5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.( ),基础自测,JICHUZICE,1,2,3,4,5,6,题组二 教材改编,1,2,3,4,5,6,2.为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力 A.回归分析 B.均值与方差 C.独立性检验
7、 D.概率,解析 “近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.,则表中a,b的值分别为 A.94,72 B.52,50 C.52,74 D.74,52,1,2,3,4,5,6,3.下面是22列联表:,解析 a2173,a52. 又a22b,b74.,4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程 0.67x54.9. 现发现表中有一个数据看不清,请你推断出该数据的值为_.,设表中的“模糊数字”为a, 则62a758189755,a68.,1,2,3,4,5,6,68,题组三 易错自纠,5.某医
8、疗机构通过抽样调查(样本容量n1 000),利用22列联表和K2统计量研究患肺病是否与吸烟有关.计算得K24.453,经查阅临界值表知P(K23.841)0.05,现给出四个结论,其中正确的是 A.在100个吸烟的人中约有95个人患肺病 B.若某人吸烟,那么他有95%的可能性患肺病 C.有95%的把握认为“患肺病与吸烟有关” D.只有5%的把握认为“患肺病与吸烟有关”,1,2,3,4,5,6,解析 由已知数据可得,有10.0595%的把握认为“患肺病与吸烟有关”.,1,2,3,4,5,6,6.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系) 现已知其线
9、性回归方程为 ,则根据此线性回归方程估计数学得90分的同学的物理成绩为_.(四舍五入到整数),73,1,2,3,4,5,6,2,题型分类 深度剖析,PART TWO,题型一 相关关系的判断,例1 (1)观察下列各图形, 其中两个变量x,y具有相关关系的图是 A. B. C. D.,师生共研,解析 由散点图知中的点都分布在一条直线附近. 中的点都分布在一条曲线附近, 所以中的两个变量具有相关关系.,(2)(2018广州质检)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)的柱形图.以下结论不正确的是,A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治
10、理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关,解析 从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确; 2007年二氧化硫排放量较2006年降低了很多,B选项正确; 虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,C选项正确; 自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故选D.,判定两个变量正,负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下
11、角,两个变量负相关. (2)相关系数:当r0时,正相关;当r0时,正相关;当 0时,负相关.,跟踪训练1 (1)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线y x1上,则这组样本数据的样本相关系数为 A.1 B.0 C. D.1,解析 完全的线性关系,且为负相关,故其相关系数为1,故选A.,(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为_. x,y是负相关关系; 在该相关关系中,若用y 拟合时的相关指数为 ,用 拟合时的相关指数为 ,则 ; x,y之间不能建立线性回归
12、方程.,解析 在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故正确;,x,y之间可以建立线性回归方程,但拟合效果不好,故错误.,题型二 回归分析,命题点1 线性回归分析,多维探究,例2 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码17分别对应年份20112017. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;,因为y与t的相关系数近似为0.99, 说明y与t的线性相关程度相当高, 从而可以用线性回归模型拟合y与t的关系.,解 由折线图中数据和附注中参考数据得,(2)建立y关于t的回归方程(系数精
13、确到0.01),预测2019年我国生活垃圾无害化处理量. 附注:,所以预测2019年我国生活垃圾无害化处理量约为1.83亿吨.,命题点2 非线性回归,例3 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,(1)根据散点图判断,yabx与ycd 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由),解 由散点图可以判断,ycd 适宜作为年销售量y关于年宣传费x的回归方程类型.,(2
14、)根据(1)的判断结果及表中数据,建立y关于x的回归方程;,(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题: 年宣传费x49时,年销售量及年利润的预报值是多少? 年宣传费x为何值时,年利润的预报值最大?,解 由(2)知,当x49时,,根据(2)的结果知,年利润z的预报值,故年宣传费为46.24千元时,年利润的预报值最大.,回归分析问题的类型及解题方法 (1)求回归方程 根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关. 利用公式,求出回归系数 . 待定系数法:利用回归直线过样本点的中心求系数 . (2)利用回归方程进行预测,把线性回归方程
15、看作一次函数,求函数值. (3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数 . (4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.,跟踪训练2 (2018全国)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.,为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型: 30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.,(1)分别利用这两个模
16、型,求该地区2018年的环境基础设施投资额的预测值;,解 利用模型,可得该地区2018年的环境基础设施投资额的预测值为 30.413.519226.1(亿元). 利用模型,可得该地区2018年的环境基础设施投资额的预测值为 9917.59256.5(亿元).,(2)你认为用哪个模型得到的预测值更可靠?并说明理由.,解 利用模型得到的预测值更可靠. 理由如下: ()从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投
17、资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型 9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.,()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.,题型三 独立性检验,师生共研,例4 (2017全国)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽
18、取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;,解 旧养殖法的箱产量低于50 kg的频率为 (0.0120.0140.0240.0340.040)50.62. 因此,事件A的概率估计值为0.62.,(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:,解 根据箱产量的频率分布直方图得列联表如下:,由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关.,(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:,解 箱产量的频率分布直方图表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 鲁京津琼 专用 2020 高考 数学 一轮 复习 第十一 统计 案例 11
链接地址:https://www.77wenku.com/p-107029.html