高考总复习:知识讲解 回归分析的基本思想及其初步应用(文、理)
《高考总复习:知识讲解 回归分析的基本思想及其初步应用(文、理)》由会员分享,可在线阅读,更多相关《高考总复习:知识讲解 回归分析的基本思想及其初步应用(文、理)(17页珍藏版)》请在七七文库上搜索。
1、 回归分析的基本思想及其初步应用编稿:赵雷 审稿:李霞【学习目标】1. 通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤。2. 能作出散点图,能求其回归直线方程。3. 会用所学的知识对简单的实际问题进行回归分析。【要点梳理】要点一、变量间的相关关系1. 变量与变量间的两种关系:(1) 函数关系:这是一种确定性的关系,即一个变量能被另一个变量按照某种对应法则唯一确定例如圆的面积S与半径r之间的关系S=r2为函数关系 (2)相关关系:这是一种非确定性关系当一个变量取值一定时,另一个变量的取值带有一定的随机性,这两个变量之间的关系叫做相关关系。例如人的身高不能确定体重,但一般来说“身高
2、者,体重也重”,我们说身高与体重这两个变量具有相关关系 2. 相关关系的分类:(1)在两个变量中,一个变量是可控制变量,另一个变量是随机变量,如施肥量与水稻产量;(2)两个变量均为随机变量,如某学生的语文成绩与化学成绩 3. 散点图:将两个变量的各对数据在直角坐标系中描点而得到的图形叫做散点图它直观地描述了两个变量之间有没有相关关系这是我们判断的一种依据4. 回归分析:与函数关系不同,相关关系是一种非确定性关系,对具有相关关系的两个变量进行统计分析的方法叫做回归分析。要点二、线性回归方程: 1回归直线如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条
3、直线叫作回归直线。2回归直线方程对于一组具有线性相关关系的数据,其回归直线的截距和斜率的最小二乘法估计公式分别为:,其中表示数据xi(i=1,2,n)的均值,表示数据yi(i=1,2,n)的均值,表示数据xiyi(i=1,2,n)的均值 、的意义是:以为基数,x每增加一个单位,y相应地平均变化个单位要点诠释:回归系数,也可以表示为,这样更便于实际计算。;。称为样本中心点,回归直线必经过样本中心点。回归直线方程中的表示x增加1个单位时的变化量,而表示不随x的变化而变化的量。3求回归直线方程的一般步骤:作出散点图由样本点是否呈条状分布来判断两个量是否具有线性相关关系,若存在线性相关关系,进行第二步
4、。求回归系数、计算,利用公式求出,再由求出的值; 写出回归直线方程;利用回归直线方程预报在x取某一个值时y的估计值。要点诠释:一般地,我们可以利用回归直线方程进行预测,但这里所得到的值是预报值,而不是精确值,它带有很大的随机性,可能对于某一次的实际值而言会有很大的出入,这是因为:(1)回归直线的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差。(2)即使截距和斜率的估计没有误差,也不可能保证对应于x的预报值能够与实际值y很接近。我们不能保证点(x,y)落在回归直线上,甚至不能保证它落在回归直线的附近,事实上,这里是随机变量,预报值与实际值y的接近程度由随机变量决定
5、。尽管我们利用回归直线方程所得到的值仅是一个预报值,它具有随机性,但它是我们根据统计规律所得到的结论,因而结论正确的概率很大。故我们可以放心地利用回归直线方程进行预测。要点三、相关性检验(1)相关系数r的定义对于变量x与y随机抽取到的n对数据,称为x与y的样本相关系数。(2)相关系数r的作用样本相关系数r用于衡量两个变量之间是否具有线性相关关系,描述线性相关关系的强弱:越接近1,表明两个变量之间的线性相关程度越强;越接近0,表明两个变量之间的线性相关程度越弱。当r0时,表明两个变量正相关, 即x增加,y随之相应地增加,若x减少,y随之相应地减少当r0时,表明两个变量负相关, 即x增加,y随之相
6、应地减少;若x减少,y随之相应地增加若r=0,则称x与y不相关。当,认为x与y之间具有很强的线性相关关系。当大于时,表明有95%的把握认为x与y之间具有线性相关关系,这时求回归直线方程有必要也有意义,当时,寻找回归直线方程就没有意义。(3)利用相关系数r检验的一般步骤:法一:作统计假设:x与y不具有线性相关关系。根据样本相关系数计算公式算出r的值。比较与0.75的大小关系,得出统计结论。如果,认为x与y之间具有很强的线性相关关系。法二:作统计假设:x与y不具有线性相关关系。根据样本相关系数计算公式算出r的值。根据小概率0.05与n-2在相关性检验的临界值表中查出r的一个临界值(n未数据的对数)
7、。比较与,作统计推断,如果,表明有95%的把握认为x与y之间具有线性相关关系。如果,我们没有理由拒绝原来的假设,即不认为x与y之间具有线性相关关系。这时寻找回归直线方程是毫无意义的。要点四、线性回归分析与非线性回归分析1线性回归分析 对于回归分析问题,在解题时应首先利用散点图或相关性检验判断x与y是否具有线性相关关系,如果线性相关,才能求解后面的问题否则求线性回归方程没有实际意义,它不能反映变量x与y,之间的变化规律只有在x与y之间具有相关关系时,求线性回归方程才有实际意义 相关性检验的依据:主要利用检验统计量 (其中化简式容易记也好用)求出检验统计量的样本相关系数,再利用r的性质确定x和y是
8、否具有线性相关关系,r具有的性质为:|r|1且|r|越接近于1,线性相关程度越强;|r|越接近于0,线性相关程度越弱2. 线性回归分析的一般步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)判断两变量是否具有线性相关关系作散点图由样本点是否呈条状分布来判断两个量是否具有线性相关关系。求相关系数r当,认为x与y之间具有很强的线性相关关系。(3)若两变量存在线性相关关系,设所求的线性回归方程为,求回归系数、。(4)写出回归直线方程;(5)利用回归直线方程预报在x取某一个值时y的估计值。 3非线性回归分析 (1)对于非线性回归分析问题,如果给出了经验公式可直接利用换元,使新元
9、与y具有线性相关关系,进一步求出,对新元的线性回归方程,换回x即可得y对x的回归曲线方程(2)非线性回归问题有时并不给出经验公式,这时按以下步骤求回归方程:画出已知数据的散点图,看是否是线性回归分析问题,如果不是,把它与必修数学中学过的函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,采用适当的变量置换,把非线性回归分析问题化为线性回归分析问题作相关性检验,即判断寻找线性回归方程是否有意义当寻找线性回归方程有意义时,计算系数,得到线性回归方程代回x得y对x的回归曲线方程【典型例题】【高清课堂:回归分析的基本思想及其初步应用407591例题1】类型一、利用散点图
10、判断两个变量的线性相关性 例1 在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x的一组数据如下表所示x秒510152030405060y微米610111316171923 (1)画出散点图 (2)根据散点图,你能得出什么结论? 【思路点拨】 利用散点图,直观地归结出相关关系的两个变量所具备的特点 【解析】 (1)如图所示散点图 (2)结论:设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点大致分布在一条直线附近,其中整体上与这n个点最接近的一条直线最能代表x与y之间的关系【总结升华】解决此类问题,最直观也最直接的方法就是画散点图。如果散点图中的点分布在一条直线附近,那么就可
11、判断两个变量之间具有近似的线性相关关系。可进一步对它进行回归分析。解决本题的关键是正确建立坐标系,合理地选取单位长度准确地描出所有点,然后观察散点图中的点呈现在一条直线附近即说明二者具有线性相关关系。解决此类题目,由于有时数据较大,在建立平面直角坐标系时,若单位长度确定不合适,往往容易造成描点的困难。因此必须选择适当的单位长度。举一反三:【变式1】给出x与y的数据如下:x24568y3040605070 画出散点图,并由图判断x、y之间是否具有线性相关关系。【答案】散点图如图所示: 从图中可以看出,各点散布在一条直线附近,即可认为x与y具有线性相关关系。【变式2】 如图所示的5组数据中,去掉_
12、点,剩下的4组数据的线性相关系数最大 【答案】D,由本图的直观性可得。【变式3】如下表所示,某地区一段时间内观察到的大于或等于某震级x的地震个数为N,试画出散点图,并由图判断x、N之间是否具有线性相关关系。震级33.23.43.63.844.24.44.64.85.0地震数28381203801479510695764155023842269819191356973震级5.25.45.65.866.26.46.66.87地震数74660443527420614898574125【答案】由表中数据得散点图如下:从散点图中可以看出,震级x与大于该震级的地震次数N之间不呈线性相关关系,随着x的减少,
13、所考察的地震数N近似地以指数形式增长.类型二、运用样本相关系数r检验线性相关关系例2下表是随机抽取的对母女的身高数据,试根据这些数据探讨与之间的关系母亲身高女儿身高【思路点拨】相对于用散点图检验相关性,利用相关系数r,检验两个变量之间的线性相关关系的强弱更为准确。【解析】所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近, 因为, ,所以,由检验水平及,在附录中查得,因为,所以可以认为与之间具有较强的线性相关关系【总结升华】(1)讨论x与y之间的线性相关关系,一般称之为相关性检验。一般地,相关性检验是讨论线性回归模型的第一步。当时,可以认为两个变量有很强的线性相关关系,此时,建立线性
14、回归模型是有意义的,其他情况下,建立线性回归模型意义就不大了,基本上没有什么价值。(2)相关系数r的计算公式:(3)利用相关系数r检验两个变量之间的线性相关关系的强弱的步骤:运用公式求出相关系数r;比较与0.75的大小关系,得出统计结论。如果,认为x与y之间具有很强的线性相关关系。举一反三:【变式1】给出x与y的数据如下:x24568y3040605070判断x与y的线性相关性。【答案】相关性检验:,所以。因为,所以x与y之间有很强的线性相关关系。【变式2】要分析学生高中入学的数学成绩对高一年级数学学习的影响,在高一年级学生中随机抽取名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩如下
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高考总复习:知识讲解 回归分析的基本思想及其初步应用文、理 高考 复习 知识 讲解 回归 分析 基本 思想 及其 初步 应用
链接地址:https://www.77wenku.com/p-123258.html