高考总复习:知识讲解_《统计案例》全章复习与巩固_不分层
《高考总复习:知识讲解_《统计案例》全章复习与巩固_不分层》由会员分享,可在线阅读,更多相关《高考总复习:知识讲解_《统计案例》全章复习与巩固_不分层(14页珍藏版)》请在七七文库上搜索。
1、统计案例全章复习与巩固编稿:张林娟 审稿:孙永钊【学习目标】1.通过对典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.2.通过对典型案例的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用.【知识网络】【要点梳理】要点一:线性回归分析回归分析是应用及其广泛的数据分析方法,它依赖于观测到的真实数据,分析内在规律,从而用来预报、控制相关问题. 回归分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析(在本章只研究可线性化的非线性回归分析). 如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为(一元)线
2、性回归分析.回归直线方程对于一组具有线性相关关系的数据,其回归直线的截距和斜率的最小二乘法估计公式分别为:其中,分别表示数据的平均数.要点诠释:(1)、的意义是:以为基数,每增加一个单位,相应地平均变化个单位(2)称为样本中心点,回归直线必经过样本中心点.求回归直线方程的一般步骤:作出散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系,若存在线性相关关系,进行第二步.求回归系数、:,利用公式求出;由求出的值; 写出回归直线方程;利用回归直线方程预报在取某一个值时的估计值.相关性检验1.残差分析对于样本,.其中,表示残差,其计算公式为:(真实值)(预报值的估计量);表示残差平方和,其
3、计算公式为:.类比样本方差估计总体的思想,可以用残差平方和衡量回归方程的预报精度.通常越小,预报精度越高.2.相关指数相关指数:.其中,表示预报值的估计量;表示样本预报变量的平均数.取值越大,意味着残差平方和越小,也就是模型的拟合效果越好.在线性回归直线总,表示解释变量对于预报变量变化的贡献率. 越接近1,解释变量和预报变量的线性相关性越强,那么表示回归的效果越好.如果对某组数据可能采取几种不同的回归方程进行分析,也可以通过比较几个,选择大的模型作为这组数据的模型.3.相关系数利用样本相关系数用于衡量两个变量之间是否具有线性相关关系,描述线性相关关系的强弱: (1)当0时,表明两个变量正相关,
4、 即增加,随之相应地增加,若减少,随之相应地减少当越接近1,表明两个变量之间的线性相关程度越强;越接近0,表明两个变量之间的线性相关程度越弱.当,认为与之间具有很强的线性相关关系.(2)当0时,表明两个变量负相关, 即增加,随之相应地减少;若减少,随之相应地增加(3)若=0,则称与不相关.线性回归分析的一般步骤(1)确定研究对象,明确哪个变量是解释变量(),哪个变量是预报变量();(2)判断两变量是否具有线性相关关系作散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系.求相关系数:当,认为与之间具有很强的线性相关关系.(3)若两变量存在线性相关关系,设所求的线性回归方程为,求回归系
5、数、. 计算,利用公式求出;由求出的值; (4)写出回归直线方程;(5)利用回归直线方程预报在()取某一个值时()的估计值.要点二:可线性化的回归分析常见的非线性回归模型幂函数曲线:;指数曲线:;倒指数曲线:;对数曲线:.求非线性回归直线方程的一般方法非线性函数可以通过变换转化为线性函数,得到线性回归方程,再通过相应变换得到非线性回归方程.比如:(1)幂函数曲线转换为线性函数的方法:对两边取对数,得,记,则.即回到线性回归直线方程,于是可以用最小二乘法计算.(2)将指数曲线转换为线性函数的方法:对两边取对数,得,记,则.即回到线性回归直线方程,于是可以用最小二乘法计算.(3)将倒指数曲线转换为
6、线性函数的方法:对两边取对数,得,记,则.即回到线性回归直线方程,于是可以用最小二乘法计算.(4)对数曲线转换为线性函数的方法:记,则.即回到线性回归直线方程,于是可以用最小二乘法计算.非线性回归分析的一般步骤确定研究对象,明确变量关系,即弄请哪个变量是解释变量(),哪个变量是预报变量();画出散点图,观察变量之间的关系;由经验确定回归方程的类型;按一定规则估计回归方程中的参数;利用回归直线方程预报在()取某一个值时()的估计值要点三:独立性检验独立性检验统计学的一种检验方式,它是根据22列联表,再通过卡方统计量公式计算的值,利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法.
7、卡方统计量公式假设有两个分类变量X与Y的关系,经调查得到一张22列联表,如下表所示:Y1Y2合计X1+X2cdc+d合计+c+dn=+c+d统计中有一个有用的(读做“卡方”)统计量,它的表达式是: 变量独立性的判断通过对统计量分布的研究,已经得到两个临界值:3.841和6.635.当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:如果2.706时,没有充分的证据证明事件、有关联,可认为事件与是没有关联的;当2.706时,有90%的把握判定事件、有关联;如果3.841时,有95%的把握说事件与事件有关;如果6.635时,有99%的把握说事件与事件有关.要点诠释:独立性检验的基本思想是统
8、计学中的假设检验思想.即在H0:事件与无关的统计假设下,利用统计量的大小来决定在多大程度上拒绝原来的统计假设H0,即拒绝“事件与无关”,从而认为事件与有关.独立性检验为假设检验的特例.独立性检验的基本步骤及简单应用要推断“与是否有关”,可按下面步骤进行:(1)提出统计假设H0:事件与无关(相互独立);(2)抽取样本(样本容量不要太小,每个数据都要大于5);(3)列出22列联表;(4)根据22列联表,利用公式:,计算出的值;(5)统计推断:当2.706时,认为事件与是没有关联的;当2.706时,有90%的把握判定事件、有关联;当3.841时,有95的把握判定事件、有关联;当6.635时,有99的
9、把握判定事件、有关联.要点诠释:独立性检验的基本思想类似于反证法要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量应该很小,如果由观测数据计算得到的的观测值很大,则在一定程度上说明假设不合理根据随机变量的含义,由实际计算的6.635,说明假设不合理的程度约为99,即“两个分类变量有关系”这一结论成立的可信程度约为99当2.706时,认为两个分类变量是无关的【例题讲解】类型一:抽象概括思想例1. 收集一只棉铃虫的产卵数y与温度X的几组数据后发现两个变量有相关关系,并按不同的曲线来拟合y与x之间的回归方程,并算出
10、了对应相关指数如下表:拟合曲线直 线指数曲线抛 物 线二次曲线y与x回归方程相关指数0.7460.9960.9020.002则这组数据模型的回归方程的最好选择应是( )A. B.C. D.【思路点拨】题目给出了四个不同的回归方程及其相关指数,根据“相关指数越大拟合效果越好”来判断选择哪条拟合曲线.【答案】B【解析】0.9960.9020.7460.0020,这表明指数曲线拟合效果最好,而二次曲线拟合效果最差,故选B.【思路点拨】曲线的拟合效果可以通过残差分析、相关指数或者相关系数来检验,在使用时要注意这三者之间的区别。相关系数多用于衡量两个变量间的线性相关关系的强弱;残差分析和相关指数除了衡量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计案例 高考 复习 知识 讲解 统计 案例 巩固 分层
链接地址:https://www.77wenku.com/p-123234.html