《回归分析的基本思想及其初步应用》人教版高中数学选修2-3PPT课件(第3.1课时)
《《回归分析的基本思想及其初步应用》人教版高中数学选修2-3PPT课件(第3.1课时)》由会员分享,可在线阅读,更多相关《《回归分析的基本思想及其初步应用》人教版高中数学选修2-3PPT课件(第3.1课时)(33页珍藏版)》请在七七文库上搜索。
1、讲解人: 时间:2020.6.1 P E O P L E S E D U C A T I O N P R E S S H I G H S C H O O L M A T H E M A T I C S E L E C T I V E 2 - 3 3.1回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用 第3章 统计案例 人 教 版 高 中 数 学 选 修 2 - 3 在数学3中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为: 画散点图 求回归直线方程 用直线方程进行预报 课前导入 函数关系是一种确定性关系,而相关关系是一种非确定性关系.那么,这节课我们就学习
2、对具有相关 关系的两个变量进行统计分析的一种常用方法回归分析. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者 之间是否有关? 课前导入 探究 对于一组具有线性相关关系的数据 (x1,y1),(x2,y2),(xn,yn), 我们知道回归直线y=bx+a的斜率和截距的最小二乘估计分别为 n ii i=1 n 2 i i=1 (x - x)(y -y) b =, (x - x) a = y -bx, 新知探究 其中 nn ii i=1i=1 11 x =x ,y =y ,(x,y) nn 称为样本点的中心,你能推导出这两个计算公式吗? 回归直线过样本点的中
3、心 新知探究 从已经学过的知识我们知道,斜距 和斜率 分别是使 a b iiii Q(,)= y -y = y -(x +) 取最小时 的值.由于 , n 2 ii i=1 Q(,) =y -x -(y-x)+(y-x)- n 2 iiii i=1 2 y -x -(y-x) +2y -x -(y-x) (y-x)-+(y-x)- 新知探究 n ii i=1 n ii i=1 y -x -(y-x)(y-x-) =(y-x-)y -x -(y-x) 注注意意到到 nn ii i=1i=1 = (y-x-)y -x -n(y-x) = (y-x-)ny-nx-n(y-x)= 0, nn 2 ii
4、ii i=1i=1 2 =y -x -(y-x) +2y -x -(y-x)(y-x-) +n(y-x-) , 继续答题 新知探究 n 22 ii i=1 Q(,) =y -x -(y-x) +n(y-x-),因因此此 22 nnn 22 iiii i=1i=1i=1 =(x -x) -2(x -x)(y -y)+(y -y) +n(y-x-) 2 nn 2 2 iiiin 2 i=1i=1 i nn 22 i=1 ii i=1i=1 2 n i i=1 (x -x)(y -y)(x -x)(y -y) =n(y-x-) +(x -x)- (x -x)(x -x) +(y -y) n ii i
5、=1 n 2 i i=1 (x -x)(y -y) = (x -x) 这正是我们所要推导的公式. 在上式中,后两项和 无关,而前两项为非负数,因此要使Q取得最小值,当且仅当前两项 的值均为0,即有 , 新知探究 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 例题1 编 号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. 新知探究 解答 第一步:画散点图 0 20 40
6、 60 80 150155160165170175180 身高/cm 体重/kg 新知探究 第二步:求回归方程 第三步:代值计算 计算器得: 故线性回归方程: 当x=172时, 0.849.b -85.712,a 85.712.-0.849xy y 0.849 172-85.712 60.316(kg) 新知探究 0 20 40 60 80 150155160165170175180 身高/cm 体重/kg 显然,身高172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重在60.316kg左右,下图 中的样本点和回归直线的相互位置说明了这一点. 探究 高为172c的女大学生
7、的体重一定是60.316kg吗?如果不是,其原因是什么? 新知探究 由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用线性回 归模型 y=bx+a+e 来表示,这里a和b为模型的未知参数,e是y与bx+a之间的误差.通常e为随机变量,称为随机误 差.它的均值E(e)=0,方差D(e)= 20,这样线性回归的完整表达式为 y=bx+a+e E(e)=0, D(e)= 2. 新知探究 注意 存在误差的原因 (1)随机误差,其大小取决于随机误差的方差. 在线性回归模型中,随机误差e的方差 2越 小 ,用bx+a预报真实值y的精度越高. (2) 和 为斜率和截距的估计值,它
8、们与真实值a和b之间也存在误差. b a 要牢记! 新知探究 探究 在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应该怎样 研究随机误差呢? 在实际应用中,我们用回归方程 a xb y 中的 估计bx+a. 由于随机误差e=y-(bx+a),所以 是e的估计值. 对于样本点 (x1,y1),(x2,y2),(xn,yn) y y -ye 新知探究 而言,它们的随机误差为ei=yi-bxi-a,i=1,2,n, 其估计值为 n,1,2,.,2,.,i,i a xb y y y e iiii i e 称为相应于点(xi,yi)的残差(residual). 要牢记
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归分析的基本思想及其初步应用 回归 分析 基本 思想 及其 初步 应用 人教版 高中数学 选修 PPT 课件
链接地址:https://www.77wenku.com/p-176142.html