1、第一章 统计案例 章末复习学习目标1.理解独立性检验的基本思想及实施步骤.2.会求回归直线方程,并用回归直线进行预报122列联表22列联表如表所示:B合计An11n12n1n21n22n2合计n1n2n其中n1n11n21,n2n12n22,n1n11n12,n2n21n22,nn11n21n12n22.2最小二乘法对于一组数据(xi,yi),i1,2,n,如果它们线性相关,则回归直线方程为x,其中, .3独立性检验常用统计量2来检验两个变量是否有关系类型一独立性检验例1为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的22列联表:喜爱打篮球不喜爱打篮球合计男生6女
2、生10合计48已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.(1)请将上面的22列联表补充完整;(不用写计算过程)(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由考点独立性检验及其基本思想题点独立性检验的综合应用解(1)列联表补充如下:喜爱打篮球不喜爱打篮球合计男生22628女生101020合计321648(2)由24.286.因为4.2863.841,所以能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关反思与感悟通过公式2计算出2的值,再与临界值作比较,最后得出结论跟踪训练1奥运会期间,为调查某高校学生是否愿意提供志愿者服务,
3、用简单随机抽样方法从该校调查了60人,结果如下: 是否愿意提供志愿者服务性别愿意不愿意男生2010女生1020(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?(2)你能否在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:P(2x0)0.150.100.050.0250.0100.0050.001x02.0722.7063.8415.0246.6357.87910.828考点独立性检验思想的应用题点独立性检验在分类变量中的应用解(1)由题意,可知男生抽取64(人)(2)26.667,由于6.6676.635,
4、所以能在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关类型二线性回归分析例2某城市理论预测2010年到2014年人口总数与年份的关系如表所示:年份201x(年)01234人口数y(十万)5781119(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y关于x的回归直线方程x;(3)据此估计2019年该城市人口总数考点回归分析思想的应用题点回归分析思想的应用解(1)散点图如图:(2)因为2,10,iyi051728311419132,021222324230,所以3.2, 3.6.所以回归直线方程为3.2x3.6.(3)令x9,则3.293.632.
5、4,故估计2019年该城市人口总数为32.4(十万)反思与感悟解决回归分析问题的一般步骤(1)画散点图根据已知数据画出散点图(2)判断变量的相关性并求回归方程通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程(3)实际应用依据求得的回归方程解决实际问题跟踪训练2某运动员训练次数与运动成绩之间的数据关系如下:次数x3033353739444650成绩y3034373942464851(1)作出散点图;(2)求出回归直线方程;(3)计算相关系数并进行相关性检验;(4)试预测该运动员训练47次及55次的成绩解(1)作出该运动员训练次数x与成绩y之
6、间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系(2)列表计算:次数xi成绩yixyxiyi303090090090033341 0891 1561 12235371 2251 3691 29537391 3691 5211 44339421 5211 7641 63844461 9362 1162 02446482 1162 3042 20850512 5002 6012 550由上表可求得39.25,40.875,x12 656,y13 731,xiyi13 180, 1.041 5, 0.003 88,回归直线方程为y1.041 5x0.003 88.(3)计算相关系数r0.
7、992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系(4)由上述分析可知,我们可用回归直线方程y1.041 5x0.003 88作为该运动员成绩的预报值将x47和x55分别代入该方程可得y49和y57.故预测该运动员训练47次和55次的成绩分别为49和57.1从某地区老人中随机抽取500人,其生活能否自理的情况如下表所示,则() 性别 人数生活能否自理男女能178278不能2321A.有95%的把握认为老人生活能否自理与性别有关B有99%的把握认为老人生活能否自理与性别有关C没有充分理由认为老人生活能否自理与性别有关D以上都不对考点独立性检验及其基本思想题点独立性检验的思想答案C解析
8、经计算,得22.9253.841,故我们没有充分的理由认为老人生活能否自理与性别有关2“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归根据他的结论,在儿子的身高y与父亲的身高x的回归直线方程x中,的值()A在(1,0)内 B等于0C在(0,1)内 D在1,)内考点线性回归分析题点回归直线方程的应用答案C解析子代平均身高向中心回归,应为正的真分数,故选C.3四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正
9、相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()A B C D考点线性回归分析题点回归直线方程的应用答案D解析中,回归方程中x的系数为正,不是负相关;中,回归方程中x的系数为负,不是正相关,所以一定不正确4对于回归直线方程x,当x3时,对应的y的估计值是17,当x8时,对应的y的估计值是22,那么,该回归直线方程是_,根据回归直线方程判断当x_时,y的估计值是38.考点线性回归分析题点回归直线方程的应用答案x1424解析首先把两组值代入回归直线方程,得解得所以回归直线方程是x14.令x1438,可得x24,即当x24时,y的估计值是38.1建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量(2)画出散点图,观察它们之间的关系(3)由经验确定回归方程的类型(4)按照一定的规则估计回归方程中的参数2独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法.