1、第一章测评(时间 120 分钟,满分 150 分)一、选择题(本大题共 12 小题,每小题 5 分,共 60 分)1.已知下面的 22 列联表:y1 y2 总计x1 a b 73x2 22 c 47总计 74 46 120则 a+b+c 等于( )A.96 B.97C.98 D.99解析: 根据表中的数据,可得 a+b+c+22=120,所以 a+b+c=120-22=98.答案: C2.在线性回归模型 y=bx+a+ 中,下列说法正确的是( )A.y=bx+a+ 是一次函数B.因变量 y 是由自变量 x 唯一确定的C.因变量 y 除了受自变量 x 的影响外,可能还受到其他因素的影响,这些因素
2、会导致随机误差 的产生D.随机误差 是由于计算不准确造成的,可以通过精确计算避免随机误差 的产生解析: 线性回归模型 y=bx+a+,反映了变量 x,y 间的一种线性关系,预报变量 y 除受解释变量 x影响外,还受其他因素的影响,用 来表示,故 C 正确.答案: C3.已知某种产品的支出广告额 x(单位:万元)与利润额 y(单位:万元)之间有如下对应数据:x 3 4 5 6 7y 20 30 30 40 60则回归直线必过点( )A.(5,36) B.(5,35)C.(5,30) D.(4,30)解析: 由题意可知回归直线方程必过样本点的中心 ,即(5,36).答案: A4.2016 法国欧洲
3、杯比赛于 6 月中旬揭开战幕,随机询问 100 人是否喜欢足球,得到如下的 22列联表:喜欢足球 不喜欢足球 总 计男 35 15 50女 25 25 50总 计 60 40 100临界值表:P(K2k 0) 0.05 0.025 0.010k0 3.841 5.024 6.635参照临界值表,下列结论正确的是( )A.有 95%的把握认为“ 喜欢足球与性别有关系 ”B.有 95%的把握认为“喜欢足球与性别没有关系”C.在犯错误的概率不超过 2.5%的前提下,认为“喜欢足球与性别没有关系”D.在犯错误的概率不超过 2.5%的前提下,认为“喜欢足球与性别有关系”解析: 由题意 K2= 4.173
4、.841,由于 P(K23.841)0.05,所以有 95%的把握认为“喜欢足球与性别有关系” .答案: A5.若两个分类变量 x 和 y 的列联表为:y1 y2 合 计x1 10 45 55x2 20 30 50合 计 30 75 105则 x 与 y 之间有关系的可能性为( )A.0.1% B.99.9% C.97.5% D.0.25%解析: 代入公式 K2= 6.115.024,查表可得,P(K 25.024)=0.025,1-0.025=97.5%,故 x 与 y 之间有关系的可能性为 97.5%.答案: C6.已知方程 =0.85x-85.7 是根据女大学生的身高预报体重的回归方程,
5、其中 x, 的单位分别是cm,kg,则该方程在样本(165,57)处的残差是( )A.54.55 B.2.45 C.-2.45 D.111.55解析: 该方程在样本(165,57)处的残差为 57-(0.85165-85.7)=2.45.答案: B7.已知具有线性相关的两个变量 x,y 之间的一组数据如下表所示:x 0 1 2 3 4y 2.2 4.3 t 4.8 6.7且回归方程是 =0.95x+2.6,则 t=( )A.4.7 B.4.6C.4.5 D.4.4解析: 因为 (0+1+2+3+4)=2, (2.2+4.3+t+4.8+6.7)= ,代入回归方程 =0.95x+2.6,得t=4
6、.5.答案: C8.甲、乙、丙、丁四名同学在建立变量 x,y 的回归模型时,分别选择了 4 种不同的模型,计算得到了它们的残差平方和分别如下表:甲 乙 丙 丁残差平方和 40.65 52.76 39.05 47.88则建立回归模型拟合效果最好的同学是( )A.甲 B.乙C.丙 D.丁解析: 残差平方和越小,相关指数越大 ,拟合效果越好,所以丙同学的模型拟合效果最好.答案: C9.为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价 x/元 8 8.2 8.4 8.6 8.8 9销量 y/件 90 84 83 80 75 68若计算得到的线性回归方程为 x+2
7、50,则 等于 ( )A.20 B.30C.-20 D.-30解析: 由题意得 =8.5, =80,因为 +250,所以 80=8.5 +250,解得 =-20.答案: C10.根据一组实验数据(1,3.3),(2,5.4),(3,8.8),(4,10.5),(5,16.5)得到的线性回归方程为 =3x-0.5,则残差平方和等于( )A.5.74 B.27.7C.1.15 D.115解析: 残差平方和=(3.3-2.5) 2+(5.4-5.5)2+(8.8-8.5)2+(10.5-11.5)2+(16.5-14.5)2=5.74.答案: A11.已知变量 x,y 之间的线性回归方程为 =-0.
8、7x+10.3,且变量 x,y 之间的一组相关数据如下表所示,则下列说法错误的是( )x 6 8 10 12y 6 m 3 2A.变量 x,y 之间呈现负相关关系B.m=4C.可以预测,当 x=11 时,y=2.6D.由表格数据知该回归直线必过点 (9,4)解析: 因为 =9, =-0.79+10.3=4,所以 =4,所以 m=5.答案: B12. 导学号 40294004 已知两个分类变量 X 和 Y,它们的取值分别为x 1,x2和y 1,y2,其样本频数分别是 a=10,b=21,c+d=35,若“ X 和 Y 有关系” 的可信程度为 90%,则 c 等于( )A.4 B.5C.6 D.7
9、解析: 由 a=10,b=21,c+d=35,可得 n=66,d=35-c,a+b=31,a+c=10+c,b+d=56-c,ad=10(35-c),bc=21c.由于“ X 和 Y 有关系” 的可信度为 90%,则随机变量 K2 的观测值 3.841k2.706,得3.841 2.706,代入检验,得 c=5 符合题意 .答案: B二、填空题(本大题共 4 小题,每小题 5 分,共 20 分)13.关于统计量 K2 的判断中,有以下几种说法 : K2 在任何问题中都可以用来检验两个变量有关系还是没有关系; K2 的值越大,两个分类变量的相关性就越大 ; K2 是用来判断两个分类变量是否有关系
10、的随机变量,当 K2 的值很小时,可以判定两个分类变量不相关.其中说法正确的是 . 解析: K2 只适用于 22 列联表问题,故 错误; K2 的值越大,两个事件的相关性就越大,故 正确;当 K2 的值很小时,只能说明两个变量的相关程度低 ,不能判定两个分类变量不相关,故 错误.答案: 14.根据如下样本数据:x 3 4 5 6 7y 4.0 2.5 -0.5 0.5 -2.0得到的回归方程为 x+ ,若 =7.9,则 x 每增加 1 个单位,y 就平均 个单位. 解析: 由题表中数据可得 =5, =0.9,因为 x+ 一定经过点(5,0 .9),所以 0.9=5 +7.9,可得 =-1.4,
11、因此 x 每增加 1 个单位,y 就平均减少 1.4 个单位.答案: 减少 1.415.独立性检验显示:在犯错误的概率不超过 0.1 的前提下认为性别与是否喜爱喝酒有关系.则下列说法正确的是 . 在 100 名男性中约有 90 人爱喝酒; 若某人爱喝酒,那么此人为男性的可能性为 90%; 认为性别与是否喜爱喝酒有关判断出错的可能性为 10%; 有 90%的把握认为 10 名男性中有 9 人爱喝酒.解析: 独立性检验是对两个分类变量有关系的可信程度的判断.答案: 16.某种产品的广告费支出 x(单位:万元)与销售额 y(单位:万元 )之间有如下的对应数据:x 2 4 5 6 8y 30 40 6
12、0 50 70已知 y 与 x 之间具有线性相关关系,若实际销售额不低于 82.5 万元,则广告费支出最少是 万元. 解析: 由题表中数据可得 y 关于 x 的回归直线方程为 =6.5x+17.5,令 6.5x+17.582.5,得 x10,故广告费支出最少是 10 万元.答案: 10三、解答题(本大题共 6 小题,共 70 分)17.(本小题满分 10 分)为了探究患慢性气管炎是否与吸烟有关 ,调查了 339 名 50 岁以上的人,调查结果如下表所示:患慢性气管炎 未患慢性气管炎 总计吸烟 43 162 205不吸烟 13 121 134总计 56 283 339能否在犯错误的概率不超过 0
13、.01 的前提下认为 50 岁以上的人患慢性气管炎与吸烟有关系?解: 由 22 列联表可知 a=43,b=162,c=13,d=121,a+b=205,c+d=134,a+c=56,b+d=283,n=a+b+c+d=339,代入公式得 K2 的观测值为k= 7.469.因为 7.4696.635,所以在犯错误的概率不超过 0.01 的前提下 ,认为 50 岁以上的人患慢性气管炎与吸烟有关系.18.(本小题满分 12 分)某研究机构对高三学生的记忆力 x 和判断力 y 进行统计分析,得下表数据:x 6 8 10 12y 2 3 5 6(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求
14、出 y 关于 x 的线性回归方程 x+ .解: (1)散点图如下:(2)由于 =9, =4,xiyi=62+83+105+126=158,=62+82+102+122=344,=0.7, =4-0.79=-2.3,故线性回归方程为 y=0.7x-2.3.19.(本小题满分 12 分)网购已成为当今消费者最喜欢的购物方式之一 ,某机构对 A,B,C,D 四家同类运动服装网店的关注人数 x(单位:千人)与其商品销售件数 y(单位:百件)进行统计对比,得到表格:网店名称 A B C Dx 3 4 6 7y 11 12 20 17由散点图得知,可以用线性回归方程 x+ 来近似刻画它们之间的关系.(1)
15、试建立 y 关于 x 的回归方程;(2)在(1)的回归模型中,请用 R2 说明销售件数的差异有多大程度是由关注人数引起的.(精确到0.01)解: (1)由表中数据可得 =5, =15, xiyi=320, =110,=2,所以 =15-25=5,故线性回归方程为 =2x+5.(2) (yi- )2=54, (yi- )2=14,R2=1- =1- =0.74,说明销售件数的差异有 74%是由关注人数引起的 .20.(本小题满分 12 分)某机构为了解某地区中学生在校月消费情况 ,随机抽取了 100 名中学生进行调查.下图是根据调查的结果绘制的学生在校月消费金额的频率分布直方图.已知350,45
16、0),450,550),550,650)三个金额段的学生人数成等差数列,将月消费金额不低于 550 元的学生称为“高消费群”.(1)求 m,n 的值 ,并求这 100 名学生月消费金额的样本平均数 (同一组中的数据用该组区间的中点值作代表);(2)根据已知条件完成下面 22 列联表,并判断能否有 90%的把握认为“ 高消费群”与性别有关系.高消费群 非高消费群 合计男女 10 50合计解: (1)由题意知 100(m+n)=0.6,且 2m=n+0.001 5,解得 m=0.002 5,n=0.003 5,所求平均数为 =3000.15+4000.35+5000.25+6000.15+7000
17、.10=470(元) .(2)根据频率分布直方图得到如下 22 列联表:高消费群 非高消费群 合计男 15 35 50女 10 40 50合计 25 75 100根据上表数据代入公式可得 K2= 1.332.706.所以没有 90%的把握认为“高消费群”与性别有关系.21. 导学号 40294005(本小题满分 12 分) 二手车经销商小王对其所经营的某一型号二手汽车的使用年数 x(0x10)与销售价格 y(单位: 万元/辆)进行整理,得到如表的对应数据:使用年数 2 4 6 8 10售价 16 13 9.5 7 4.5(1)试求 y 关于 x 的回归直线方程;(2)已知每辆该型号汽车的收购价
18、格为 w=0.05x2-1.75x+17.2(单位:万元),根据(1)中所求的回归方程,预测当 x 为何值时,小王销售一辆该型号汽车所获得的利润 z 最大?解: (1)由表中数据得 (2+4+6+8+10)=6, (16+13+9.5+7+4.5)=10,由最小二乘法求得=-1.45,=10-(-1.45)6=18.7,所以 y 关于 x 的回归直线方程为 =-1.45x+18.7.(2)根据题意,利润函数为 z=y-w=(-1.45x+18.7)-(0.05x2-1.75x+17.2)=-0.05x2+0.3x+1.5,所以当 x=- =3 时,二次函数 z 取得最大值;即预测 x=3 时,
19、小王销售一辆该型号汽车所获得的利润 z 最大.22.(本小题满分 12 分)对某班学生是爱好体育还是爱好文娱进行调查 ,根据调查得到的数据,所绘制的条形图如下图所示.(1)根据图中数据,制作 22 列联表;(2)若要采用分层抽样的方法从男生中共抽取 5 名候选人, 再从 5 人中选两人分别做文体活动协调人,求选出的两人恰好是一人爱好文娱,另一人爱好体育的学生的概率;(3)能否认为性别与是否爱好体育有关系?解: (1)根据图中数据,作出 22 列联表:爱好体育 爱好文娱 合 计男生 15 10 25女生 5 10 15合计 20 20 40(2)要采用分层抽样的方法从男生中共抽取 5 名候选人,得到 5 人中有 3 人爱好体育,2 人爱好文娱,再从 5 人中选两人分别做文体活动协调人,恰好是一人爱好文娱,另一人爱好体育的概率是 P= .(3)K2= 2.666 72.706,所以我们没有足够的把握认为性别与是否爱好体育有关系.