1、10.3用样本估计总体考情考向分析主要考查平均数、方差的计算以及茎叶图与频率分布直方图的简单应用;题型以填空题为主,难度为中低档题1作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图2频率分布折线图和总体密度曲线(1)频率分布折线图:如果将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,那么就得到频率分布折线图(2)总体分布的密度曲线:如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线3茎叶图统计中还有一种被用来表示
2、数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数4标准差和方差(1)标准差是样本数据到平均数的一种平均距离(2)标准差:s.(3)方差:s2(x1)2(x2)2(xn)2(xn是样本数据,n是样本容量,是样本平均数)概念方法微思考1在频率分布直方图中如何确定中位数?提示在频率分布直方图中,中位数左边和右边的直方图的面积是相等的2平均数、标准差与方差反映了数据的哪些特征?提示平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定题组一思考辨析1判断下列结论是否正确(请在括号中打“”或
3、“”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论()(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()题组二教材改编2P58例4如图是100位居民月均用水量的频率分布直方图,则月均用水量为2,2.5)范围内的居民有_人答案25解析0.50.510025.3P56练习T3一个容量为32的样本,已知某组
4、样本的频率为0.25,则该组样本的频数为_答案8解析设频数为n,则0.25,n328.4P71练习T1已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_答案0.1解析5.1,则该组数据的方差s20.1.题组三易错自纠5(2018徐州模拟)一组数据共40个,分为6组,第1组到第4组的频数分别为10,5,7,6,第5组的频率为0.1,则第6组的频数为_答案8解析因为数据共40个,第5组的频率为0.1,所以第5组的频数为400.14,所以第6组的频数为40(105764)8.6为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设
5、得分的中位数为m,众数为n,平均数为,则m,n,的大小关系为_(用“”连接)答案nm解析由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m5.5;又5出现的次数最多,故n5;5.97.故nm2,故成绩较稳定(方差较小)的那一位同学的方差为2.2(2018江苏淮阴中学月考)如图所示是一次歌唱大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数为85,则a2b2的最小值是_答案32解析方法一根据题意,有5,得ab8,则b8a,a2b2a2(8a)22a216a64,其中a,b满足0a9,0b9,即0a9,08a9,即0a8且
6、a是整数,令f(a)2a216a64,显然当a4时,f(a)取得最小值,这个最小值是32.方法二同方法一可得ab8,则82,故ab16,而a2b2(ab)22ab643232,当且仅当ab4时等号成立3.空气质量指数(AirQualityIndex,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,050为优;51100为良;101150为轻度污染;151200为中度污染;201300为重度污染;大于300为严重污染从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如下根据该统计数据,估计此地该年AQI大于100的天数约为_(该年有365天)答案146
7、解析该样本中AQI大于100的频数是4,频率为,由此估计该地全年AQI大于100的频率为,估计此地该年AQI大于100的天数约为365146.思维升华茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较烦琐题型二频率分布直方图的绘制与应用例1为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号
8、为第一组,第二组,第五组,如图是根据试验数据制成的频率分布直方图已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为_答案12解析志愿者的总人数为50,所以第三组人数为500.3618,有疗效的人数为18612.思维升华(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆(2)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布跟踪训练1(1)某商场在国庆黄金周的促销活动中,对10月2日9时至14时的销售额进行统计,其频率
9、分布直方图如图所示已知9时至10时的销售额为2.5万元,则11时至12时的销售额为_万元答案10解析设11时至12时的销售额为x,因为9时至10时的销售额为2.5万元,由题意得,得x10.(2)某校对高三年级的学生进行体检,现将高三男生的体重(单位:kg)数据进行整理后分成六组,并绘制频率分布直方图(如图所示)已知图中从左到右第一、第六小组的频率分别为0.16,0.07,第一、第二、第三小组的频率成等比数列,第三、第四、第五、第六小组的频率成等差数列,且第三小组的频数为100,则该校高三年级的男生总数为_答案400解析因为第一、第二、第三小组的频率成等比数列,设公比为q,则第三小组的频率为0.
10、16q2;又第三、第四、第五、第六小组的频率成等差数列,设公差为d,从而得第六小组的频率为0.16q23d0.07.又因为六组频率之和为1,所以由图知q0,ds,可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小跟踪训练2某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,),(a,b),(,b),(
11、,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b),其中a,分别表示甲组研发成功和失败;b,分别表示乙组研发成功和失败(1)若某组成功研发一种新产品,则给该组记1分,否则记0分试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率解(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数甲;方差为s.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数乙;方差为
12、s.因为甲乙,ss6.8,故得分稳定的运动员的方差为6.8.12某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:20,30),30,40),80,90,并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等试估计总体中男生和女生人数的比例解(1)根据频率分布直方图可知,样本中分数不小于70的频率
13、为(0.020.04)100.6,所以样本中分数小于70的频率为10.60.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9,分数在区间40,50)内的人数为1001000.955,所以总体中分数在区间40,50)内的人数估计为40020.(3)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060,所以样本中分数不小于70的男生人数为6030,所以样本中的男生人数为30260,女生人数为1006040,所以样本中男生和女生人数的比例为604032,所
14、以根据分层抽样原理,估计总体中男生和女生人数的比例为32.13样本(x1,x2,xn)的平均数为,样本(y1,y2,ym)的平均数为()若样本(x1,x2,xn,y1,y2,ym)的平均数(1),其中0,则n,m的大小关系为_答案nm解析由题意,得,则有,又0,则0,得n59,5148,3629,6845,所以在北京这22天的空气质量中,按平均数来考察,最后4天的空气质量优于最前面4天的空气质量,即正确;AQI不低于100的数据有3个:143,225,145,所以在北京这22天的空气质量中,有3天达到污染程度,即正确;因为12月29日的AQI为225,为重度污染,该天的空气质量最差,即正确;AQI在0,50)的数据有6个:36,47,49,48,29,45,即达到空气质量优的天数有6天,所以错15