1、2.2.2 用样本的数字特征估计总体的数字特征学习目标:1.会求样本的平均数、标准差、方差(重点)2.理解用样本的数字特征估计总体的数字特征的方法(重点)3.会应用相关知识解决实际统计问题(难点 )自 主 预 习探 新 知1样本的众数、中位数、平均数(1)众数:在样本 数据中,出现次数最多的数据(即频率分布最大值所对应的样本数据)叫这组数据的众数(2)中位数:将样本数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫这组数据的中位数(3)平均数:指样本数据的算术平均数,即 (x1x 2x n)x1n思考:一组数据的平均数、众数、中位数有可能相等吗?提示 有2样本的方差与标准差
2、(1)数据的离散程度可以用极差、方差或标准差来描述样本方差描述了一组数据围绕平均数波动的大小一般地,设样本的元素为 x1,x 2,x n,样本的平均数为 ,定义 s2 .xx1 x2 x2 x2 xn x2n(2)为了得到以样本数据的单位表示的波动幅度,通常要求出样本方差的算术平方根,即样本标准差 s .x1 x2 x2 x2 xn x2n思考:方差与标准差的大小与样本数据有什么关系?提示 标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小基础自测1思考辨析(1)样本的平均数描述了样本数据的平均水平()(2)方差越大、数据越
3、集中在平均数左右()(3)中位数是样本数据中最中间位置的数据()2下列各数字特征中,能反映一组数据离散程度的是( )A众数 B平均数C标准差 D中位数C 方差与标准差反映一组数据的离散程度3一组观察值 4,3,5,6 出现的次数分别为 3,2,4,2,则样本平均值约为( )A4.55 B4.5C12.5 D1.64A 4.55.x43 32 54 623 2 4 24某学员在一次射击测试中射靶 10 次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为 _;(2)命中环数的标准差为_(1)7 (2) 2 (1) 7.x7 8 7 9 5 4 9 10 7 410
4、(2)s2 (77) 2(87) 2(77) 2(97) 2(5 7) 2(47) 2(97)1102(10 7)2 (77) 2(4 7)24,s2.合 作 探 究攻 重 难平均数、众数、中位数的求法甲、乙两人在 10 天中每天加工零件的个数用茎叶图表示如图 2218 所示,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这 10 天甲的日加工零件的平均数为_;乙的日加工零件的众数与中位数分别为_和_思路探究 由茎叶图分别提取出甲、乙 10 天中每天加工零件的个数,然后求平均数,众数与中位数24 24 与 30 23 甲每天加工零件的个数分别为:18,19,20,20,
5、21,22,23,31,31,35,所求平均数为 甲x (18192020212223313135)24.110乙每天加工零件的个数分别为:11,17,19,21,22,24,24,30,30,32,故众数为 24 与30.中位数为 (2224) 23.12规律方法 1求平均数时要注意数据的个数,不要重计或漏计.2求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两数据的平均数.3若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.跟踪训练1对于数据 3,3,2,3,6,3,10,3,6,3,2,有下列结
6、论:这组数据的众数是 3;这组数据的众数与中位数的数值不相等;这组数据的中位数与平均数的数值相等;这组数据的平均数与众数的数值相等其中正确结论的个数为( )A 1 B2 C3 D4A 在这一组数据中,3 出现次数最多,有 6 次,故众数是 3;将数据按从小到大顺序排列后,最中间的数据是 3,故中位数是 3;平均数 x4,故只有正确22 36 62 1011方差和标准差的计算及应用甲、乙两机床同时加工直径为 100 cm 的零件,为检验质量,从中抽取6 件测量数据为:甲:99 100 98 100 100 103乙:99 100 102 99 100 100(1)分别计算两组数据的平均数及方差;
7、(2)根据计算说明哪台机床加工零件的质量更稳定思路探究 解 (1) 甲 9910098100100103100,x16乙 99100102 99100100 100,x16s (99100) 2(100 100) 2(98100) 2(100100) 2(100100)2甲162(103 100) 2 ,73s (99100) 2(100 100) 2(102100) 2(99100) 2(100100)2乙162(100 100) 21.(2)由(1)知 甲 乙 ,比较它们的方差,s s ,故乙机床加工零件的质量更x x 2甲 2乙稳定规律方法 1在实际问题中,仅靠平均数不能完全反映问题,还
8、要研究其偏离平均值的离散程度(即方差或标准差) ,方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定2关于统计的有关性质及规律:(1)若 x1,x 2,x n的平均数为 ,那么 mx1a,mx 2a,mx na 的平均x数是 m a;x(2)数据 x1,x 2,x n与数据 x1a,x 2a,x na 的方差相等;(3)若 x1,x 2,x n的方差为 s2,那么 ax1,ax 2,ax n的方差为 a2s2.跟踪训练2某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:甲 127 13
9、8 130 137 135 131乙 133 129 138 134 128 136求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛解 设甲、乙两人成绩的平均数分别为 甲 , 乙 ,x x则 甲 130 (380 751) 133,x16乙 130 (3184 26) 133,x16s (6) 25 2(3) 24 22 2(2) 2 ,2甲16 473s 02(4) 25 21 2(5) 23 2 .2乙16 383因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.样本的数字特征的意义及综合应用探究问题1平均数、中
10、位数、众数中,哪一个量与样本的每一个数据都有关,它的缺点是什么?提示 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但它的缺点是受数据中极端值的影响较大2在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?提示 为了避免平均值受数据中个别极端值的影响,增大它在估计总体时的可靠性3我们知道,当把样本数据制成频率分布直方图后,失去了原始数据,那么是不是不能根据频率分布直方图求平均数、众数与中位数呢?提示 不是可以用频率分布直方图估计样本数据的平均数、众数和中位数(1)据了解,某公司的 33 名职工月工资(单位:元)如下:职务 董事长 副董事长 董事
11、 总经理 经理 管理员 职员人数 1 1 2 1 5 3 20工资 11 000 10 000 9 000 8 000 6 500 5 500 4 000该公司职工月工资的平均数与中位数分别为_,在这两个统计量中,_更能反映这个公司员工的工资水平(2)某校从参加高二年级学业水平测试的学生中抽出 80 名学生,其数学成绩(均为整数)的频率分布直方图如图 2219 所示图 2219则这次数学测试的众数与中位数分别为_思路探究 (1)求出中位数与平均数,再根据其反映的数字特征进行判断(2)由数字特征在直方图中的求法求解(1)5 333 4 000 中位数 ( 2)75 73.3 (1)把工资数据由小
12、到大排列,得到中位数为 4 000 元平均数 x11 000 10 000 9 0002 8 000 6 5005 5 5003 4 00020335 333 元由数字知,中位数更能反映该公司员工的工资水平,平均数受少数人工资额的影响较大,不能反映这个公司员工的工资水平(2)由直方图知众数为 75.70 802设中位数为 x,由前三个矩形面积之和为 0.4,第四个矩形面积为 0.3,因此中位数位于第四个矩形内,有 0.10.03(x70) ,所以 x73.3.母题探究:1.(变结论) 本例(2) 条件不变,求这次数学测试的平均数解 450.05550.15650.20750.30850.259
13、50.0572.x2(变条件 )本例 (2)改为为了调查某厂工人生产某种产品的能力,随机抽查了 20位工人某天生产该产品的数量得到频率分布直方图如图 2220,则图 2220(1)这 20 名工人中一天生产该产品数量在55,75) 的人数是_(2)这 20 名工人中一天生产该产品数量的中位数为_(3)这 20 名工人中一天生产该产品数量的平均数为_(1)13 (2) 62.5 (3) 64 (1)在55,75) 的人数为(0.040100.02510)2013.(2)设中位数为 x,则 0.2(x55)0.040.5,x62.5.(3)0.2050 0.40600.25700.10800.05
14、9064.规律方法 1因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低2利用频率分布直方图估计数字特征:(1)众数是最高的矩形的底边的中点(2)中位数左右两侧直方图的面积相等(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标提醒 利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致当 堂 达 标固 双 基1样本 101,98,102,100,99 的标准差为( )A
15、. B0 C1 D22A 样本平均数 100,方差为 s22,x标准差 s ,故选 A.22如图 2221 所示是 2017 年某高一学生下学期政治考试成绩的茎叶图(茎表示成绩的十位数字),则该生政治考试成绩的平均数和众数依次为( )图 2221A85,84 B84,85C86,84 D84,86C 由题意可知,平均数 86,x79 79 84 84 86 84 87 90 90 9710众数为 84.3甲、乙、丙、丁四名射手在选拔赛中所得的平均环数 及其方差 s2 如下表所x示,则选送决赛的最佳人选应是( )甲 乙 丙 丁x 7 8 8 7s2 6.3 6.3 7 8.7A.甲 B乙 C丙
16、D丁B 乙 丙 甲 丁 ,且 s s s s ,x x x x 2甲 2乙 2丙 2丁应选择乙进入决赛4甲乙两名学生六次数学测验成绩(百分制)如图 2222 所示图 2222甲同学成绩的中位数大于乙同学成绩的中位数;甲同学的平均分比乙同学高;甲同学的平均分比乙同学低;甲同学成绩的方差小于乙同学成绩的方差上面说法正确的是( )A BC DA 甲的中位数 81,乙的中位数 87.5,故错,排除 B、D ;甲的平均分 (7672808286 90) 81,乙的平均分x16 (69788788 9296) 85,故错,对,排除 C,故选 A.x165甲、乙两人在相同条件下各打靶 10 次,每次打靶的成
17、绩情况如图 2223 所示:图 2223(1)填写下表:平均数 方差 中位数 命中 9 环及以上甲 7 1.2 1乙 5.4 3(2)请从四个不同的角度对这次测试进行分析:从平均数和方差结合分析偏离程度;从平均数和中位数结合分析谁的成绩好些;从平均数和命中 9 环以上的次数相结合看谁的成绩好些;从折线图上两人射击命中环数及走势分析谁更有潜力解 (1)乙的射靶环数依次为 2,4,6,8,7,7,8,9,9,10,所以 乙x (24687789910)7;乙的射靶环数从小到大排列为1102,4,6,7,7,8,8,9,9,10,所以中位数是 7.5;甲的射靶环数从小到大排列为7 825,6,6,7,7,7,7,8,8,9,所以中位数为 7.于是填充后的表格如下表所示:平均数 方差 中位数 命中 9 环及以上甲 7 1.2 7 1乙 7 5.4 7.5 3(2)甲、乙的平均数相同,均为 7,但 s s ,说明甲偏离平均数的程度小,2甲 2乙而乙偏离平均数的程度大甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好甲、乙的平均水平相同,而乙命中 9 环以上(包含 9 环)的次数比甲多 2 次,可知乙的射靶成绩比甲好从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力