1、第二章 统计2.2 用样本估计总体2.2.2 用样本的数字特征估计总体的数字特征(第 2 课时)学习目标正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差), 并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.合作学习一、设计问题,创设情境问题 1:平均数向我们提供了样本数据的重要信息 ,但是,平均数有时也会使我们作出对总体的片面判断.如某地区的统计报表显示,此地区的中学生的平均身高为 176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但
2、是,如果这个平均数是从五十万名中学生中抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身高.因此,只有平均数还难以概括样本数据的实际状态.我们应该引入什么样的概念才能解决这个问题呢?问题 2:(1)有甲、乙两种钢筋,现从中各抽取一个样本(如下表 )检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为 125.甲 110 120 130 125 120 125 135 125 135 125乙 115 100 125 130 115 125 125 145 125 145哪种钢筋的质量较好?(2)某种子公司为了在当地推行两种新水稻品种,
3、对甲、乙两种水稻进行了连续 7 年的种植对比实验,年亩产量分别如下:(千克)甲:600,880,880,620,960,570,900(平均 773)乙:800,860,850,750,750,800,700(平均 787)请你用所学统计学的知识,说明选择哪种品种推广更好?(3)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算 ,人均年收入达到 1.5 万元的家庭即达到小康生活水平.民政局对该市 100 户家庭进行调查统计,他们的人均收入达到了 1.6 万元,民政局即宣布该市生活水平已达到小康水平,你认为这样的结论是否符合实际?(4)如何考察样本数据的分散程度的大小呢?把数据在
4、坐标系中刻画出来,是否能直观地判断数据的离散程度?二、信息交流,揭示规律讨论结果:标准差:方差:三、运用规律,解决问题【例题】 甲、乙两人同时生产内径为 25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出 20 件,量得其内径尺寸如下(单位:mm):甲25.46 25.32 25.45 25.39 25.3625.34 25.42 25.45 25.38 25.4225.39 25.43 25.39 25.40 25.4425.40 25.42 25.35 25.41 25.39乙25.40 25.43 25.44 25.48 25.4825.47 25.49
5、 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.4725.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?四、变式训练,深化提高某地区全体九年级的 3 000 名学生参加了一次数学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了 100 名学生的成绩如下:100 分 12 人,90 分 30 人,80 分 18 人,70 分 24 人,60 分 12 人,50 分 4 人.请根据以上数据估计该地区 3 000 名学生的平均分、合格率(60 及 60 分以上均属合格) .五、反思小结,观点提炼请
6、同学们想一想1.本节课我们学习过哪些知识内容?2.你认为学习这些有什么意义?布置作业课本 P82习题 2.2 A 组第 6,7 题.课后巩固:1.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 . 2.若给定一组数据 x1,x2,xn 的方差为 s2,则 ax1,ax2,axn 的方差是 . 3.在相同条件下对自行车运动员甲、乙两人进行了 6 次测试,测得他们的最大速度(单位:m/s)的数据如下:甲 27 38 30 37 35 31乙 33 29 38 34 28 36试判断
7、选谁参加某项重大比赛更合适?4.某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克 15 元,请问,这个专业户还应该了解什么? 怎样去了解? 请你为他设计一个方案.参考答案一、设计问题,创设情境问题 1:标准差,方差二、信息交流,揭示规律问题 2:讨论结果:(1)由上图可以看出,乙样本的最小值 100 低于甲样本的最小值 110,乙样本的最大值 145 高于甲样本的最大值 135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差.由上图可以看出,乙的极差较大,数据点较分散;甲
8、的极差小,数据点较集中 ,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.(2)选择的依据应该是,产量高且稳产,所以选择乙更为合理 .(3)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(4)把问题(2)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小,如何用数字去刻画这种分散程度呢?考察样本数据的分散程度的大小,最常
9、用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用 s 表示.所谓“平均距离” ,其含义可作如下理解:假设样本数据是 x1,x2,xn, 表示这组数据的平均数 .xi 到 的距离是|x i- |(i=1,2,n). 于是,样本数据 x1,x2,xn 到 的 “平均距离”是 s= .|1-|+|2-|+|-|由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差:s= .1(1-)2+(2-)2+(-)2意义:标准差用来表示稳定性 ,标准差越大,数据的离散程度就越大,也就越不稳定; 标准差越小,数据
10、的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差 s0,当 s=0 时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数 =1.973,标准差 s=0.868,所以+s=2.841, +2s=3.709; -s=1.105, -2s=0.237. 这 100 个数据中,在区间 -2s, +2s=0.237,3.709外的只有 4 个,也就是说, -2s, +2s几 乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方 s2方差来代替标准差,作为测量样本数据分散程度的工具:s2= (x1- )2+(x
11、2- )2+(xn- )2.1 显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.三、运用规律,解决问题【例题】 分析 :每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径 25.40 mm),生产质量可以从总体的平均数与标准差两个角度来
12、衡量.总体的平均数与内径标准尺寸 25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.解:用计算器计算可得 25.401, 25.406;甲 乙s 甲 0.037,s 乙 0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于 s 甲 2乙 =383乙的成绩比甲稳定,选乙参加比赛更合适.4.解:这个专业户应了解鱼的总重量 ,可以先捕出一些鱼(设有 x 条),做上标记后放回鱼塘,过一段时间再捕出一些鱼(设有 a 条), 观察其中带有标记的鱼的条数 ,作为一个样本来估计总体,则条 鱼 中 带 有 标记 的条数 =鱼 塘中所有 带 有 标记 的 鱼 的条数 ()鱼 塘中 鱼 的 总 条数这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中鱼的平均重量,进而估计全部鱼的重量,最后估计出收入.