1、 第 1 页 / 共 10 页 第第 58 讲:统计初步讲:统计初步 一、课程标准 1、了解抽样方法 2、频率分布直方图的应用 3、用样本的数字特征估计总体的数字特征 二、基础知识回顾 一、抽样方法 1. 简单随机抽样 (1)定义:设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(nN),如果每次抽取 时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样 (2)最常用的简单随机抽样的方法:抽签法和随机数表法 2. 分层抽样 (1)定义:在抽样时,将总体分成 互不交叉的层,然后按照一定的比例从各层独立地抽取一定数量的个 体,将各层取出的个体合在一起作为样本,
2、这种抽样方法叫做分层抽样 (2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样 3. 两种抽样方法的区别与联系: 类别 简单随机抽样 分层抽样 共同点 抽样过程中每个个体被抽到的机会均等,不 放回抽样 各自特点 从总体中逐个抽取 将总体分 n 层,分层进行抽取 适用范围 总体中个体数较少 总体由差异明显的几部分组成 二、总体分布特征数的估计 1. 总体分布 (1)频率分布表:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布,我们把反 映总体频率分布的表格称为频率分布表 (2)频率分布直方图:利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方
3、图 (3)频率分布折线图:如果将频率分布直方图中,各相邻的矩形的上底边的中点顺次连结起来,就得到 一条折线,我们称这条折线为本组数据的频率分布折线图频率分布折线图的优点是它反映了数据的变化 趋势 4. 总体特征数的估计 (1)中位数:在频率分布直方图中,中位数左边和右边的直方图面积应该相等,由此可以估计中位数的 值 第 2 页 / 共 10 页 (2)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标 (3)平均数及其估计:平均数是直方图的“重心” ,等于频率分布直方图中每个小矩形的面积乘以小矩形 底边中点的横坐标之和 平均数 x1 n_(x1x2xn) (4)方差与标准差 标准差 s
4、1 nx1 x 2x 2 x 2x n x 2.、 方差 s21 n(x1 x ) 2(x 2 x ) 2(x n x ) 2 5、频率分布直方图中的常见结论 (1)众数的估计值为最高矩形的中点对应的横坐标 (2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和 (3)中位数的估计值的左边和右边的小矩形的面积和是相等的 平均数、方差的公式推广 (1)若数据 x1,x2,xn的平均数为 x ,则 mx1a,mx2a,mx3a,mxna 的平均数是 m x a. (2)若数据 x1,x2,xn的方差为 s2,则数据 ax1b,ax2b,axnb 的方差为 a2s2.
5、 三、自主热身、归纳总结 1、某公司有员工 500 人,其中不到 35 岁的有 125 人,3549 岁的有 280 人,50 岁以上的有 95 人,为了 调查员工的身体健康状况,从中抽取 100 名员工,则应在这三个年龄段分别抽取人数为( ) A. 33,34,33 B. 25,56,19 C. 20,40,30 D. 30,50,20 2、一个容量为 32 的样本,已知某组样本的频率为 0.25,则该组样本的频数为( ) A. 4 B. 8 C. 12 D. 16 3、已知某地区中小学生人数和近视情况分别如图和图所示为了解该地区中小学生的近视形成原因, 用分层随机抽样的方法抽取 2%的学生
6、进行调查,则样本量和抽取的高中生近视人数分别为( ) A200,20 B100,20 C200,10 D.100,10 4、(多选)(2019 济南市模拟考试)随着我国经济实力的不断提升,居民收入也在不断增加某家庭 2018 年全 年的收入与 2014 年全年的收入相比增加了一倍,实现翻番同时该家庭的消费结构随之也发生了变化,现 第 3 页 / 共 10 页 统计了该家庭这两年不同品类的消费额占全年总收入的比例,得到了如下折线图: 则下列结论中错误的是( ) A该家庭 2018 年食品的消费额是 2014 年食品的消费额的一半 B该家庭 2018 年教育医疗的消费额与 2014 年教育医疗的消
7、费额相当 C该家庭 2018 年休闲旅游的消费额是 2014 年休闲旅游的消费额的五倍 D该家庭 2018 年生活用品的消费额是 2014 年生活用品的消费额的两倍 5、有一个容量为 200 的样本,其频率分布直方图如图所示,据图知,样本数据在) 8,10内的频数为_ 第 5 题图 6、甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示,从这四个人中选 择一人参加奥运会射击项目比赛,最佳人选是_ 甲 乙 丙 丁 平均环数 x 8.6 8.9 8.9 8.2 方差 s2 3.5 3.5 2.1 5.6 四、例题选讲 考点一 抽样方法 例 1 要考察某种品牌的 850 颗种
8、子的发芽率,从中抽取 50 颗种子进行实验,利用随机数表法抽取种子, 先将 850 颗种子按 001,002,850 进行编号,如果从随机数表第 3 行第 6 列的数开始向右读,请依次 写出最先检验的 4 颗种子的编号: 注:下面抽取了随机数表第 1 行至第 5 行 第 4 页 / 共 10 页 03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95 97 74 24 67 62 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73 1
9、6 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10 12 56 85 99 26 96 96 68 27 31 05 03 72 93 15 57 12 10 14 21 88 26 49 81 76 55 59 56 35 64 38 54 82 46 22 31 62 43 09 90 06 18 44 32 53 23 83 01 30 30 变式 1、下列抽取样本的方式属于简单随机抽样的个数为( ) 从无限多个个体中抽取 100 个个体作为样本; 盒子里共有 80 个零件,从中选出 5 个零
10、件进行质量检验在抽样操作时,从中任意拿出一个零件进 行质量检验后再把它放回盒子里; 从 20 件玩具中一次性抽取 3 件进行质量检验; 某班有 56 名同指定个子最高的 5 名同学参加学校组织的篮球赛 A. 0 B. 1 C. 2 D. 3 变式 2、 (1)总体由编号为 01,02,19,20 的 20 个个体组成利用下面的随机数表选取 5 个个体,选取 方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体 的编号为_ 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200
11、 3623 4869 6938 7481 (2)下列抽取样本的方式不属于简单随机抽样的有_ 从无限多个个体中抽取 100 个个体作为样本 盒子里共有 80 个零件,从中选出 5 个零件进行质量检验在抽样操作时,从中任意拿出一个零件进行 质量检验后再把它放回盒子里 从 20 件玩具中一次性抽取 3 件进行质量检验 某班有 56 名同指定个子最高的 5 名同学参加学校组织的篮球赛 变式 3、 (1)(2019 河南名校联考)九章算术第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙 持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为: “今有甲带了 56
12、0 钱,乙带了 350 钱,丙带了 180 钱,三人一起出关,共需要交关税 100 钱,依照钱的多 第 5 页 / 共 10 页 少按比例出钱”,则丙应出_钱(所得结果四舍五入,保留整数) (2)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人). 篮球组 书画组 乐器组 高一 45 30 a 高二 15 10 20 学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学 生中抽取 30 人,结果篮球组被抽出 12 人,则 a 的值为_ 方法总结:简单随机抽样的两种方法 (1)抽签法,抽签法的步骤是: 将总体中的 N 个个体编号; 将
13、这 N 个号码写在形状、大小相同的号签上; 将号签放在同一箱中,并搅拌均匀; 从箱中每次抽取 1 个号签,连续抽取 k 次; 将总体中与抽到的号签的编号一致的 k 个个体取出 (2)随机数表法,随机数表法的步骤是: 将总体的个体编号(每个号码的位数一致); 在随机数表中任选一个数作为开始; 从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中 或前面已经取出,则跳过,如此继续下去,直到取满为止; 根据选定的号码抽取样本 考点二 总体分布的估计 例 2、(2019南昌市第一次模拟测试)市面上有某品牌 A 型和 B 型两种节能灯,假定 A 型节能灯使用寿命 都超过
14、 5 000 小时经销商对 B 型节能灯使用寿命进行了调查统计,得到如下频率分布直方图: 某商家因原店面需重新装修,需租赁一家新店面进行周转,合约期一年新店面只需安装该品牌节能 第 6 页 / 共 10 页 灯 5 支(同种型号)即可正常营业 经了解, A 型 20 瓦和 B 型 55 瓦的两种节能灯照明效果相当, 都适合安装 已 知 A 型和 B 型节能灯每支的价格分别为 120 元、25 元,当地商业电价为 0.75 元/千瓦时假定该店面一年 周转期的照明时间为 3 600 小时,若正常营业期间灯坏了立即购买同型灯管更换(用频率估计概率) (1)根据频率分布直方图估算 B 型节能灯的平均使
15、用寿命; (2)根据统计知识知,若一支灯管一年内需要更换的概率为 p,那么 n 支灯管估计需要更换 np 支,若该 商家新店面全部安装了 B 型节能灯,试估计一年内需更换的数量; (3)若只考虑灯的成本和消耗电费,你认为该商家应选择哪种型号的节能灯,请说明理由 变式 1、某网络营销部门随机抽查了某市 200 名网友在 2019 年 11 月 11 日的网购金额,所得数据如下表: 网购金额(单位:千元) 人数 频率 (0,1 16 0.08 (1,2 24 0.12 (2,3 x p (3,4 y q (4,5 16 0.08 (5,6 14 0.07 总计 200 1.00 已知网购金额不超过
16、 3 千元与超过 3 千元的人数比恰为 32. (1)试确定 x,y,p,q 的值,并补全频率分布直方图(如图); (2)该营销部门为了了解该市网友的购物体验, 从这 200 名网友中, 用分层抽样的方法从网购金额在(1,2 和(4,5的两个群体中确定 5 人进行问卷调查, 若需从这 5 人中随机选取 2 人继续访谈, 则此 2 人来自不同群 体的概率是多少? 第 7 页 / 共 10 页 变式 2、某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中 自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),
17、25,27.5),27.5,30)根 据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数是( ) A. 56 B. 60 C. 120 D. 140 变式 3、某公司为了解用户对其产品的满意度,从 A,B 两地区分别随机调查了 40 个用户,根据用户对产 品的满意度评分,得到 A 地区用户满意度评分的频率分布直方图和 B 地区用户满意度评分的频数分布表 A 地区用户满意度评分的频率分布直方图 图 B 地区用户满意度评分的频数分布表 满意度评分分组 50,60) 60,70) 70,80) 80,90) 90,100 频数 2 8 14 10 6 (1)在图中作出 B 地区
18、用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值 及分散程度(不要求计算出具体值,给出结论即可) B 地区用户满意度评分的频率分布直方图 第 8 页 / 共 10 页 图 (2)根据用户满意度评分,将用户的满意度分为三个等级: 满意度评分 低于 70 分 70 分到 89 分 不低于 90 分 满意度等级 不满意 满意 非常满意 估计哪个地区用户的满意度等级为不满意的概率大?说明理由 方法总结:本题主要考查频率分布直方图,是一道基础题目图表题作为一道应用题,主要考查考生的视 图、用图能力,以及应用数学解决实际问题的能力频率分布直方图的两个要点: (1)各个小矩形的面积之
19、和等于 1,各个小矩形的面积为各组的频率,小矩形的高为频率 组距. (2) 频数 样本容量频率, 频数 频率样本容量,样本容量频率频数 五、优化提升与真题演练 1、 (2020 年高考天津)从一批零件中抽取 80 个,测量其直径(单位:mm) ,将所得数据分为 9 组: 5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到如下频率分布直方图,则在被抽取的 零件中,直径落在区间5.43,5.47)内的个数为( ) 第 9 页 / 共 10 页 A10 B18 C20 D36 2、 (2019 年高考全国卷理数) 西游记 三国演义 水浒传和红楼梦是中国古
20、典文学瑰宝,并称 为中国古典小说四大名著某中学为了解本校学生阅读四大名著的情况,随机调查了 100 位学生,其中 阅读过西游记或红楼梦的学生共有 90 位,阅读过红楼梦的学生共有 80 位,阅读过西游 记且阅读过红楼梦的学生共有 60 位,则该校阅读过西游记的学生人数与该校学生总数比值的 估计值为( ) A0.5 B0.6 C0.7 D0.8 3、 (2019 年高考全国卷理数) 演讲比赛共有 9 位评委分别给出某选手的原始评分, 评定该选手的成绩时, 从 9 个原始评分中去掉 1 个最高分、 1 个最低分, 得到 7 个有效评分 7 个有效评分与 9 个原始评分相比, 不变的数字特征是( )
21、 A中位数 B平均数 C方差 D极差 4、 (2020 年高考江苏)已知一组数据4,2 ,3,5,6aa的平均数为 4,则a的值是 5、 (2019 年高考江苏卷)已知一组数据 6,7,8,8,9,10,则该组数据的方差是_ 6、 (2019 年高考全国卷理数)我国高铁发展迅速,技术先进经统计,在经停某站的高铁列车中,有 10 第 10 页 / 共 10 页 个车次的正点率为 0.97,有 20 个车次的正点率为 0.98,有 10 个车次的正点率为 0.99,则经停该站高 铁列车所有车次的平均正点率的估计值为_ 7、 (2019 年高考全国卷理数)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 200 只 小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只 小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子 的百分比根据试验数据分别得到如下直方图: 记 C 为事件: “乙离子残留在体内的百分比不低于 5.5” ,根据直方图得到 P(C)的估计值为 0.70 (1)求乙离子残留百分比直方图中 a,b 的值; (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)