2022高考数学一轮总复习课件:9.6 抽样方法与总体分布的估计
《2022高考数学一轮总复习课件:9.6 抽样方法与总体分布的估计》由会员分享,可在线阅读,更多相关《2022高考数学一轮总复习课件:9.6 抽样方法与总体分布的估计(51页珍藏版)》请在七七文库上搜索。
1、96 抽样方法与总体分布的估计抽样方法与总体分布的估计 【教材梳理】 1简单随机抽样 (1)简单随机抽样:一般地,设一个总体含有 N 个个体,从中逐个_地抽取 n 个个体作 为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会_,就把这种抽样方法叫 做简单随机抽样 (2)最常用的简单随机抽样方法有两种:_法和_法 抽签法(抓阄法):一般地,抽签法就是把总体中的 N 个个体_,把号码写在号签上, 将号签放在一个容器中,搅拌均匀后,每次从中抽取_个号签,连续抽取_次,就得 到一个容量为 n 的样本 随机数法: 随机数法就是利用_、 随机数骰子或计算机产生的随机数进行抽样 简单随机抽样有操作简
2、便易行的优点,在总体个数不多的情况下是行之有效的 2分层抽样 (1)分层抽样的概念:一般地,在抽样时,将总体分成_的层,然后按照一定的_,从各层独 立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 (2)当总体是由_的几个部分组成时,往往选用分层抽样的方法 (3)分层抽样时,每个个体被抽到的机会是_的 3用样本的频率分布估计总体分布 (1)通常我们对总体作出的估计一般分成两种:一种是用样本的_估计总体的_;另一种 是用样本的_估计总体的_ (2)在频率分布直方图中,纵轴表示_,数据落在各小组内的频率用_表示各小长 方形的面积总和等于_ (3)连接频率分布直方
3、图中各小长方形上端的中点,就得到频率分布_随着样本容量的增加,作图 时所分的_增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为 _,它能够更加精细地反映出_ (4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以_,而且可以 _,给数据的记录和表示都带来方便 4用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数_的数据叫做这组数据的众数 中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的 _)叫做这组数据的中位数 平均数:样本数据的算术平均数,即 x _ 在频率分布直方图中,中位数左边和右
4、边的直方图的面积应该_ (2)样本方差、样本标准差 标 准 差s 1 n(x1 x )2(x2 x )2(xn x )2 , 其 中xn是 _,n 是_, x 是_标准差是反映总体_的特征数, 样本方差是样本标准差的_通常用样本方差估计总体方差,当样本容量接近总体容量 时,样本方差很接近总体方差 【常用结论】 5抽样方法中的几个结论 (1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的 (2)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比 6频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数 (2)中位数左边和右边的小长方形的面积
5、和是相等的 (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面 积乘以小长方形底边中点的横坐标之和 7若数据 x1,x2,xn的平均数为x,方差为 s2,则数据 mx1a,mx2a, mxna 的平均数为 mxa,方差为 m2s2 【自查自纠】 1(1)不放回 都相等 (2)抽签 随机数 编号 1 n 随机数表 2(1)互不交叉 比例 (2)差异明显 (3)均等 3(1)频率分布 分布 数字特征 数字特征 (2)频率 组距 各小长方形的面积 1 (3)折线图 组数 总体密度曲线 总体在各个范围内取值的百分比 (4)保留所有信息 随时记录 4(1)最多 平均数 1 n(
6、x1x2xn) 相等 (2)样本数据的第 n 项 样本容量 平均数 波动大小 平方 判断下列命题是否正确,正确的在括号内画“”,错误的画“” (1)简单随机抽样每个个体被抽到的机会不一样,与先后有关 ( ) (2)在分层抽样中,每个个体被抽到的可能性与层数及分层有关 ( ) (3)一组数据的方差越大,说明这组数据越集中 ( ) (4)一组数据的众数可以是一个或几个,中位数也具有相同的结论 ( ) (5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数 ( ) 解:(1); (2); (3); (4); (5) 总体由编号为 00,01,02,48,49 的 50 个个体组成,利用下面的
7、随机数表选取 8 个个体, 选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字, 则选出的第 4 个个体的编号 为( ) 附:第 6 行至第 9 行的随机数表如下 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A3 B16 C38 D49 解: 从随机数表第 6 行的第 9 列和第 10 列数字开始
8、由左到右依次选取两个 数字,列举出选出来编号在 0049 的前 4 个个体的编号为 33,16,20,38, 所以选出来的第 4 个个体的编号为 38故选 C (2020全国卷)设一组样本数据 x1,x2,xn的方差为 001,则数据 10 x1,10 x2, 10 xn的方差为( ) A001 B01 C1 D10 解:因为数据 axib(i1,2,n)的方差是数据 xi(i1,2,n)的方差的 a2倍,所以所求数据方差为 1020011故选 C (2019全国卷)西游记 三国演义 水浒传和红楼梦是中国古典文学瑰宝, 并称为中国古典小说四大名著某中学为了解本校学生阅读四大名著的情况, 随机调
9、查了 100 位学生,其中阅读过西游记或红楼梦的学生共有 90 位,阅读过红楼梦的学生共 有 80 位,阅读过西游记且阅读过红楼梦的学生共有 60 位,则该校阅读过西游记 的学生人数与该校学生总数比值的估计值为( ) A05 B06 C07 D08 解:作出 Venn 图如图,由图知样本中阅读过西游记的学生人数为 70由 样本估计总体,知所求为 70 10007故选 C (2020天津卷)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分为 9 组:531,533),533,535),545,547),547,549,并整理得 到如下频率分布直方图,则在被抽取的零件中,直径落在
10、区间543,547)内的个数为 _ 解:根据直方图,直径落在区间543,547)内的零件频率为(625 500)0020225, 则区间543, 547)内零件的个数为 800225 18故填 18 考点一考点一 简单随机抽样与分层抽样简单随机抽样与分层抽样 (1)为考察某企业生产的袋装牛奶的质量是否达标, 现从 500 袋牛奶中抽取 6 袋进行检验, 利用 随机数表法抽取样本时,先将 500 袋牛奶按 000,001,499 进行编号,使用下面随机数表中各个 5 位数组的后 3 位,选定第 7 行第 5 组数开始,取出 047 作为抽取的第 1 袋进行检验,继续向右读,随后 检验的 5 袋牛
11、奶的号码是(下面摘取了某随机数表第 7 行至第 9 行) ( ) 84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 37859 16955 56719 98105 07175 12867 35047 44395 23879 33211 A245,331,421,025,016 B025,016,105,175,395 C025,016,105,175,047 D447,176,335,025,212 解:由图表可知,依次是:767(剔除),763(剔除),025,921(剔除), 676(剔除),016,859(
12、剔除),955(剔除),719(剔除),105,175,867(剔除), 047(剔除),395故随后检验的 5 袋牛奶的号码是 025,016,105,175, 395故选 B (2)我国古代数学名著九章算术有一抽样问题:“今有北乡若干人, 西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而 北乡需遣一百零八人,问北乡人数几何?”依分层抽样的方法,则北乡共有 _人 解:设北乡有 x 人,则108 x 300108 7 4886 912,解得 x8 100故填 8 100 【点拨】 应用随机数表法的三个关键点:一是确定以表中的哪个数(哪行哪列) 为起点,以哪个方向为读数的方向;
13、二是读数时注意结合编号特点进行读取,若编号 为两位数字,则两位两位地读取,若编号是三位数字,则三位三位地读取;三是注意 筛选,超出编号范围的不取,重复的不取分层抽样的实质为按比例抽取,当总体 由差异明显的几部分组成时,多用分层抽样解决分层抽样的关键:先确定抽样比, 然后把各层个体数乘抽样比,即得各层要抽样的个体数,常用公式:(i)抽样比 样本容量 总体容量 各层样本容量 各层总量 ;(ii)层 1 的容量:层 2 的容量:层 3 的容量样本中层 1 的 容量:样本中层 2 的容量:样本中层 3 的容量 (1)(2019日照期末)某班由 50 个编号为 01,02,03,50 的学生组成, 现在
14、要选取 8 名学生参加合唱团,选取方法是从随机数表(见下表)的第 1 行的第 11 列 开始由左到右依次选取两个数字,则该样本中选出的第 8 名同学的编号为 ( ) A20 B25 C26 D34 解:从随机数表的第 1 行的第 11 列开始由左到右依次选取两个数字, 选出来的 8 名学生的编号分别为:17,37,(93 舍去)23,(78 舍去)30,35, 20,(96 舍去)(23 舍去)(84 舍去)26,34所以样本选出来的第 8 名同学的 编号为 34故选 D (2)如图,某学校共有教师 120 人,现用分层抽样的方法从中选出一个 30 人的样本, 则其中被选出的青年女教师的人数为
15、( ) A12 B6 C4 D3 解:青年教师的人数为 12030%36 人,所以青年女教师为 12 人,故青 年女教师被选出的人数为 12 30 1203故选 D 考点二考点二 数字特征及其应用数字特征及其应用 (1)(2019全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定 该选手的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评 分7 个有效评分与 9 个原始评分相比,不变的数字特征是 ( ) A中位数 B平均数 C方差 D极差 解:平均数可能变化,方差与极差必定变化,不变的只有中位数故选 A (2)(2019全国卷)某行业主管部门为了解本行
16、业中小企业的生产情况,随机调查了 100 个企业, 得到这些企业第一季度相对于前一年第一季度产值增长率 y 的频数分布表 y 的分 组 020, 0) 0, 020) 020, 040) 040, 060) 060, 080) 企业 数 2 24 53 14 7 ()分别估计这类企业中产值增长率不低于 40%的企业比例、产值负增长的企业比 例; ()求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间 的中点值为代表)(精确到 001) 附: 748602 解:()根据产值增长率频数分布表得,所调查的 100 个企业中产值增长率不低于 40%的企业频 率为147 100 02
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022高考数学一轮复习课件
链接地址:https://www.77wenku.com/p-194824.html