1、2.2.1 用样本的频率分布估计总体的分布(二),第二章 2.2 用样本估计总体,学习目标 1.了解频率分布折线图和总体密度曲线的定义. 2.理解茎叶图的概念,会画茎叶图. 3.了解频率分布直方图、频率分布折线图、茎叶图的各自特征,学会选择不同的方法分析样本的分布,从而作出总体估计.,题型探究,问题导学,内容索引,当堂训练,问题导学,知识点一 频率分布折线图和总体密度曲线,1.频率分布折线图 用线段连接频率分布直方图中各个长方形 ,就得到频率分布折线图. 2.总体密度曲线 在样本频率分布直方图中,随着样本容量的增加,作图时所分的_ 增加,组距减小,相应的频率分布直方图会越来越接近于一条_,统计
2、中称这条光滑曲线为总体密度曲线,它精确地反映了一个总体在各个区域内取值的规律.,上边的中点,组数,光滑曲,线,思考1,知识点二 茎叶图,茎叶图是表示样本数据分布情况的一种方法,那么“茎”、“叶”分别指的是哪些数?,茎叶图中,“叶”是数据的最后一个数字,其前面的数字作为“茎”.,答案,茎叶图可以表示三位数的数据吗?如何表示?,思考2,可以.这时茎表示前两位数,叶表示最后一位数.,答案,茎叶图中,“茎”和“叶”的划分是固定不变的吗?,思考3,不是,可根据样本数据的特点灵活决定.,答案,梳理,茎叶图 (1)将所有两位数的十位数字作为 ,个位数字作为 ,茎相同者共用一个茎,茎按从 的顺序从上向下列出,
3、共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序). (2)茎叶图的优点与不足 优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. 不足:当样本数据较多时,茎叶图就显得不太方便.,茎,小到大,叶,题型探究,命题角度1 茎叶图的绘制 例1 某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下: 品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,
4、423,423, 427, 430,430,434, 443,445,445,451,454. 品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401, 403, 406,407,410,412, 415,416,422,430. (1)画出茎叶图;,解答,类型一 茎叶图及应用,茎叶图如图.,样本容量不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息丢失,而且还可以随时记录新的数据.,(2)用茎叶图处理现有的数据,有什么优点?,解答,(3)通过观察茎叶图,对品种A与B的亩产量
5、及其稳定性进行比较,得出统计结论.,解答,通过观察茎叶图可以看出: 品种A亩产量的平均数比品种B亩产量的平均数大; 品种A的亩产量波动比品种B的亩产量波动大,故品种A的亩产量稳定性较差.,由于茎叶图较好地保留了原始数据,所以可以帮助我们分析样本数据的大致频率分布.在利用茎叶图分析数据特点时,要注意区别茎与叶.,反思与感悟,跟踪训练1 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下: 甲运动员得分:13,51,23,8,26,38,16,33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39. 试制作茎叶图来对比描述这些数据.,解答
6、,以十位数字为茎,个位数字为叶,制作茎叶图如图:,命题角度2 茎叶图的应用 例2 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下: A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79 根据两组数据作出两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).,解答,两地区用户满
7、意度评分的茎叶图如图:,通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.,茎叶图可保留原始数据,还可以通过叶的疏密情形,得到样本数据的分布离散情形.,反思与感悟,跟踪训练2 一家连锁超市拥有多个分店,为分析各个分店的销售状况,管理部门收集了A、B两个规模相近的分店50天的销售额数据(单位:万元): A分店: 44 57 59 60 61 61 62 63 63 65 66 66 67 69 70 70 71 72 73 73 73 74 74 74 75 75 75 75 75 76 76 77 77
8、 77 78 78 79 80 80 82 85 85 86 86 90 92 92 92 93 96,B分店: 35 39 40 44 44 48 51 52 52 54 55 56 56 57 57 57 58 59 60 61 61 62 63 64 66 68 68 70 70 71 71 73 74 74 79 81 82 83 83 84 85 90 91 91 94 95 96 100 100 100 (1)将两个分店的销售额制成茎叶图;,解答,茎叶图如图所示:,(2)比较两个分店销售额分布的特点.,解答,由茎叶图可以看出A分店销售额的分布比较均匀,平均销售额是74.38万元,B
9、分店的销售额分布不太均匀,其平均销售额是68.48万元,因此A分店的销售情况比B分店的好.,例3 从甲、乙两个城市所有的自动售货机中随机抽取16台,记录了上午8001100之间各自的销售情况(单位:元): 甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41; 乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23. 试用纵坐标为频数的频数分布直方图与茎叶图的方式分别表示上面的数据,并简要说明各自的优点.,类型二 茎叶图与频率分布直方图的综合应用,解答,用频数分布直方图表示如图:,茎叶图如图,两竖线中间的数字表
10、示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.,从图中可以看出频数分布直方图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;而用茎叶图表示有关数据,对数据的记录和表示都带来方便.,茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录,但样本容量较大,或者需要比较三组以上的数据时,使用茎叶图就不合适;而频率分布表和频率分布直方图可以处理样本容量很大的数据,但损失了样本的原始数据,而且必须在完成抽样后才能制作.,反思与感悟,跟踪训练3 某中学举行了一次“环保知识竞赛”活动.为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的成绩(得分取正
11、整数,满分为100分)作为样本(样本容量为n)进行统计.按照50,60),60,70),70,80),80,90),90,100的分组作出了频率分布直方图,并作出了分数的茎叶图(图中仅列出得分在50,60),90,100的数据),如图.,则样本容量n和频率分布直方图中x,y的值分别为 A.50,0.030,0.004 B.30,0.040,0.003 C.30,0.030,0.040 D.50,0.300,0.400,答案,解析,当堂训练,A.组距越大,频率分布折线图越接近于它 B.样本容量越小,频率分布折线图越接近于它 C.阴影部分的面积代表总体在(a,b)内取值的百分比 D.阴影部分的平均
12、高度代表总体在(a,b)内取值的百分比,1.如图是总体密度曲线,下列说法正确的是,2,3,4,5,1,答案,2.对一个未知总体,下列方法: 频率分布直方图;频率分布表;频率分布折线图;茎叶图;总体密度曲线. 其中可以用来表示样本数据的频率分布的有 A.2种 B.3种 C.4种 D.5种,答案,2,3,4,5,1,2,3,4,5,1,3.在茎叶图中比40大的数据有,答案,A.2个 B.3个 C.4个 D.5个,2,3,4,5,1,4.从茎叶图观察比较甲、乙成绩哪个稳定的问题,下列说法正确的是 A.主要看叶,叶越齐越稳定 B.主要看众数,等于众数的数据越多越稳定 C.主要看中位数,中位数越大越稳定 D.主要是看成绩的分布,在中位数附近相对集中,则成绩稳定,答案,2,3,4,5,1,5.一个样本的容量为72,分成5组,已知第一、五组的频数都为8,第二、四组的频率都为 ,则第三组的频数为 A.16 B.20 C.24 D.36,答案,解析,规律与方法,1.估计总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图. 2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.,本课结束,