专题2.2 用样本估计总体-20届高中数学同步讲义人教版(必修3)
《专题2.2 用样本估计总体-20届高中数学同步讲义人教版(必修3)》由会员分享,可在线阅读,更多相关《专题2.2 用样本估计总体-20届高中数学同步讲义人教版(必修3)(21页珍藏版)》请在七七文库上搜索。
1、第二章 统计2.2 用样本估计总体1用样本的频率分布估计总体分布(1)频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小一般用频率分布直方图反映样本的频率分布,频率分布直方图的绘制步骤如下:求极差(即一组数据中_与_的差)决定组距与组数组距与组数的确定没有固定标准,需要一个尝试与选择的过程组数与样本容量有关,一般样本容量越大,所分组数越多当样本容量不超过100时,按照数据的多少,常分成512组为方便起见,组距的选择应力求“取整”将数据分组通常对组内数值所在区间取左闭右开区间,最后一组取闭区间列频率分布表落在各小组内的数据的个数叫做频数,每小组的频数与数据总数的比值叫做这一小组的
2、频率计算各小组的频率,作出频率分布表画频率分布直方图:依据频率分布表画频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各个小长方形面积的总和等于_(2)总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的_,就得到频率分布折线图总体密度曲线:随着样本容量的增加,作频率分布直方图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细
3、的信息(3)茎叶图概念:统计中有一种被用来表示数据的图叫做茎叶图茎是指基本不变或变化不大的位,叶就是从茎的旁边生长出来的数绘制步骤:(a)将数据分为“茎”、“叶”两部分;(b)将最大茎与最小茎之间的数字按大小顺序排成一列,茎相同者共用一个茎,再画上竖线作为分界线;(c)将各个数据的“叶”按大小顺序在分界线的一侧对应茎处同行列出优缺点:在样本数据较少时,用茎叶图表示数据的效果较好它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便但当样本数据较多或数据位数较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一定的空间,如果数据很多,枝叶就会很长注意:绘制茎叶图时,重复
4、出现的数据要重复记录,不能遗漏,特别是“叶”位置的数据同一数据出现几次,就要在图中体现几次学-科网2用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数众数:在一组数据中出现次数_的数据叫做这组数据的众数在频率分布直方图中,它是最高的小长方形的_中位数:将一组数据按_顺序依次排列,把处在最_位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等平均数:个样本数据的平均数为由于样本平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起
5、平均数的改变但特殊情况下,平均数可能受极端值的影响而偏离一般情况在频率分布直方图中,平均数的估计值等于_(2)标准差和方差标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示假设样本数据是,表示这组数据的平均数,则标准差方差:方差就是标准差的平方,即显然,在刻画样本数据的分散程度上,方差与标准差是一样的但在解决实际问题时,一般多采用标准差标准差、方差描述了一组数据围绕平均数波动程度的大小标准差、方差越大,则数据的离散程度_;标准差、方差越小,数据的离散程度_反之亦可由离散程度的大小推算标准差、方差的大小K知识参考答案:1(1)最大值 最小值 1 (2)中点 2(1)最多 中点 大小 中
6、间 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2) 越大 越小K重点频率分布直方图、茎叶图的绘制及读图,平均数和方差的简单计算K难点能通过样本的频率分布估计总体的分布K易错容易忽略频率分布直方图中纵轴的意义,从而造成频率分布直方图画错1频率分布直方图在绘制频率分布直方图时,要注意:(1)所有的数据都必须在所分的组内,可适当将区间两端点的数据调整以便于分组;(2)落在各小组内的频数必须计算正确.在根据频率分布直方图进行相关计算时,需掌握下列关系式:(1);(2),及其变形:,.【例1】某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为.若这批产品有
7、120个,估计其中净重大于或等于78克且小于84克的产品的个数是A12B18C25D90【答案】D【解析】净重大于或等于78克且小于84克的频率为,所以在该范围内的产品个数为.【例2】从某校参加高一年级基础知识数学测试的450名同学中,随机抽取若干名同学,将他们的成绩制成如下频率分布表.(1)根据表中已知数据,填写在、处的数值分别为_ , _ , _ ;(2)补全在区间90,160上的频率分布直方图;(3)请你估计该校成绩不低于130分的同学人数.分组频数频率90,100)0.08100,110)110,120)0.36120,130)160.32130,140)0.08140,150)215
8、0,1600.02合计【答案】答案详见解析.(2)求出每组的,即为矩形的高,补全在区间90,160上的频率分布直方图如图所示:(3),则在随机抽取的50名学生中有7名不低于130分.,则450名学生中不低于130分的大约有63名.【名师点睛】在频率分布直方图中,纵坐标表示的是频率与组距的比,不要误以为是频率,解题时要格外注意.在频率分布直方图中,各个小长方形的面积等于相应各组的频率,又各组的频率之和为1,所以所有长方形的面积之和等于1,由此可以判断画出的频率分布直方图是否正确.2茎叶图对于样本数据较少,但较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则
9、将百位、十位数字作茎,个位数字作叶.样本数据为小数时作类似处理.【例3】在某杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)用茎叶图表示这两组数据;(2)将这两组数据进行比较分析,得到什么结论?【答案】答案详见解析.【解析】(1)用茎叶图表示这两组数据如图所示: 杂志上文章报纸上文章9 8 7 7
10、 5 5 4 1 012 3 8 98 7 7 7 6 5 4 4 3 2 022 2 3 4 7 7 7 86 132 2 3 3 5 6 941 1 6(2)杂志上的文章每个句子的字数集中在1030之间,而报纸上的文章每个句子的字数集中在2040之间.还可以看出杂志上的文章每个句子的平均字数比报纸上的每个句子的平均字数要少,说明杂志作为科普读物需通俗易懂、简明.【名师点睛】对于第(1)问,题干中的数据是十位数分别为1,2,3,4的两位整数,选择1,2,3,4为茎绘制茎叶图.对于第(2)问,从数据的分布情况作出解释,答案不唯一,只要合理、符合实际即可.3众数、中位数、平均数1.众数只与这组数
11、据中的部分数据有关,当一组数据中有不少数据重复出现时,众数往往更能反映问题.众数可以有一个,也可以有多个.2.中位数仅与数据的排列位置有关,中位数可能在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.中位数只有一个.3.平均数受个别极端数据的影响较大,因此若在数据中存在少量极端数据时,平均数对总体估计的可靠性较差,往往用众数或中位数去估计总体.有时也采用剔除最大值与最小值后所得的平均数去估计总体.平均数只有一个.【例4】据报道,某公司的33名职工的月工资(单位:元)如下:职务董事长副董事长董事总经理经理管理员职员人数11215320工资550050
12、0035003000250020001500(1)求该公司职工月工资的平均数、中位数、众数;(精确到1元)(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是多少?(精确到1元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.【答案】答案详见解析.【解析】(1)平均数是.中位数是1500,众数是1500.(2)新的平均数是.新的中位数是1500,新的众数是1500.(3)在这个问题中,中位数或众数均能反映该公司大部分员工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,
13、这样导致平均数与中位数和众数偏差较大,所以平均数不能反映这个公司员工的工资水平.【名师点睛】计算平均数时,可以先估计一下平均数,然后再用这个估计值加上所有数据与其差的平均值就是精确的平均数,这样计算平均数能减少计算量.4标准差、方差用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.【例5】从甲、乙两名学生中选拔一人参加射箭比赛,为此需要对他们的射箭水平进行测试.现这两名学生在相同条件下各射箭10次,命中的环数如下:甲897976101086乙10986879788(1)计算甲、乙两人
14、射箭命中环数的平均数和标准差;(2)比较两个人的成绩,然后决定选择哪名学生参加射箭比赛.【答案】答案详见解析.(2),且,乙的成绩较为稳定,故选择乙参加射箭比赛.【名师点睛】若数据与之间满足关系式,且数据的平均数和方差分别为和,那么的平均数为,方差为,标准差为.1容量为20的样本数据,分组后的频数如下表:分组10,20)20,30)30,40)40,50)50,60)60,70)频数234542则样本数据落在区间40,70)的频率为A0.35B0.45C0.55D0.652下列说法中正确的是A一组数据的平均数一定大于这组数据中的每个数据B一组数据不可能有两个众数C一组数据的中位数一定是这组数据
15、中的某个数据D一组数据的方差越大,说明这组数据的波动程度越大3在一次数学测验中,某小组16名学生的成绩与全班的平均分116分的差分别是2,3,3,5,6,12,12,8,2,1,4,10,2,5,5,6那么这个小组的平均分是_4已知某同学四次数学单元测试的成绩为118,125,128,129,则该同学成绩的方差为_5已知一组数据1,3,x,5,4的平均数为3,则这组数据的方差是_6已知三个正整数,其平均数和方差都是2,则这三个数中最大的数是_7为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图所示,则该组数据的标准差为_8某市发布2017年6月11日
16、到6月20日的空气质量指数(AQI),数据如下:153,203,268,166,157,164,268,407,335,119,则这组数据的中位数是_9已知在一组数列1,2,4,5,5,8,9中,设中位数为a,众数为b,则=_10一组数据:40、10、80、20、70、30、50、90、70,若这组数据的平均数为m,众数为n,中位数为p,则m,n,p之间的大小关系是_学!科网11已知一组数据按从小到大的顺序排列,得到1,0,3,x,7,14中位数为5,求这组数据的平均数和方差12已知一组数据x1,x2,x3,x4,x5的平均数是2,标准差是1,则另一组数据2x1+1,2x2+1,2x3+1,2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 专题
链接地址:https://www.77wenku.com/p-91101.html