1、章末复习学习目标1.会根据不同的特点选择适当的抽样方法获得样本数据.2.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体的数字特征.3.能利用散点图对两个变量是否相关进行初步判断,能用线性回归方程进行预测1抽样方法(1)当总体容量较小,样本容量也较小时,可采用抽签法(2)当总体容量较大,样本容量较小时,可用随机数表法(3)当总体由差异明显的几部分组成时,可用分层抽样法2总体分布的估计用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图3总体特征数的估计样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反
2、映样本波动大小的,包括极差、方差及标准差4线性回归方程(1)两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系)(2)求回归方程的步骤:先把数据制成表,从表中计算出,x,xiyi.计算a,b.公式为写出回归方程bxa.1简单随机抽样是不放回抽样()2随机数表只有一张,并且读数时只能按照从左向右的顺序读取,否则产生的随机样本就不同了,对整体的估计就不准确了()3一组数据一定存在众数,且不可能有两个众数()4在频率分布直方图中,每个小组的频率等于相应小长方形的高度()题型一抽样方法的应用例1某政府机关有在编人员100人,其中副处级以上干部1
3、0人,一般干部70人,干事20人,上级机关为了了解机关人员对政府机构的改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?解用分层抽样抽取2010015,2,14,4,即从副处级以上干部中抽取2人,一般干部中抽取14人,干事中抽取4人副处级以上干部与干事人数都较少,他们分别按110编号和120编号,然后采用抽签法分别抽取2人和4人,对一般干部采用00,01,69编号,然后用随机数表法抽取14人反思感悟两种抽样方法并非截然分开,有时你中有我,我中有你,它们都能保证个体被抽到的机会相等跟踪训练1某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生
4、中抽出55人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为_答案17解析由从高一年级学生中抽出20人知抽样比为,所以从高二年级学生中抽取的人数为36018,所以从高三年级学生中抽取的人数为55201817.题型二用样本的频率分布估计总体分布例2从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)估计成绩在60,90)分的学生比例解(1)频率分布表如下.成绩分组频
5、数频率频率/组距40,50)20.040.00450,60)30.060.00660,70)100.20.02070,80)150.30.03080,90)120.240.02490,10080.160.016合计501.000.100(2)频率分布直方图和折线图如图所示:(3)成绩在60,90)分的学生比例为0.20.30.240.7474%.反思感悟借助图表,可以把抽样获得的复杂数据变得直观,凸显其中的规律,便于信息的提取和交流跟踪训练2为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力
6、在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为_答案54解析4.7,4.8)之间频率为0.32,4.6,4.7)之间频率为10.620.050.1110.780.22.a(0.220.32)10054.题型三线性回归方程的应用例3某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程bxa,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:b,ab )解(1)散点图如图(2)由表中数据
7、得:iyi52.5,3.5,3.5,54,b0.7,a1.05,0.7x1.05,回归直线如图所示(3)将x10代入线性回归方程,得0.7101.058.05,故预测加工10个零件约需要8.05小时反思感悟散点图经最小平方法量化为线性回归方程后,更便于操作(估计、预测),但得到的值仍是估计值跟踪训练32018年元旦前夕,某市统计局统计了该市2017年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x(万元)24466677810年饮食支出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)如果已知y与x成线性相关关系,求线性回归方程;(2)若某家庭年收入为9万元,
8、预测其年饮食支出(参考数据:xiyi117.7,x406)解(1)依题意可计算得:6,1.83,236, 10.98,又xiyi117.7,x406,b0.17,ab0.81,0.17x0.81.所求的线性回归方程为0.17x0.81.(2)当x9时,0.1790.812.34(万元)可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元1现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是()A1 B2 C3 D4答案B解析设这10个数为a1,a2,a10,则有aaa200,且a1a2a1040,4,标准差为2.2某农田施肥量x(单位:kg)与小麦产量y(单位
9、:kg)之间的回归方程是4x250,则当施肥量为50 kg时,可以预测小麦的产量为()A350 kg B450 kgC550 kg D650 kg答案B解析直接将x50代入回归方程中,可得450250450.3某报社做了一次关于“什么是新时代的雷锋精神”的调查,在A,B,C,D四个单位回收的问卷数依次成等差数列,且共回收了1 000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B单位抽取30份,则在D单位共抽取问卷()A30份 B45份 C60份 D75份答案C解析由题意依次设在A,B,C,D四个单位回收的问卷数分别为a1,a2,a3,a4,则,a2200,又a1a2a
10、3a41 000,即3a2a41 000,a4400,设在D单位抽取的问卷数为n,则,解得n60.4下表是关于青年观众的性别与是否喜欢戏剧的调查数据,人数如下表所示:不喜欢戏剧喜欢戏剧男性青年观众4010女性青年观众4060现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢戏剧的男性青年观众”的人中抽取了8人,则n的值为_答案30解析参与调查的总人数为150,由8n40150,得n30.5某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为20,40),40,60),60,80),80,100若低于60分的人数是15,则该班的学生人数是_答案50解析
11、由频率分布直方图,得低于60分的频率为(0.010.005)200.3.该班学生人数n50.1应用随机数表法抽取样本时,应注意:用随机数表法抽样时,对个体所编的号码位数要相等当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数2用样本的频率分布估计总体分布利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图对总体情况作出估计直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息3用样本的数字特征估计总体的数字特征为了从整体上更好地把握总体的规律, 我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计平均数就是所有样本数据的平均值,用表示;标准差是反映样本数据分散程度大小的最常用统计量,有时也用标准差的平方s2方差来代替标准差,实质一样4线性回归方程的应用分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出线性回归方程,并利用线性回归方程进行估计和预测