1、章末复习课,第2章 统计,学习目标 1.会根据不同的特点选择适当的抽样方法获得样本数据; 2.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体的数字特征; 3.能利用散点图对两个变量是否相关进行初步判断,能用线性回归方程进行预测.,题型探究,知识梳理,内容索引,当堂训练,知识梳理,知识点一 抽样方法,1.当总体容量较小,样本容量也较小时,可采用 . 2.当总体容量较大,样本容量较小时,可用 . 3.当总体容量较大,样本容量也较大时,可用 . 4.当总体由差异明显的几部分组成时,可用 .,分层抽样法,抽签法,随机数表法,系统抽样法,知识点二 用样本估计总体,用样本频率分布估计总
2、体频率分布时,通常要对给定的一组数据作频率与频率 .当样本只有两组数据且样本容量比较小时,用 刻画数据比较方便.,茎叶图,分布表,分布直方图,知识点三 样本的数字特征,样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括、 和 ;另一类是反映样本波动大小的,包括极差、及 .,标准差,众数,中位数,平均数,方差,知识点四 变量间的相关关系,1. 两个变量之间的相关关系的研究,通常先作变量的 ,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系). 2.求回归方程的步骤:,散点图,题型探究,类型一 抽样方法的应用,例1 某政府机关有在编人员100人,其中副处级以上干部10人,一般干
3、部70人,干事20人,上级机关为了了解机关人员对政府机构的改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?,用分层抽样抽取.即从副处级以上干部中抽取2人,一般干部中抽取14人,干事中抽取4人. 副处级以上干部与干事人数都较少,他们分别按110编号和120编号,然后采用抽签法分别抽取2人和4人,对一般干部采用00,01,69编号,然后用随机数表法抽取14人.,解答,三种抽样方法并非截然分开,有时你中有我,我中有你,它们都能保证个体被抽到的机会相等.,反思与感悟,跟踪训练1 某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中
4、抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为_.,8,答案,解析,类型二 用样本的频率分布估计总体分布,例2 有1个容量为100的样本,数据(均为整数)的分组及各组的频数如下: 12.5,15.5),6;15.5,18.5),16;18.5,21.5),18;21.5,24.5),22;24.5,27.5),20;27.5,30.5),10;30.5,33.5,8. (1)列出样本的频率分布表;,解答,样本的频率分布表如下:,(2)画出频率分布直方图;,频率分布直方图如图:,解答,(3)估计小于30的数据约占多大百分比.,小于30的数据占0.060.160
5、.180.220.200.100.9292%.,解答,借助图表,可以把抽样获得的庞杂数据变得直观,凸显其中的规律,便于信息的提取和交流.,反思与感悟,跟踪训练2 为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为_.,4.7,4.8)之间频率为0.32,4.6,4.7)之间频率为10.620.050.1110.780.22. a(0.220.32)10054.,54,答案,解析,类型三 用样本的数字特征估计总体的数字特征,例3
6、甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为 甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;,解答,(2)根据计算结果判断哪台机床加工零件的质量更稳定.,两台机床所加工零件的直径的平均数相同,所以乙机床加工零件的质量更稳定.,解答,反思与感悟,样本的数字特征就像盲人摸到的象的某一局部特征,只有把它们结合起来才能看到全貌.,跟踪训练3 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:,问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?,解答,类型四 线性
7、回归方程的应用,例4 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:,解答,(1)在给定的坐标系中画出表中数据的散点图;,散点图如图.,(2)求出y关于x的线性回归方程 bxa,并在坐标系中画出回归直线;,解答,b0.7,a1.05, 0.7x1.05,回归直线如图所示.,(3)试预测加工10个零件需要多少小时?,将x10代入线性回归方程,得 0.7101.058.05, 故预测加工10个零件约需要8.05小时.,解答,反思与感悟,散点图经最小平方法量化为线性回归方程后,更便于操作(估计、预测),但得到的值仍是估计值.,跟踪训练4 2017年元旦前夕,
8、某市统计局统计了该市2016年10户家庭的年收入和年饮食支出的统计资料如下表:,(1)如果已知y与x成线性相关关系,求线性回归方程;,解答,(2)若某家庭年收入为9万元,预测其年饮食支出.,解答,当x9时, 0.1790.812.34(万元). 可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.,当堂训练,1.某报社做了一次关于“什么是新时代的雷锋精神”的调查,在A,B,C,D四个单位回收的问卷数依次成等差数列,且共回收了1 000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B单位抽取30份,则在D单位抽取的问卷是_份.,60,答案,解析,2,3,4,1,
9、2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:,2,3,4,1,答案,解析,则y对x的线性回归方程为_.,3.随机抽取某学校甲、乙两班各10名同学的一模数学成绩,获得数学成绩的茎叶图如图,则根据茎叶图可估计一模数学平均成绩较高的班级是_.,2,3,4,1,甲班,答案,解析,2,3,4,1,根据茎叶图可看出所有的数据,茎上是百位数和十位数,再利用求平均数的公式,求出成绩的平均数,由茎叶图可计算甲班10名同学的平均成绩是(12911211510110410895978277)101 02010102,乙班10名同学的平均成绩是(12112411710310310591888
10、976)101 01710101.7.所以由此估计甲班的数学平均成绩大于乙班的数学平均成绩.,4.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为20,40),40,60),60,80),80,100.若低于60分的人数是15,则该班的学生人数是_.,由频率分布直方图,得低于60分的频率为(0.010.005)200.3.,50,答案,解析,2,3,4,1,规律与方法,1.应用抽样方法抽取样本时,应注意以下几点: (1)用随机数表法抽样时,对个体所编的号码位数要相等.当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.,2.用样本的频率分布估计
11、总体分布 利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布.但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息.在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,这给数据的记录和表示都带来方便.,3.用样本的数字特征估计总体的数字特征 为了从整体上更好地把握总体的规律, 我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.平均数就是所有样本数据的平均值,用 表示;标准差是反映样本数据分散程度大小的最常用统计量,有时也用标准差的平方s2方差来代替标准差,实质一样. 4.线性回归方程的应用 分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出线性回归方程,并利用线性回归方程进行估计和预测.,本课结束,