1、第九章统计与统计案例2022年高考一轮数学单元复习(新高考专用)第I卷(选择题)一、单选题1(2021·天津高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分分数据,将所得个评分数据分为组:、,并整理得到如下的费率分布直方图,则评分在区间内的影视作品数量是( )ABCD【答案】D【分析】利用频率分布直方图可计算出评分在区间内的影视作品数量.【详解】由频率分布直方图可知,评分在区间内的影视作品数量为.故选:D.2(2021·全国高考真题(文)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方
2、图,下面结论中不正确的是( )A该地农户家庭年收入低于4.5万元的农户比率估计为6%B该地农户家庭年收入不低于10.5万元的农户比率估计为10%C估计该地农户家庭年收入的平均值不超过6.5万元D估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【答案】C【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于
3、4.5万元的农户的比率估计值为,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为,故D正确;该地农户家庭年收入的平均值的估计值为(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C.故选:C.【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于.3(2008·山东高考真题(文)从某项综合能力测试中抽取100人的成绩,统计如表
4、,则这100人成绩的标准差为( )分数54321人数2010303010ABC3D【答案】B【详解】试题分析:根据平均数、方差、标准差的概念直接运算即可解:,=,故选B4(2020·天津高考真题)从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为( )A10B18C20D36【答案】B【分析】根据直方图确定直径落在区间之间的零件频率,然后结合样本总数计算其个数即可.【详解】根据直方图,直径落在区间之间的零件频率为:,则区间内零件的个数为:.故选:B.【点睛】本题主要考查频率分布直方图的计算与实际
5、应用,属于中等题.5(2020·全国高考真题(文)设一组样本数据x1,x2,xn的方差为0.01,则数据10x1,10x2,10xn的方差为( )A0.01B0.1C1D10【答案】C【分析】根据新数据与原数据关系确定方差关系,即得结果.【详解】因为数据的方差是数据的方差的倍,所以所求数据方差为故选:C【点睛】本题考查方差,考查基本分析求解能力,属基础题.6(2019·全国高考真题(理)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A中位数B平均
6、数C方差D极差【答案】A【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案【详解】设9位评委评分按从小到大排列为则原始中位数为,去掉最低分,最高分,后剩余,中位数仍为,A正确原始平均数,后来平均数平均数受极端值影响较大,与不一定相同,B不正确由易知,C不正确原极差,后来极差可能相等可能变小,D不正确【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.7(重庆市第八中学2020-2021学年高二下学期期中数学试题)随机调查了相同数量的男、女学生,发现有的男生喜欢网络课程,有的女生不喜欢网络课程,且有的把握但没有的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生
7、总数量可能为( )附:,其中0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828ABCD【答案】B【分析】设被调查的男、女学生总数量为,列出列联表,计算出关于的表达式,结合临界值表可得出,求出的取值范围,即可得解.【详解】设被调查的男、女学生总数量为,根据题意可得出列联表如下表所示:喜欢网络课程不喜欢网络课程合计男生女生合计,由题意可得,即,可得.故的可能取值为.故选:B.8(2021·云南高二期末(文)由数据,可得关于的线性回归方程为,若,则( )A48B52C56D80【答案】A【分析】根据回归直
8、线方程必过样本中心即可求出结果.【详解】因为,所以,所以,所以.故选:A.9(2021·重庆西南大学附中高二期末)下列说法中正确的个数是( )某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按简单随机抽样的方法抽取为200人,则每个女生被抽到的概率为;设有一个回归方程,变量增加1个单位时,平均增加5个单位;将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;具有线性相关关系的两个变量,的相关系数为r.则越接近于0,之间的线性相关程度越高;在一个列联表中,由计算得出,而,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系A1B2C3D4【答案】B【
9、分析】利用系统抽样,回归直线的方程,方差,拟合效果,列联表的应用,逐个判断,即可得出答案【详解】解:对于,某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按系统抽样的方法抽取为200人,古典概率中,每个个体被抽的概率都是一样的,都等于,故错误;对于,一个回归方程,变量增加1个单位时,平均减小5个单位,故不正确;对于:方差的计算公式,一组数据中的每一个数据都加上或减去同一个常数后,它的平均数也会都加上或减去同一个常数,故方差不变,故正确;对于:设具有线性相关关系的两个变量,的相关系数为则越接近于0,之间的线性相关程度越低,故不正确;对于,在一个列联表中,由计算得出,而,则在犯错误的概
10、率不超过0.001的前提下认为这两个变量之间有相关关系,故正确故选:B10(2020·黑龙江省哈尔滨市双城区兆麟中学高二期末(文)下列说法错误的是( )A回归直线过样本点的中心B在残差图中,残差点分布的带状区域的宽度越窄,其模型拟合的精度越高C线性回归方程对应的直线至少经过其样本数据点,中的一个点D在回归分析中,的模型比的模型拟合的效果好【答案】C【分析】利用线性回归的相关定义即可得出答案【详解】样本中心点一定在线性回归方程上,则A正确;残差点分布越窄越均匀,拟合程度越高,则B正确;样本点不一定在线性回归直线上,则C错误;越接近于1,模拟程度越好,则D正确.故选:C.11(2021&
11、#183;重庆南开中学高二期末)“绿水青山就是金山银山”,某城市发起了“减少碳排放行动”,通过增加植树面积,逐步实现碳中和,为调查民众对减碳行动的参与情况,在某社区随机调查了90位市民,每位市民对减碳行动给出认可或不认可的评价,得到如图所示的列联表经计算的观测值,则可以推断出( )认可不认可40岁以下202040岁以上(含40岁)4010附:A该社区居民中约有99%的人认可“减碳行动”B该社区居民中约有99.5%的人认可“减碳行动C在犯错率不超过0.005的前提下,认为“减碳行动"的认可情况与年龄有关D在犯错率不超过0.001的前提下,认为“减碳行动"的认可情况与年龄有关【
12、答案】C【分析】直接用观测值与临界值表中的数据比较可得答案【详解】解:该社区居民中认可“减碳行动”的比例为,所以AB错误,因为的观测值,所以在犯错率不超过0.005的前提下,认为“减碳行动"的认可情况与年龄有关,所以C正确,D错误,故选:C二、多选题12(2021·全国高考真题)下列统计量中,能度量样本的离散程度的是( )A样本的标准差B样本的中位数C样本的极差D样本的平均数【答案】AC【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.【详解】由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集
13、中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选:AC.13(2021·全国高考真题)有一组样本数据,由这组数据得到新样本数据,其中(为非零常数,则( )A两组样本数据的样本平均数相同B两组样本数据的样本中位数相同C两组样本数据的样本标准差相同D两组样数据的样本极差相同【答案】CD【分析】A、C利用两组数据的线性关系有、,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B、D的正误.【详解】A:且,故平均数不相同,错误;B:若第一组中位数为,则第二组的中位数为,显然不相同,错误;C:,故方差相同,正确;D:由极差
14、的定义知:若第一组的极差为,则第二组的极差为,故极差相同,正确;故选:CD14(2021·广东高二期中)下列说法正确的是( )A对于独立性检验,随机变量的观测值值越小,判定“两变量有关系”犯错误的概率越小B在回归分析中,相关指数越大,说明回归模型拟合的效果越好C随机变量,若,则D甲、乙、丙、丁个人到个景点旅游,每人只去一个景点且每个景点都有人去,设事件为“个人去的景点各不相同”,事件为“甲不去其中的景点”,则【答案】BD【分析】利用独立性检验可判断A选项;利用相关指数与回归模型的拟合效果可判断B选项;利用二项分布的期望和方差公式可判断C选项;利用分步计数原理结合古典概型的概率公式可判
15、断D选项.【详解】对于A选项,对于独立性检验,随机变量的观测值值越小,判定“两变量有关系”犯错误的概率越大,A选项错误;对于B选项,在回归分析中,相关指数越大,说明回归模型拟合的效果越好,B选项正确;对于C选项,随机变量,则,解得,C选项错误;对于D选项,利用分步计数原理结合古典概型的概率公式可得,D选项正确.故选:BD.15(2021·江苏省天一中学高二期末)晚上睡眠充足是提高学习效率的必要条件某高中高二的学生分为寄宿生和走读生两类,其中寄宿生晚上9:50必须休息,睡眠能得到充分的保证;走读生晚上大多10:30休息,甚至更晚为了了解这两类学生的学习效率情况,该校有关部门分别对这两类
16、学生学习总成绩的前50名进行问卷调查,得到如下表所示的统计数据,则( )寄宿生走读生学习效率高3010学习效率低2040附:,0.0500.0100.0050.0013.8416.6357.87910.828A走读生前50名学生中有40的学生学习效率高B寄宿生前50名学生中有60的学生学习效率高C认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过0.05D有99.9的把握认为“学生学习效率高低与晚上睡眠是否充足有关”【答案】BD【分析】根据频数除以总数得到频率,即可判断A、B,完善列联表,计算观测值,对照附表得出结论,判断、是否正确【详解】解:依题意走读生前50名学生中有10人学习效
17、率高,即,所以错误;寄宿生前50名学生中有人学习效率高,即,故B正确;依题意得到如下列联表:寄宿生走读生合计学习效率高301040学习效率低204060合计5050100则所以有的把握认为“学生学习效率高低与晚上睡眠是否充足有关”, 正确;认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率不超过0.05,所以错误故选:16(2021·沙坪坝区·重庆一中高二期中)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若在犯错误概率不超过0.05的前提下认为是否
18、喜欢抖音和性别有关,则调查人数中男生可能有( )人0.0500.0103.8416.635附:A25B40C45D60【答案】CD【分析】设男生的人数为,列出列联表,计算出的观测值,结合题中条件可得出关于的不等式,解出的取值范围,即可得出男生人数的可能值.【详解】设男生的人数为,根据题意列出列联表如下表所示:男生女生合计喜欢抖音不喜欢抖音合计则,由于在犯错误概率不超过0.05的前提下认为是否喜欢抖音和性别有关,则,即,得,则的可能取值有、,因此,调查人数中男生人数的可能值为、50、55、.故选:CD.17(2021·镇江崇实女子中学高二期中)关于变量x,y的n个样本点及其线性回归方程
19、,下列说法正确的有( )A相关系数r的绝对值越接近0,表示x,y的线性相关程度越强B相关系数r的绝对值越接近1,表示x,y的线性相关程度越强C残差平方和越大,表示线性回归方程拟合效果越好D若,则点一定在线性回归方程上【答案】BD【分析】根据相关系数绝对值大小,判断向量相关性强弱,可判定选项A,B;根据残差分析,判断线性回归方程的拟合效果,可判定选项C;根据样本中心点与线性回归直线的关系,即可判定选项D.【详解】当相关系数r的绝对值越接近1,表示x,y的线性相关程度越强,选项A错误,选项B正确;残差平方和越小,表示线性回归方程拟合效果越好,选项C错误;样本中心点一定在线性回归直线上,选项D正确.
20、故选:BD.18(2021·河南高二期中(文)有一散点图如图所示,在5个数据中去掉后,下列说法不正确的是( )A残差平方和变小B相关系数r变小C相关指数变小D解释变量x与预报变量y的相关性变弱【答案】BCD【分析】利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况【详解】解:从散点图可分析得出:只有点偏离直线远,若去掉点,则变量与变量的线性相关性变强,相关系数变大,相关指数变大,残差的平方和变小,解释变量x与预报变量y的相关性变强;故选:19(2021·全国高二专题练习)(多选题)对相关系数r来说,下列说法错误的有( )A|r|1,|r|越接近0,相关程度越
21、大;|r|越接近1,相关程度越小B|r|1,|r|越接近1,相关程度越大;|r|越大,相关程度越小C|r|1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小D|r|1,|r|越接近1,相关程度越小;|r|越大,相关程度越大【答案】ABD【分析】利用相关系数的取值范围以及衡量两个变量之间的强弱规律即可判断作答.【详解】相关系数r的取值范围是,即选项B,D都是错误的;相关系数r衡量两个变量之间的相关关系的强弱时,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值接近于0时,表示两个变量之间几乎不存在相关关系,所以“对于相关系数r来说,|r|1,|r|越接近1,相关程度越大;
22、|r|越接近0,相关程度越小”,选项A是错误的,选项C正确.故选:ABD20(【新教材精创】8.2一元线性回归模型及其应用-A基础练)(多选题)在用最小二乘法进行线性回归分析时,下列说法中正确的是( )A由样本数据得到的线性回归方程必过样本点的中心;B由样本点,得到回归直线,则这些样本点都在回归直线上;C利用来刻画回归的效果,比的模型回归效果好;D残差图中的残差点比较均匀地落在水平的带状区域中,宽度越窄,则说明模型拟合精度越低;【答案】AC【分析】样本点未必在回归直线上,所以A正确,B错误;相关指数越大,拟合效果越好,所以C正确;残差图宽度越窄,说明模型拟合精度越高,所以D错误【详解】线性回归
23、直线必过样本点的中心,而样本点未必在回归直线上,所以A正确,B错误;相关指数越大,拟合效果越好,所以C正确;残差图中的残差点比较均匀地落在水平的带状区域中,宽度越窄,说明模型拟合精度越高,所以D错误故选:AC第II卷(非选择题)三、填空题21(2012·浙江高考真题(文)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为_.【答案】160【详解】某个年级共有980人,要从中抽取280人,抽取比例为,此样本中男生人数为,故答案为160.考点:本题考查了分层抽样的应用点评:掌握分层抽样的概念是解决此类问题的关键,属基础
24、题22(2020·江苏高考真题)已知一组数据的平均数为4,则的值是_.【答案】2【分析】根据平均数的公式进行求解即可【详解】数据的平均数为4,即.故答案为:2.【点睛】本题主要考查平均数的计算和应用,比较基础23(2019·全国高考真题(文)我国高铁发展迅速,技术先进经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为_.【答案】098.【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题【详解】由题意得,经停该高铁站的列车正点数约
25、为,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养侧重统计数据的概率估算,难度不大易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值24(2010·安徽高考真题(文)某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取l00户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户依据这些数据并结合所掌握的统计知识,你认为该地
26、拥有3套或3套以上住房的家庭所占比例的合理估计是 .【答案】5.7%【分析】首先根据拥有3套或3套以上住房的家庭所占的比例,得出100 000户中居民中拥有3套或3套以上住房的户数,它除以100 000得到的值,为该地拥有3套或3套以上住房的家庭所占比例的合理估计【详解】该地拥有3套或3套以上住房的家庭可以估计有:则该地拥有3套或3套以上住房的家庭所占比例的合理估计为故答案为【点睛】本题考查了分层抽样问题的运用,首先要注意分层抽样的方法与特点,进而根据合理估计的计算方法,得到答案25(2009·浙江高考真题(文)某个容量为的样本的频率分布直方图如下,则在区间上的数据的频数为_【答案】
27、 30【解析】试题分析:区间对应的频率为,所以在区间上数据的频数为.考点:频率分布直方图.26(2011·辽宁高考真题(文)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元.【答案】0.245【详解】当变为时,=0.245(x+1)+0.321=0.245x+0.321+0.245,而0.245x+0.321+0.245-(0.245x+0.321)=0.245.因此家庭年收入每
28、增加1万元,年饮食支出平均增加0.245万元,本题填写0.245.27(2014·天津高考真题(文)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_名学生【答案】60【分析】采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查的.【详解】该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,应从一年级本科生中抽取学生人数为:.故答案为60.28(2021·
29、重庆字水中学高二期末)某工厂为研究某种产品的产量(吨)与所需某种原材料的质量(吨)的相关性,在生产过程中收集4组对应数据,如下表所示(残差=观测值-预测值)34562.534根据表中数据,得出关于的经验回归方程为据此计算出在样本处的残差为,则表中的值为_【答案】【分析】首先由已知条件求出的值,再由回归直线过样本中心点即可求解.【详解】因为样本处的残差为,即,所以,所以回归方程为:,因为,因为样本中心点在回归直线上,所以,解得:,故答案为:.29(2021·四川高三零模(文)有人发现,多看手机容易使人近视,下表是调查机构对此现象的调查数据:近视不近视总计少看手机多看手机总计则在犯错误的
30、概率不超过_的前提下认为近视与多看手机有关系.附表:参考公式:,其中.【答案】【分析】根据列联表计算得,进而得答案.【详解】解:根据列联表计算,所以在犯错误的概率不超过的前提下认为近视与多看手机有关系.故答案为:30(2021·河南高二期中(文)某企业计划通过广告宣传来提高销售额,经统计,产品的广告费(单位:百万元)与销售额(单位:百万元)之间有如下对应数据:0123414.830.436.239.651由表中的数据得线性回归方程为投入的广告费时,销售额的预报值为_百万元【答案】66.4【分析】先求平均值,再代入线性回归方程得,最后利用线性回归方程估计结果.【详解】因为;所以,因此时
31、,故答案为:66.431(2021·天津高二期末)对两个变量x,y进行回归分析残差的平方和越小,模型的拟合效果越好;相关系数的绝对值接近于0,两个随机变量的线性相关性越强;在经验回归方程中,当解释变量x每增加1个单位时,相应变量平均增加个单位;某人研究儿子身高与父亲身高的关系,得到经验回归方程,当时,即:如果一个父亲的身高为,则儿子的升高一定为则以上结论中正确的序号为_【答案】【分析】根据残差和相关系数的意义判定;根据线性回归方程的意义判定.【详解】根据残差的定义,可知正确;相关系数绝对值越接近于1,线性相关性越强,故错误;由回归方程的意义,根据回归方程的解释变量的系数为0.3, 变
32、量平均增加个单位,故正确;回归方程是表示一种统计规律,具有随机的不确定性,不能说一定是,故错误;故答案为:.32(2021·全国高二专题练习)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天数据如下表:第天12345使用人数()151734578421333由表中数据可得y关于x的回归方程为,则据此回归模型相应于点(2,173)的残差为_【答案】【分析】先计算样本中心点坐标,可得回归方程,计算出的值,然后求出估计值,最后计算残差即可【详解】令,则,由题意可得,则样本中心为,故经过点,所以,解得,则,当时,所以残差为故答案为:33(2021·全国高二专题练习)甲
33、、乙、丙、丁四位同学各自对两变量的线性相关性做试验,并用回归分析方法分别求得相关系数如下表:甲乙丙丁-0.78则_同学的试验结果体现A,B两变量有更强的线性相关性【答案】丁【分析】根据相关系数的特点,相关系数的绝对值越接近1,则两个变量的线性相关性越强,即可得到答案.【详解】 ,且相关系数的绝对值越接近1,则两个变量的线性相关性越强,所以能体现出A,B两变量有更强的线性相关性的是丁故答案为:丁四、双空题34(2017·北京高考真题(理)三名工人加工同一种零件,他们在一天中的工作情况如图所示,其中点Ai的横、纵坐标分别为第i名工人上午的工作时间和加工的零件数,点Bi的横、纵坐标分别为第
34、i名工人下午的工作时间和加工的零件数,i=1,2,3.记Qi为第i名工人在这一天中加工的零件总数,则Q1,Q2,Q3中最大的是_.记pi为第i名工人在这一天中平均每小时加工的零件数,则p1,p2,p3中最大的是_.【答案】Q1 p2 【详解】试题分析:作图可得中点的纵坐标比中点的纵坐标大,所以Q1,Q2,Q3中最大的是, 分别作关于原点的对称点,比较直线的斜率(即为第i名工人在这一天中平均每小时加工的零件数),可得最大,所以p1,p2,p3中最大的是 【考点】图象的应用,实际应用问题【名师点睛】本题考查了根据实际问题分析和解决问题的能力,以及转化与化归的能力,因为第名工人加工总的零件数是,比较
35、总的零件数的大小,即可转化为比较的大小,而表示中点连线的纵坐标,第二问也可转化为中点与原点连线的斜率.35(2009·广东高考真题(文)某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1200编号,并按编号顺序平均分为40组(15号,610号,196200号).若第5组抽出的号码为22,则第8组抽出的号码应是_若用分层抽样方法,则40岁以下年龄段应抽取_人.【答案】37 20 【解析】由系统抽样知识可知,将总体分成均等的若干部分指的是将总体分段,且分段的间隔相等在第1段内采用简单随机抽样的方法确定一个起始编号,在此编号的基础上加上分段
36、间隔的整数倍即为抽样编号由题意,第5组抽出的号码为22,因为2(51)×522,则第1组抽出的号码应该为2,第8组抽出的号码应该为2(81)×537.由分层抽样知识可知,40岁以下年龄段的职工占50%,按比例应抽取40×50%20(人)36(2021·北京朝阳区·高二期末)判断对错,并在相应横线处划“”或“×”.样本相关系数时,称成对数据正相关,时,称成对数据负相关_.样本相关系数的绝对值越接近于1,线性相关程度越弱,越接近于0,线性相关程度越强_.【答案】 × 【分析】根据样本相关系数的意义及性质即可判断作答.【详解】由成
37、对数据正负相关与相关系数的对应关系知,正确,在横线处划“”;因样本相关系数的绝对值越接近于1,线性相关程度越强,越接近于0,线性相关程度越弱,则不正确,在横线处划“×”.故答案为:;×37(2021·浙江高二课时练习)某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程中的为9.4,则:回归方程中_;据此模型预报广告费用为6万元时销售额为_万元.【答案】9.1 65.5 【分析】利用线性回归直线必定经过样本中心点求出,再将代入回归方程可得据此模型预报广告费用为6万元时销售额.【详解
38、】回归方程中的为9.4,根据线性回归直线过样本中心点,得,即回归方程为,据此模型预报广告费用为6万元时,销售额为.故答案为:9.1,65.5.38(2021·江苏高三专题练习)我国探月工程嫦娥五号探测器于2020年12月1日23时11分降落在月球表面预选着陆区,在顺利完成月面自动采样之后,成功将携带样品的上升器送入到预定环月轨道,这是我国首次实现月球无人采样和地外天体起飞,对我国航天事业具有重大而深远的影响,为进一步培养中学生对航空航天的兴趣爱好,某学校航空航天社团在本校高一年级进行了纳新工作,前五天的报名情况为:第1天3人,第2天6人,第3天10人,第4天13人,第5天18人,通过
39、数据分析已知,报名人数与报名时间具有线性相关关系已知第天的报名人数为,则关于的线性回归方程为_,该社团为了解中学生对航空航天的兴趣爱好和性别是否有关系,随机调查了100名学生,并得到如下列联表:有兴趣无兴趣合计男生45550女生302050合计7525100请根据上面的列联表,在概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别_(填“有”或”无”)关系参考公式及数据:回归方程中斜率的最小二乘估计公式为:,;,其中0.100.050.0100.0050.0012.7063.8416.6357.87910.828【答案】 有 【分析】由题意计算、,求出回归系数,写出线性回归方程,
40、利用回归方程求出时的值即可,再由列联表求出,与观测值比较即可;【详解】解:由题意,计算,所以,所以关于的线性回归方程为,由列联表数据可得因为,所以,在犯错误的概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别有关系”故答案为:(1);(2)有39(2018·北京全国·高二单元测试(理)关于与,有如下数据有如下的两个模型:(1);(2).通过残差分析发现第(1)个线性模型比第(2)个拟合效果好,则_,_(用大于,小于号填空,是相关指数和残差平方和)245683040605070【答案】 【分析】直接利用残差的性质以及相关指数的性质求解即可.【详解】由相关指数的
41、的性质可得,越大模型的拟合效果越好,所以,由残差的性质可得,残差平方和越小模型的拟合效果越好,所以,故答案为.【点睛】本题主要考查残差的性质以及相关指数的性质,属于中档题. 残差平方和越小越好,带状区域的宽度越窄,说明模型的拟合精度越高,相关指数越大,模型的拟合效果越好.40(2018·全国)某医疗机构为了了解肝病与酗酒是否有关,对成年人进行了一次随机抽样抽查,结果如下表:患肝病未患肝病合计酗酒30170200不酗酒20280300合计50450500从直观上你能得到的结论是_,得到患肝病与酗酒有关系的判断有_的把握.【答案】患肝病与酗酒有关系的可能性很大 【详解】分析:通过列联表,
42、利用公式求得,与临界值比较,即可得到结论.详解:由已知数据可求得,由于,所以得到患肝病与酗酒有关系的判断有的把握.故答案为患肝病与酗酒有关系的可能性很大;99.5%.点睛:解决独立性检验应用问题的方法解决一般的独立性检验问题,首先由所给2×2列联表确定a,b,c,d,n的值,然后根据统计量的计算公式确定的值,最后根据所求值确定有多大的把握判定两个变量有关联41(2021·全国高二单元测试)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,计算得到K2_
43、(保留三位小数),所以判定_(填“能”或“不能”)在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系【答案】4.844 能 【详解】根据提供的表格得.所以可以在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系故答案为(1);(2)能.42(2018·全国)对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据计算K2_,能否作出这两种手术对病人又发作心脏病的影响有差别的结论_(填“能”或“不能”)【答案】1779 不能 【详解】根据