专题3.2 独立性检验的基本思想及其初步应用-20届高中数学同步讲义(理)人教版(选修2-3)
《专题3.2 独立性检验的基本思想及其初步应用-20届高中数学同步讲义(理)人教版(选修2-3)》由会员分享,可在线阅读,更多相关《专题3.2 独立性检验的基本思想及其初步应用-20届高中数学同步讲义(理)人教版(选修2-3)(23页珍藏版)》请在七七文库上搜索。
1、3.2 独立性检验的基本思想及其初步应用1分类变量和列联表(1)分类变量:变量的不同“值”表示个体所属的_,像这样的变量称为分类变量(2)列联表:定义:列出的两个分类变量的_称为列联表22列联表一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为总计总计从列表中,依据与的值可直观得出结论:两个变量是否有关系2等高条形图(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否_,常用等高条形图表示列联表数据的_(2)观察等高条形图发现_和_相差很大,就判断两个分类变量之间有关系3独立性检验(1)定义:利用随机变量来判断“两个分类变量
2、有关系”的方法称为独立性检验(2)公式:,其中_为样本容量(3)独立性检验的具体步骤确定,根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定_;计算的观测值,利用公式计算随机变量的观测值为_;下结论,如果_,就推断“与有关系”,这种推断_不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中_支持结论“与有关系”学-科网K知识参考答案:1(1)不同类别(2)频数表2(1)相互影响频率特征(2)3(2)(3)临界值观测值犯错误的概率没有发现足够证据K重点了解分类变量的意义,会列出的列联表,会计算,并理解其意义K难点了解实际推理
3、和假设检验的基本思想K易错思维不清易出错,错把统计当确定列联表和等高条形图的应用某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系【答案】见解析【解析】作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比
4、例高,可以认为考前紧张与性格类型有关【名师点睛】(1)判断两个分类变量是否有关系的两种常用方法:利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法;一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大(2)利用等高条形图判断两个分类变量是否相关的步骤:独立性检验某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多总数喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总数262450则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为0.500.400.250.150.100.050.0250.0100.0050.
5、0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828A99%B97.5%C95%D无充分依据【答案】B【解析】由表中数据得的观测值,所以约有97.5%的把握认为两变量之间有关系故选B 某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法
6、分析:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由?参考公式及数据:,其中为样本容量0.0500.0100.0013.8416.63510.828【答案】(1),;(2)有99.9%的把握说学习积极性与对待班级工作的态度有关系【解析】(1)积极参加班级工作的学生有24人,总人数为50人概率为;不太主动参加班级工作且学习积极性一般的学生有19人,概率为(2)由表中数据可得,所以有99.9%的把握说学习积极性与对待班级工作的态度有关系【名师点睛】独立性检验的步骤如下:第一步,确定分类变量,获取样本频数,得到列联表第二步,根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的
7、上界,然后查表确定临界值第三步,利用公式计算随机变量的观测值第四步,作出判断如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”思维不清易出错,错把统计当确定试分析下列说法正确与否:在用独立性检验的方法检验某单位招聘行政工作人员和技术工作人员所招聘的男女人数时,得到了的观测值为,这就证明该单位在两类工作岗位上的招聘中一定存在性别歧视【错解】这种说法都是正确的【错因分析】统计思维得出的结论是带有随机性的、不能完全确定的结论错解中依据确定性思维对统计计算的结果给出了错误的解
8、释【正解】说法错误根据独立性检验,当的观测值为时,有95%的把握认为该单位在两类工作岗位上的招聘中存在性别歧视,即该单位在招聘工作中存在性别歧视的嫌疑很大,概率高达95%,即使是这样也不能100%肯定该单位在招聘工作中存在性别歧视学+科网另一方面,由于男女在选择工作岗位上的心理不同,也会造成各个岗位招聘男女人数的差异,导致计算的的观测值过大,因此,单纯从这个计算结果不能得出该单位在两类工作岗位上的招聘中一定存在性别歧视的结论1下列关于K2的说法正确的是AK2在任何相互独立问题中都可以用来检验是有关还是无关BK2的值越大,两个事件的相关性就越大CK2是用来判断两个分类变量是否有关系的随机变量,只
9、对于两个分类变量适合DK2的观测值k的计算公式为2如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出A性别与喜欢理科无关B女生中喜欢理科的比为80%C男生比女生喜欢理科的可能性大些D男生不喜欢理科的比为60%3假设有两个分类变量X和Y,它们的值分别为x1,x2和y1,y2,其列联表如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d对同一样本,以下数据能说明X与Y有关的可能性最大的一组为Aa=5,b=4,c=3,d=2Ba=5,b=3,c=4,d=2Ca=2,b=3,c=4,d=5Da=3,b=2,c=4,d=54在吸烟与患肺癌这
10、两个分类变量的独立性检验的计算中,下列说法正确的是A若K2的观测值为k=6.635,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌B由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌C从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误D以上三种说法都不正确5为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032
11、课外阅读量一般82028总计303060则下说法正确的是A在样本数据中没有发现足够证据支持结论“作文成绩优秀与课外阅读量大有关”B在犯错误的概率不超过0.001的前提下认为“作文成绩优秀与课外阅读量大有关”C在犯错误的概率不超过0.05的前提下认为“作文成绩优秀与课外阅读量大有关”D在犯错误的概率不超过0.005的前提下认为“作文成绩优秀与课外阅读量大有关”6通过随机询问110名性别不同的大学生是否爱好排球运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由算得k7.8附表:P(K2k)0.0500.0100.001k3.8416.63510.828参照附表,
12、得到的正确结论是A在犯错误的概率不超过0.01的前提下,认为“爱好排球运动与性别有关”B在犯错误的概率不超过0.01的前提下,认为“爱好排球运动与性别无关”C在犯错误的概率不超过0.001的前提下,认为“爱好排球运动与性别有关”D在犯错误的概率不超过0.001的前提下,认为“爱好排球运动与性别无关”7若由一个22列联表中的数据计算得k4.013,那么在犯错误的概率不超过_的前提下认为两个变量之间有关系8利用独立性检验来考虑两个分类变量与是否有关系时,通过查阅下表来确定“与有关系”的可信度如果,那么就有把握认为“与有关系”的百分比为_0.500.400.250.150.100.050.0250.
13、0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.8289某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众与年龄_(填“有关”或“无关”)10某校对学生课外活动进行调查,结果整理成下表:体育文娱合计男生212344女生62935合计275279运用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关
14、系”?参考公式和数据:11为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:男女需要4030不需要160270(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?参考公式和数据:12调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人(1)将列联表补充完整;出生时间总计晚上白天男婴女婴总计(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 专题
链接地址:https://www.77wenku.com/p-90297.html