8.3列联表与独立性检验 学案(教师版)
《8.3列联表与独立性检验 学案(教师版)》由会员分享,可在线阅读,更多相关《8.3列联表与独立性检验 学案(教师版)(38页珍藏版)》请在七七文库上搜索。
1、8.3列联表与独立性检验【知识点梳理】1分类变量这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示222列联表在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为22列联表,22列联表给出了成对分类变量数据的交叉分类频数一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其22列联表为y1y2合计x1ababx2cdcd合计acbdabcd3.等高堆积条形图等高条形图和
2、表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果4.临界值2 统计量也可以用来作相关性的度量2 越小说明变量之间越独立,2越大说明变量之间越相关2.忽略2的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数x,使得P(2x)成立我们称x为的临界值,这个临界值就可作为判断2大小的标准5独立性检验基于小概率值的检验规则是:当2x时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当2x时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立这种利用2的取值推断分类变量X和Y
3、是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验(test of independence)下表给出了2独立性检验中几个常用的小概率值和相应的临界值0.10.050.010.0050.001x2.7063.8416.6357.87910.8286.应用独立性检验解决实际问题的大致步骤(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;(2)根据抽样数据整理出22列联表,计算2的值,并与临界值x比较;(3)根据检验规则得出推断结论;(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律【典型例题】题型一用22列联表分析两分类变量间的关系例
4、1(2022全国高三专题练习)下面是22列联表:y1y2总计x1a2173x2222547总计b46120则表中a,b的值分别为()A94,72B52,50C52,74D74,52【答案】C【解析】【详解】a+21=73,a=52,又a+22=b,b=74.规律方法(1)作22列联表时,关键是对涉及的变量分清类别计算时要准确无误(2)利用22列联表分析两个分类变量间的关系时,首先要根据题中数据获得22列联表,然后根据频率特征,即将与 的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣例2(2021全国高二单元测试)假设有两个分类变量与的列联表如下表:对于以下数据,对同一样本能说明与
5、有关系的可能性最大的一组为()A,B,C,D,【答案】D【解析】【分析】计算每个选项中的,比较大小后可得出结论.【详解】对于两个分类变量与而言,的值越大,说明与有关系的可能性最大,对于A选项,对于B选项,对于C选项,对于D选项,显然D中最大,故选:D.例3(2019福建厦门双十中学高二阶段练习(理)在一次独立性检验中,得出列联表如图:且最后发现,两个分类变量A和B没有任何关系,则a的可能值是()A合计B2008001000180a180+a合计380800+a1180+aA200B720C100D180【答案】B【解析】【分析】把列联表中所给的数据代入求观测值的公式,建立不等式,代入验证可知a
6、的可能值.【详解】解:因为两个分类变量A和B没有任何关系,所以 ,代入验证可知 .故选:B.【点睛】本题考查两个变量之间的有关或无关的精确的可信程度,只有利用独立性检验的有关计算,才能做出判断.题型二用等高堆积条形图分析两分类变量间的关系例4(2021全国高二课时练习)下面的等高条形图可以说明的问题是()A“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C此等高条形图看不出两种手术有什么不同的地方D“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有的把握【答案】D【解析
7、】【分析】根据等高条形图判断即可得正确答案.【详解】由等高条形图可知“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的频率不同,所以“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有的把握,所以选项D正确,故选:D.例5(2022全国高三专题练习)观察下列各图,其中两个分类变量x,y之间关系最强的是()ABCD【答案】D【解析】【分析】由等高条形图的定义和性质依次分析,即得解【详解】观察等高条形图发现与相差很大,就判断两个分类变量之量关系最强故选:D例6(2022四川绵阳二模(理)第24届冬季奥林匹克运动会将于2022年在北京举办,为了解某城市居民对冰雪运
8、动的关注情况,随机抽取了该市100人进行调查统计,得到如下列联表: 关注冰雪运动不关注冰雪运动合计男451055女252045合计7030100下列说法正确的是()参考公式:,其中附表:0.1000.0500.0100.0012.7063.8416.63510.828A有99%以上的把握认为“关注冰雪运动与性别有关”B有99%以上的把握认为“关注冰雪运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“关注冰雪运动与性别无关”D在犯错误的概率不超过0.1%的前提下,认为“关注冰雪运动与性别有关”【答案】A【解析】【分析】根据给定数据及参考公式计算的观测值,再与临界值表比对判断作答.【详
9、解】依题意,的观测值为,所以有99%以上的把握认为“关注冰雪运动与性别有关”,A正确,B不正确;而犯错误的概率不超过1%,不能确定犯错误的概率不超过0.1%的情况,C,D不正确.故选:A题型三有关“相关的检验”例7(2022全国高二)微信和是中国最受欢迎的两个即时通讯软件,作为具有同样功能的软件,二者的业务不可避免地重叠,但是从大众分析调查来看,二者的受众人群有着一些小区别.某机构用简单随机抽样方法调查了100位社区网络员手机即时通讯软件的使用情况,结果如下表,35岁以上35岁以下总计微信452065132235总计5842100附:,0.0500.0100.0013.8416.63510.8
10、28则下列结论正确的是()A在犯错误的概率不超过0.1%的前提下,认为“使用即时通讯工具与年龄有关”B在犯错误的概率不超过0.1%的前提下,认为“使用即时通讯工具与年龄无关”C有99%以上的把握认为“使用即时通讯工具与年龄有关”D有99%以上的把握认为“使用即时通讯工具与年龄无关”【答案】C【解析】【分析】由列联表计算后可得结论【详解】因为,所以有99%以上的把握认为“使用即时通讯工具与年龄有关”,故选:C.规律方法独立性检验的具体做法根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界,然后查表确定临界值x.利用公式2计算2.如果2x,则“X与Y有关系”这种推断犯错误的概率
11、不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”(多选题)例8(2022全国高三专题练习)针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有()附表:0.0500.0103.8416.635附:ABCD【答案】BC【解析】【分析】设男生的人数为,根据题意列出列联表,求得值,根据有的把握认为是否喜欢抖音和性别有关求得n的范围即可.【详解】
12、设男生的人数为,根据题意列出列联表如下表所示:男生女生合计喜欢抖音4n3n7n不喜欢抖音n2n3n合计5n5n10n则,由于有的把握认为是否喜欢抖音和性别有关,则,即,得,则n的可能取值有9,10,11,12,因此,调查人数中男生人数的可能值为45或60,故选:BC.例9(2022浙江模拟预测)某视频上传者为确定下一段时间的视频制作方向,在动态中发布投票,投票主题为“你希望我接下来更新哪个方向的视频”,共计人参与此投票,投票结果如下图所示(每位关注者仅选一项)其中,投票游戏、动漫、生活的关注者之比为(1)求参与投票的关注者的性别比;(2)以游戏与生活两个方向为例,依据小概率值的独立性检验,判断
13、性别与关注者喜欢视频上传者上传视频的类型是否有关注:;临界值,【答案】(1);(2)可以认为性别与关注者喜欢视频上传者上传视频的类型有关.【解析】【分析】(1)计算出男性关注者和女性关注者的比例,即可得解;(2)计算出选择游戏、生活的男性和女性关注着的人数,可得出列联表,计算出的观测值,结合临界值可得出结论.(1)解:根据统计图,男性关注者占比为,女性关注者占比为,男女性别比为(2)解:根据统计图计算可得,选择游戏的关注者中,男性关注者的人数为人,女性关注者的人数为人;选择生活的关注者中,男性关注者的人数为人,女性关注者的人数为人零假设性别对关注者喜欢视频上传者上传视频的类型有关由计算的数据可
14、以得到下面的列联表:男性关注者人数女性关注者人数游戏生活的观测值,因此可以认为性别与关注者喜欢视频上传者上传视频的类型有关题型四有关“无关的检验”例10(2022湖南高二课时练习)某工厂冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,该工厂进行了一项调查,结果如下表所示:杂质高杂质低旧设备37121新设备22202试根据以上数据判断含杂质的高低与设备改造有无关系【答案】有的把握认为含杂质的高低与设备改造有关,理由见解析.【解析】【分析】根据题目条件得到列联表,再计算卡方,进而得到结论.【详解】由已知数据得到如下列联表:杂质高杂质低合计旧设备371211
15、58新设备22202224合计59323382则,所以有的把握认为含杂质的高低与设备改造有关.规律方法独立性检验的关注点在22列联表中,如果两个分类变量没有关系,则应满足adbc0,因此|adbc|越小,关系越弱;|adbc|越大,关系越强例11(2022湖南高二课时练习)某企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了72名员工进行调查,所得数据如下表所示:积极支持企业改革不太赞成企业改革合计工作积极性高28836工作积极性一般162036合计442872对于人力资源部研究的问题,根据上述数据你能得出什么结论?【答案】企业的全体员工对待企业改革的态度与其工作积极
16、性有关,理由见解析.【解析】【分析】求出卡方,得到结论.【详解】,故有的把握认为抽样员工对待企业改革的态度与工作积极性有关,从而认为企业的全体员工对待企业改革的态度与其工作积极性有关.例12(2022全国高二课时练习)某县有甲、乙两所规范化学校,教育主管部门为了检验两校九年级学生的数学水平,从甲、乙两校的九年级学生中,分别随机抽取55人和45人(各占全校九年级学生总数的15%)进行统一试题的数学测验测验结果如下表(单位:人):及格情况学校及格不及格甲校478乙校3015试问:甲、乙两校九年级学生的数学成绩的差异是否显著?【答案】有以上的把握认为甲、乙两校九年级学生的数学成绩的差异显著【解析】【
17、分析】根据列联表,求得,即可判断.【详解】由题可得,其列联表如下所示:及格情况学校及格不及格合计甲校47855乙校301545合计7723100故可得,且,故有以上的把握认为甲、乙两校九年级学生的数学成绩的差异显著.题型五独立性检验的综合应用例13(2022四川省绵阳南山中学高二开学考试)学校为了在全校营造“浪费可耻、节约为荣”的氛围,制定施行“光盘行动”有关政策,为进一步了解此项政策对同学的影响程度,政教处在全校随机抽取了100名同学进行调查,其中男生与女生的人数之比为3:2,男生中有10人表示政策无效,女生中有25人表示政策有效.(1)根据下列列联表写出a和b的值,并判断能否有99%的把握
18、认为“政策是否有效与性别有关”;政策有效政策无效总计男生a10女生25b合计100(2)从被调查的同学中,采取分层抽样方法抽取5名同学,再从这5名同学中任意抽取2名,对政策的有效性进行调研分析,求抽取到的2名同学中既有男生又有女生的概率.参考公式:,其中.0.150.100.050.0250.0100.0050.001k2.0722.7063.8425.0246.6357.87910.828【答案】(1),没有把握(2)【解析】【分析】(1)先利用男女生的比例得到男女生的人数,补全列联表,利用公式求值,再利用临界值表进行判定;(2)先利用分层抽样得到男女生抽取的人数,再列举出所有基本事件和满足
19、条件的基本事件,利用古典概型的概率公式进行求解.(1)解:由题意知,男生人数为,女生人数为,由此填写列联表如下:政策有效政策无效总计男生501060女生251540合计7525100可知,由表中数据,得所以没有99%的把握认为对“政策是否有效与性别有关”;(2)解:利用分层抽样抽取5名同学中,男生抽取3人,女生抽取2人.设既有男生又有女生为事件A,3名男生编号为1,2,3,2名女生编号为a,b,所有的基本事件有10个:,其中事件A包含的基本事件有共6个:,;由古典概型的概率公式,得, 即抽取到的2名同学中既有男生又有女生的概率为.规律方法(1)解答此类题目的关键在于正确利用2计算2的值,再用它
20、与临界值x的大小作比较来判断假设检验是否成立,从而使问题得到解决(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握例14(2022河南民权县第一高级中学高三阶段练习(理)晨跑是不少青年爱好者锻炼身体的一种运动方式,某机构随机抽取了某社区200名青年进行问卷调查,其中男性与女性的人数比为3:2,得到如下的列联表,喜欢晨跑不喜欢晨跑合计男性40女性合计现从这200名青年中按性别用分层抽样的方法随机抽取20人,其中喜欢晨跑的女性有5人.(1)完成表中数据并判断是否有90%的把握认为喜欢晨跑与性别有关;(2)从上述样本中不喜欢晨跑的青年中用分层抽样的方法任取7
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 8.3列联表与独立性检验 学案教师版 8.3 列联表 独立性 检验 教师版
链接地址:https://www.77wenku.com/p-231427.html