1、 概率统计中的数学建模与数据分析 授课提示:对应学生用书第 251 页 概率统计中的创新性问题是高考的命题重点,不仅注重模块知识内的综合,也注重模块知识 间的综合,更多地体现对数学建模与数据分析核心素养的考查命题的重点有: (1)考查数学建模核心素养,以实际生活中的环保、民生、科技等为背景,考查函数、数列 等模型的建立,其中求解这些实际问题的最优化是近年高考命题的热点 (2)考查数据分析核心素养,常考查对数据的搜集与归类,并利用不同的特征值对研究对象 做出理性的判断 (一)概率与数列交汇问题 例 1 (2021 湖北武汉质量监测)武汉又称江城,是湖北省省会,它不仅有着深厚的历史积 淀与丰富的民
2、俗文化,更有着众多名胜古迹与旅游景点,黄鹤楼与东湖便是其中的两个为 合理配置旅游资源,现对已参观黄鹤楼景点的游客进行随机问卷调查,若不游玩东湖记 1 分, 若继续游玩东湖记 2 分,每位游客选择是否参观东湖的概率均为1 2,游客之间选择意愿相互独 立 (1)从游客中随机抽取 3 人,记这 3 人的总得分为随机变量 X,求 X 的分布列与数学期望; (2) ()若从游客中随机抽取 m(mN)人,记这 m 人的总分恰为 m 分的概率为 Am,求 数列Am的前 10 项和; ()在对所有游客进行随机问卷调查的过程中,记已调查过的人的累计得分恰为 n 分的概 率为 Bn,探讨 Bn与 Bn1(n2)之
3、间的关系,并求数列Bn的通项公式 解析 (1)X 的所有可能取值为 3,4,5,6 P(X3) 1 2 3 1 8,P(X4)C 2 3 1 2 3 3 8,P(X5)C 2 3 1 2 3 3 8,P(X6) 1 2 3 1 8 所以 X 的分布列为 X 3 4 5 6 P 1 8 3 8 3 8 1 8 所以 EX31 84 3 85 3 86 1 8 9 2 (2) ()总分恰为 m 分的概率 Am 1 2 m , 所以数列Am是首项为1 2,公比为 1 2的等比数列 其前 10 项和 S10 1 2 1 1 210 11 2 1 023 1 024 ()因为已调查过的人的累计得分恰为
4、n 分的概率为 Bn,得不到 n 分的情况只有先得(n 1)分,再得 2 分,概率为1 2Bn1(n2) 所以 1Bn1 2Bn1(n2) ,即 Bn 1 2Bn11(n2) , 所以 Bn2 3 1 2 Bn12 3 (n2) , 所以 Bn2 3 B12 3 1 2 n1 ,易知 B11 2, 所以 Bn2 3 1 6 1 2 n1 2 3 1 3 1 2 n 2 3 (1)n 32n 破解此题的关键:一是认真审题,判断随机变量的所有可能取值,并注意相互独立事件的概 率与互斥事件的概率的区别,求出随机变量取各个值时的概率,从而列出随机变量的分布列; 二是将概率的参数表达式与数列的递推式相结
5、合,可得数列的通项公式,此种解法新颖独特 (二)函数与期望相交汇应用 例 2 (2021 重庆一中模拟)某蛋糕店制作并销售一款蛋糕,制作一个蛋糕成本 3 元,且以 8 元的价格出售, 若当天卖不完, 剩下的无偿捐献给饲料加工厂 根据以往 100 天的资料统计, 得到如下需求量表 该蛋糕店一天制作了这款蛋糕 X (XN) 个, 以 x (单位: 个, 100 x150, xN)表示当天的市场需求量,T(单位:元)表示当天出售这款蛋糕获得的利润 需求量 /个 100,110) 110,120) 120,130) 130,140) 140,150 天数 15 25 30 20 10 (1)当 x13
6、5 时,若 X130 时该蛋糕店获得的利润为 T1,X140 时该蛋糕店获得的利润 为 T2,试比较 T1和 T2的大小 (2)当 X130 时,根据上表,从利润 T 不少于 570 元的天数中,按需求量用分层抽样的方 法抽取 6 天 ()求此时利润 T 关于市场需求量 x 的函数解析式,并求这 6 天中利润为 650 元的天数; ()再从这 6 天中抽取 3 天做进一步分析,设这 3 天中利润为 650 元的天数为 ,求随机变 量 的分布列及数学期望 解析 (1)当 X130 时,T1130(83)650(元) ; 当 X140 时,T2135535660(元) 所以 T2T1 (2) ()
7、当 X130 时, 利润 T 8x390,100 x130, 650,130 x150, 令 T570,得 120 x150, 所以利润 T 不少于 570 元的共有 60 天,其中有 30 天的利润为 650 元 故按需求量用分层抽样的方法抽取的 6 天中利润为 650 元的天数为 61 23 ()由题意可知 0,1,2,3, P(0)C 3 3 C36 1 20,P(1) C23C13 C36 9 20,P(2) C13C23 C36 9 20,P(3) C33 C36 1 20 故 的分布列为 0 1 2 3 P 1 20 9 20 9 20 1 20 所以 E0 1 201 9 202
8、 9 203 1 20 3 2 破解此题的关键: 一是要注意分类讨论、明确分类标准 二是注意数据分析与处理 (三)概率与统计的开放性问题 例 3 (2021 郑州一测) 水污染情况与工业废水排放密切相关, 某工厂污水处理程序如下 原 始污水必须先经过 A 系统处理,处理后的污水(A 级水)达到环保标准(简称达标)的概率为 p(0p1) ,A 级水经化验后,若确认达标便可直接排放,若不达标则必须通过 B 系统处理 后再排放该厂现有 4 个标准水量的 A 级水池,需要分别取样、化验已知多个污水样本化 验时,既可以逐个化验,也可以将若干个样本混合在一起化验混合样本中只要有样本不达 标,则混合样本的化
9、验结果必不达标若混合样本不达标,则该组中各个样本必须再逐个化 验;若混合样本达标,则原水池的污水可直接排放 现有以下四种化验方案 方案一:逐个化验 方案二:平均分成两组,每组的两个样本混在一起化验 方案三:三个样本混在一起化验,剩下的一个单独化验 方案四:四个样本混在一起化验 化验次数的期望值越小,则方案越“优” (1)若 p2 2 3 ,求将 2 个 A 级水样本混合化验,结果不达标的概率; (2) ()若 p2 2 3 ,现有 4 个 A 级水样本需要化验,请问方案一、二、四中哪个最“优”? ()化验 4 个 A 级水样本,若方案三比方案四更“优”,求 p 的取值范围 解析 (1)该混合样
10、本达标的概率是 2 2 3 2 8 9, 所以不达标的概率为 18 9 1 9 (2) ()方案一:逐个化验,化验次数14 方案二:由(1)知,分成的每组的两个样本化验时,若达标,则化验次数为 1,概率为8 9,若 不达标,则化验次数为 3,概率为1 9记方案二的化验次数为 2,则 2的可能取值为 2,4,6 列出其分布列如下 2 2 4 6 P 64 81 16 81 1 81 可求得方案二的期望为 E2264 814 16 816 1 81 198 81 22 9 方案四:混在一起化验,记化验次数为 4,则 4的可能取值为 1,5 列出其分布列如下 4 1 5 P 64 81 17 81
11、可求得方案四的期望为 E4164 815 17 81 149 81 比较可得 E4E24,故选择方案四最“优” ()方案三:设化验次数为 3,则 3的可能取值为 2,5 列出 3的分布列如下 3 2 5 P p3 1p3 E32p35(1p3)53p3 方案四:设化验次数为 4,则 4的可能取值为 1,5 列出 4的分布列如下 4 1 5 P p4 1p4 E4p45(1p4)54p4 由题意得 E3E4,故 53p354p4,解得 p3 4 故当 0p3 4时,方案三比方案四更“优” 求解此题时易出现的问题有两个:一是不能根据事件性质正确建立目标代数式;二是不能根 据题意分析交换顺序对数学期
12、望的影响,从而无法根据三个概率的大小关系比较数学期望的 大小 对点训练 (2021 鄂东南九校期中联考)世界军人运动会,简称“军运会”,是国际军事体育理事会主 办的全球军人最高规格的大型综合性运动会,每四年举办一届,会期 7 至 10 天,规模仅次于 奥运会,是和平时期各国军队展示实力形象、增进友好交流、扩大国际影响的重要平台,被 誉为“军人奥运会” 第七届世界军人运动会于 2019 年 10 月 18 日至 2019 年 10 月 27 日在中 国武汉举行,赛期 10 天,共设置射击、游泳、田径、篮球等 27 个大项、329 个小项其中, 空军五项、军事五项、海军五项、定向越野和跳伞五个项目
13、为军事特色项目,其他项目为奥 运项目现对某国军人在射击比赛预赛中的得分数据进行分析,得到如图所示的频率分布直 方图 (得分均在 180 到 430 内) (1)估计该国军人在射击比赛预赛中得分的平均数x (同一组中的数据用该组区间的中点值 作代表) ; (2)根据大量的射击比赛得分,可以认为射击比赛得分 x 近似地服从正态分布 N(,2) , 若第(1)问中样本的标准差 s 的近似值为 50,用样本的平均数x 作为 的近似值,用样本的 标准差 s 作为 的估计值,求射击比赛得分 x 恰在 350 到 400 内的概率; 参考数据:若随机变量 服从正态分布 N(,2) ,则 P()0682 7,
14、P( 22)0954 5,P(33)0997 3 (3)某汽车销售公司在军运会期间推广一款新能源汽车,面向客户推出“玩游戏,送大奖” 活动,客户可根据抛掷骰子的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜 利大本营”,则可获得购车优惠券已知骰子出现点数 1,2,3,4,5,6 的概率都是1 6,方 格图上标有第 0 格,第 1 格,第 2 格,第 50 格,遥控车开始在第 0 格,客户每抛掷一次 骰子,遥控车向前移动一次,若抛掷出的骰子正面向上的点数是 1,2,3,4,5,遥控车向前 移动一格(从 k 到 k1) ,若抛掷出的骰子正面向上的点数是 6,遥控车向前移动两格(从 k 到
15、 k2) , 直到遥控车移动到第 49 格 (胜利大本营) 或第 50 格 (失败大本营) 时, 游戏结束 设 遥控车移动到第 n 格的概率为 pn,试证明pnpn1(1n49,nN)是等比数列,并求 出 p50,再根据 p50的值解释这种游戏方案对意向客户是否具有吸引力 解析: (1)x 000250205000450255000950305000450355 000150405300,故估计该国军人在射击比赛预赛中得分的平均数为 300 (2)因为 xN(300,502) ,所以 P(350 x400)1 2(0954 50682 7)0135 9 (3)遥控车开始在第 0 格为必然事件,
16、故 p01第一次抛掷骰子,若正面向上不出现 6 点, 则遥控车移动到第 1 格,概率为5 6,即 p1 5 6遥控车移动到第 n(2n49,nN)格的情 况只有如下两种:遥控车先移动到第 n2 格,再抛掷骰子,出现正面向上的点数为 6,概 率为1 6pn2;遥控车先移动到第 n1 格,抛掷骰子,出现正面向上的点数不是 6,概率为 5 6pn 1因此 pn1 6pn2 5 6pn1,则 pnpn1 1 6(pn1pn2) ,故当 1n49 时,pnpn1是 首项为 p1p01 6,公比为 1 6的等比数列,故 pnpn1 1 6 n 因为 pnp0(p1p0)(p2p1)(pnpn1)1 1 6 1 1 6 2 1 6 n 1 1 6 n1 1 1 6 6 7 1 1 6 n1 ,p501 6p48 1 6 6 7 1 1 6 49 1 7 1 1 6 49 易知 p501 2,p491p50 1 2,故这种游戏方案使得参与客户中奖的可能性较大,对意向客户 有吸引力