1、94 离散型随机变量的分布列、均值与方差离散型随机变量的分布列、均值与方差 【教材梳理】 1离散型随机变量的概念 (1)随机变量 如果随机试验的结果可以用一个随着试验结果变化而变化的变量来表示,那么这样的变 量叫做_,随机变量常用字母 X,Y, , 等表示 (2)离散型随机变量 所有取值可以_的随机变量,称为离散型随机变量 2离散型随机变量的分布列 (1)分布列 设离散型随机变量 X 可能取的不同值为 x1,x2,xi,xn,X 取每一个值 xi(i 1,2,n)的概率 P(Xxi)pi,则称表 X x1 x2 xi xn P p1 p2 pi pn 为随机变量 X 的_,简称为 X 的分布列
2、有时为了简单起见,也可用 P(Xxi)pi,i1,2,n 表示 X 的分布列 (2)分布列的性质 _; _ 3超几何分布 在含有 M 件次品的 N 件产品中,任取 n 件,其中恰有 X 件次品,则事件Xk发生 的概率为_ (k0,1,2,m),其中 mminM,n, 且 nN,MN,n,M,NN*此时称随机变量 X 的分布列为超几何分布列,称随机变 量 X 服从_ 4离散型随机变量的均值 (1)若离散型随机变量 X 的概率分布列为 X x1 x2 xi xn P p1 p2 pi pn 则称 E(X)_为随机变量 X 的均值或数学期望, 它反映了离散型随机变量取值的_ (2)若 YaXb,其中
3、 a,b 为常数,则 Y 也是随机变量,于是 E(Y) _ 5离散型随机变量的方差 (1)若离散型随机变量 X 的概率分布列为 X x1 x2 xi xn P p1 p2 pi pn 则称 D(X)_为随机变量 X 的方差, 其算术平方根_为随机 变量 X 的标准差 (2)D(aXb)_ 方差反映随机变量取值的稳定与波动、集中与离散的程度:D(X)越小,X 取值 越集中,D(X)越大,X 取值越分散 【常用结论】 6关于均值、方差的几个结论 (1)E(k)k,D(k)0,其中 k 为常数; E(X1X2)E(X1)E(X2); 若 X1,X2相互独立,则 E(X1X2)E(X1) E(X2)
4、(2)若 X 服从参数为 N,M,n 的超几何分布,则 E(X)nM N 【自查自纠】 1(1)随机变量 (2)一一列出 2(1)概率分布列 (2)pi0,i1,2,3,n i1 n pi1 3C k MC nk NM Cn N 超几何分布 4(1)x1p1x2p2xipixnpn 平均水平 (2)aE(X)b 5(1) i1 n (xiE(X)2pi D(X) (2)a2D(X) 判断下列命题是否正确,正确的在括号内画“”,错误的画“” (1)离散型随机变量的各个可能值表示的事件是彼此互斥的 ( ) (2)离散型随机变量的概率分布列中,各个概率之和可以小于 1 ( ) (3)均值与方差都是从
5、整体上刻画离散型随机变量的情况,因此它们是一回事 ( ) (4)随机变量的均值是常数,样本的平均值是随机变量 ( ) (5)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越 小,则偏离均值的平均程度越小 ( ) 解:(1); (2); (3); (4); (5) 设某项试验的成功率是失败率的 2 倍,试验一次要么成功要么失败,用随机 变量 X 去描述 1 次试验的成功次数,则 P(X0)等于 ( ) A0 B1 2 C1 3 D 2 3 解: X 可能取值为 0 或 1, 而 P(X1)2P(X0), 且 P(X1)P(X0)1所 以 P(X0)1 3故选 C (2
6、020广东潮州期末)已知随机变量 的分布列是 0 1 2 P 1a 2 1 2 a 2 若均值 E()1,则方差 D() ( ) A1 B1 2 C1 4 D2 解:由 E()01a 2 11 22 a 21,解得 a 1 2, 所以 D()1 4(01) 21 2(11) 21 4(21) 21 2故选 B (2019浙江卷)设 0a1,随机变量 X 的分布列是 X 0 a 1 P 1 3 1 3 1 3 则当 a 在(0,1)内增大时, ( ) AD(X)增大 BD(X)减小 CD(X)先增大后减小 DD(X)先减小后增大 解:由分布列得 E(X)1a 3 , 则 D(X) 1a 3 0
7、2 1 3 1a 3 a 2 1 3 1a 3 1 2 1 3 2 9 a1 2 2 1 6, 则当 a 在(0,1)内增大时,D(X)先减小后增大故选 D 已知 X 的分布列为 X 1 0 1 P 1 2 1 6 a 设 Y2X1,则 Y 的数学期望 E(Y)的值是_ 解:由分布列的性质,a11 2 1 6 1 3, 所以 E(X)11 20 1 61 1 3 1 6, 因此 E(Y)E(2X1)2E(X)12 3故填 2 3 (1)(2020陕西宝鸡中学高三期中)从装有除颜色外没有区别的 3 个黄球、 3 个红球、3 个蓝球的袋中摸 3 个球,设摸出的 3 个球的颜色种数为随机变量 X,
8、则 P(X2) ( ) A 1 28 B 9 28 C 1 14 D 9 14 考点一考点一 离散型随机变量及其分布列离散型随机变量及其分布列 解:“X2”即摸出的 3 个球有 2 种颜色,其中一种颜色的球有 2 个,另一 种颜色的球有 1 个,故 P(X2)C 2 3C 1 2C 2 3C 1 3 C3 9 9 14 另解:P(X1)1P (X1)P(X3)1C 1 3C 1 3C 1 33C 3 3 C3 9 9 14故选 D (2)【多选题】(2021届广东汕头金山中学联考)设随机变量 的分布列为 P k 5 ak(k1,2,3,4,5),则下列说法正确的是 ( ) A15a1 BP(0
9、508)02 CP(0105)02 DP(1)03 解: 由题意可得a2a3a4a5a1, 所以a 1 15, 故15a1, 故A正确; P(0 508) P(06) 1 1530 2,故 B 正确;P(0105)P(02)P(04) 1 15 1 1 152 3 1502,故 C 正确;P(1) 1 15503,故 D 不正确故选 ABC (3)(2020江苏通州高三期中)为抗击疫情,中国人民心连心,向世界展示了 中华民族的团结和伟大,特别是医护工作者被人们尊敬的称为“最美逆行者” , 各地医务工作者主动支援湖北武汉设有 7 名医学专家被随机分配到“雷神 山”“火神山”两家医院 ()求 7
10、名医学专家中恰有两人被分配到“雷神山”医院的概率; ()若要求每家医院至少一人,设 X,Y 分别表示分配到“雷神山”“火神 山”两家医院的人数,记 |XY ,求随机变量 的分布列和数学期望 解:()设“7 名医学专家中恰有两人被分配到雷神山医院”为事件 A, 7 名医学专家被随机分配到“雷神山”“火神山”两家医院,共有 27128 种等可能的基本事件, 其中事件 A 包含 C2 721 种情况, 所以 P(A) 21 128 ()若要求每家医院至少 1 人,共有 272126 种等可能的基本事件, 随机变量 的所有取值为 1,3,5, P(1)C 3 7C 4 7 126 5 9; P(3)C
11、 2 7C 5 7 126 1 3; P(5)C 1 7C 6 7 126 1 9 所以随机变量 的分布列为 X 1 3 5 P 5 9 1 3 1 9 数学期望 E()15 93 1 35 1 9 19 9 【点拨】 研究随机变量的取值,关键是准确理解所定义的随机变量的含 义进行相关计算时,始终牢记离散型随机变量分布列的两个性质:pi0,i 1,2,n 和 i1 n pi1,随时验证计算的准确性随机变量可能取某一区间 内任意值,无法一一列出,则称这样的随机变量为连续型随机变量,如“长江水 位”“灯管寿命”等,正态分布即是一种重要的连续型随机变量的分布,不要与 离散型随机变量混为一谈 (1)一
12、盒中有 12 个乒乓球,其中 9 个新的、3 个旧的,从盒中任取 3 个球来 用,用完后装回盒中,此时盒中旧球个数 X 是一个随机变量,则 P(X4)的值为( ) A 1 220 B 27 55 C 27 220 D 21 55 解: X4表示从盒中取了 2 个旧球, 1 个新球, 故 P(X4)C 2 3C 1 9 C3 12 27 220 故 选 C (2)随机变量 的分布列如下, 其中 a, b, c 成等差数列, 则 P(|1)_, 公差 d 的取值范围是_ 1 0 1 P a b c 解:因为 a,b,c 成等差数列,所以 2bac 又 abc1,所以 b1 3,所以 P(|1)ac
13、 2 3 又 a1 3d,c 1 3d,根据分布列的性质,得 0 1 3d 2 3,0 1 3d 2 3,所以 1 3d 1 3 故填2 3; 1 3, 1 3 (3)(2017天津卷)从甲地到乙地要经过 3 个十字路口,设各路口信号灯工作相互独立, 且在各路口遇到红灯的概率分别为1 2, 1 3, 1 4 ()记 X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量 X 的分布列和数学期 望; ()若有 2 辆车独立地从甲地到乙地,求这 2 辆车共遇到 1 个红灯的概率 解:()随机变量 X 的所有可能取值为 0,1,2,3 P(X0) 11 2 11 3 11 4 1 4, P(X1)1
14、2 11 3 11 4 11 2 1 3 11 4 11 2 11 3 1 4 11 24, P(X2) 11 2 1 3 1 4 1 2 11 3 1 4 1 2 1 3 11 4 1 4, P(X3)1 2 1 3 1 4 1 24 所以,随机变量 X 的分布列为 X 0 1 2 3 P 1 4 11 24 1 4 1 24 随机变量 X 的数学期望 E(X)01 41 11 242 1 43 1 24 13 12 ()设 Y 表示第一辆车遇到红灯的个数,Z 表示第二辆车遇到红灯的个数, 则所求事件的概率为 P(YZ1)P(Y0,Z1)P(Y1,Z0) P(Y0)P(Z1)P(Y1)P(Z
15、0) 1 4 11 24 11 24 1 4 11 48 所以,这 2 辆车共遇到 1 个红灯的概率为11 48 考点二考点二 超几何分布超几何分布 (2020届新疆乌鲁木齐八中月考)为推动乒乓球运动的发展,某乒乓球比赛允许 不同协会的运动员组队参加现有来自甲协会的运动员 3 名,其中种子选手 2 名;乙协 会的运动员 5 名,其中种子选手 3 名从这 8 名运动员中随机选择 4 人参加比赛 (1)设 A 为事件“选出的 4 人中恰有 2 名种子选手, 且这 2 名种子选手来自同一个协 会”,求事件 A 发生的概率; (2)设 X 为选出的 4 人中种子选手的人数,求随机变量 X 的分布列和均
16、值 解:(1)由已知,事件 A 发生的概率 P(A)C 2 2C 2 3C 2 3C 2 3 C4 8 6 35 (2)随机变量 X 的所有可能取值为 1,2,3,4 P(Xk)C k 5C 4k 3 C4 8 (k1,2,3,4) P(X1)C 1 5C 3 3 C4 8 1 14,P(X2) C2 5C 2 3 C4 8 3 7, P(X3)C 3 5C 1 3 C4 8 3 7,P(X4) C4 5C 0 3 C4 8 1 14 所以随机变量 X 的分布列为 X 1 2 3 4 P 1 14 3 7 3 7 1 14 均值 E(X)1 1 142 3 73 3 74 1 14 5 2 【
17、点拨】 超几何分布的概率计算公式从古典概型的角度加以理解更易记忆: P(Xk)C k MC nk NM Cn N , 即恰取了 k 件次品的概率次品中取了k件正品中取了nk件 N件产品中任取n件 当 n 较小,N 较大时,超几何分布的概率计算可以近似地用二项分布来代替也就是 说虽然超几何分布是不放回抽样,二项分布是放回抽样,但是当 n 较小而产品总数 N 很大时,不放回抽样近似于放回抽样超几何分布在计算出均值后,可以用nM N 进行 验证 (2020届北京人大附中6月考)为了解学生自主学习期间完成数学套卷的情况, 一名教师对班 级某一组的所有学生进行了调查,调查结果如下表(每名学生至少完成一套
18、) (1)从该组学生中任选一名男生、一名女生,求这两名学生完成套卷数之和为 4 的概率; (2)若从完成套卷数不少于 4 套的学生中任选 4 人,设选到的男生人数为 X,求随机变量 X 的 分布列和数学期望 解:(1)设事件 A:从该组学生中任选一名男生、一名女生,这两名学生完成套卷数之和为 4, 由题意可知,P(A)1341 128 7 96 (2)完成套卷数不少于 4 本的学生共 8 人,其中男生为 4 人,故 X 的取值为 0,1,2,3,4由题意可 得 P(X0)C 4 4 C4 8 1 70;P(X1) C1 4C 3 4 C4 8 8 35; P(X2)C 2 4C 2 4 C4
19、8 18 35;P(X3) C3 4C 1 4 C4 8 8 35; P(X4)C 4 4 C4 8 1 70 所以随机变量 X 的分布列为 X 0 1 2 3 4 P 1 70 8 35 18 35 8 35 1 70 数学期望 E(X)0 1 701 16 702 36 703 16 704 1 702 考点三考点三 离散型随机变量的均值与方差离散型随机变量的均值与方差 命题角度 1 概念与性质 【多选题】(2020山东高二期末)设离散型随机变量的分布列为 X 0 1 2 3 4 P q 04 01 02 02 若离散型随机变量 Y 满足 Y2X1,则下列结果正确的有 ( ) Aq01 B
20、E(X)2,D(X)14 CE(X)2,D(X)18 DE(Y)5,D(Y)72 解:因为 q040102021,所以 q01,故 A 正确; 又 E(X)0011042013024022, D(X)(02)201(12)204(22)201(32)202(42)2 0218,故 C 正确; 因为 Y2X1,所以 E(Y)2E(X)15,D(Y)4D(X)72,故 D 正确故 选 ACD 【点拨】 计算均值与方差的基本方法: 已知随机变量的概率分布求它 的均值、 方差和标准差, 可直接用定义或公式求; 已知随机变量 X 的均值、 方差,求 X 的线性函数 YaXb 的均值、方差和标准差,可直接
21、用均值及 方差的性质求 (2020辽宁实验中学高三期中)已知随机变量 X 的分布列为 X 0 1 x P 1 2 1 3 p 若 E(X)2 3,则 (1)D(X)_; (2)若 Y3X2,则 D(Y)_ 解:(1)由题意可得1 2 1 3p1,得 p 1 6,又 E(X)0 1 21 1 3x 1 6 2 3, 解得 x2 所以 D(X) 02 3 2 1 2 12 3 2 1 3 22 3 2 1 6 5 9 (2)因为 Y3X2,所以 D(Y)D(3X2)32D(X)95 95 故填(1)5 9;(2)5 命题角度 2 综合运用 (2018全国卷)某工厂的某种产品成箱包装,每箱 200
22、件,每一箱产品在交付用 户之前要对产品作检验,如检验出不合格品,则更换为合格品检验时,先从这箱产品中 任取 20 件作检验, 再根据检验结果决定是否对余下的所有产品作检验, 设每件产品为不合 格品的概率都为 p(0p0;当 p(01,1)时,f(p)400,故应该对余下的产品作检验 【点拨】 利用均值、方差进行决策的方法:均值能够反映随机 变量取值的”平均水平”,因此,当均值不同时,两个随机变量取 值的水平可见分晓,由此可对实际问题作出决策判断;若两个随机 变量均值相同或相差不大,则可通过分析两个变量的方差来研究随 机变量的离散程度或者稳定程度,方差或标准差越小,则偏离均值 的平均程度越小 (
23、2020惠州调研)某种大型医疗检查机器生产商,对一次性购买 2 台机器的客户,推出两种 超过质保期后两年内的延保维修优惠方案: 方案一:交纳延保金 7 000 元,在延保的两年内可免费维修 2 次,超过 2 次每次收取维修费 2 000 元; 方案二: 交纳延保金 10 000 元, 在延保的两年内可免费维修 4 次, 超过 4 次每次收取维修费 1 000 元 某医院准备一次性购买 2 台这种机器现需决策在购买机器时应购买哪种延保方案,为此搜集并 整理了 50 台这种机器超过质保期后延保两年内维修的次数,得下表: 维修次数 0 1 2 3 台数 5 10 20 15 以这 50 台机器维修次
24、数的频率代替 1 台机器维修次数发生的概率记 X 表示这 2 台机器超过质 保期后延保的两年内共需维修的次数 (1)求 X 的分布列; (2)以所需延保金及维修费用的期望值为决策依据,医院选择哪种延保方案更合算? 解:(1) X 所有可能的取值为 0,1,2,3,4,5,6 P(X0) 1 10 1 10 1 100,P(X1) 1 10 1 52 1 25,P(X2) 1 5 1 5 2 5 1 102 3 25, P(X3) 1 10 3 102 1 5 2 52 11 50,P(X4) 2 5 2 5 3 10 1 52 7 25,P(X5) 2 5 3 102 6 25,P(X6) 3
25、 10 3 10 9 100, 所以 X 的分布列为 X 0 1 2 3 4 5 6 P 1 100 1 25 3 25 11 50 7 25 6 25 9 100 (2)选择延保方案一,所需费用 Y1元的分布列为 Y1 7 000 9 000 11 000 13 000 15 000 P 17 100 11 50 7 25 6 25 9 100 E(Y1) 17 1007 000 11 509 000 7 2511 000 6 2513 000 9 10015 00010 720 选择延保方案二,所需费用 Y2元的分布列为: Y2 10 000 11 000 12 000 P 67 100 6 25 9 100 E(Y2) 67 10010 000 6 2511 000 9 10012 00010 420 因为 E(Y1)E(Y2),所以该医院选择延保方案二更合算