随机变量及其分布¶
约 1847 个字 预计阅读时间 9 分钟
随机变量¶
设随机试验的样本空间为 \(S={e}\) ,若 \(X=X(e)\) 为定义在样本空间 \(S\) 上的实值单值函数,则称 \(X=X(e)\) 为随机变量。
实值单值函数
指自变量x和函数y都在实数范围内取值,且对于每个x,均有唯一确定的y和它对应的函数
常见的两类随机变量分别为离散型随机变量和连续型随机变量
离散型随机变量¶
取值至多可数的随机变量称为离散型随机变量,其概率分布(分布律)为:
X | \(x_1\) | \(x_2\) | ... | \(x_i\) | ... |
---|---|---|---|---|---|
P | \(p_1\) | \(p_2\) | ... | \(p_i\) | ... |
例 1:
某人上学路上要经过三个红绿灯,每次到路口时为红灯的概率为 \(p\) ,以 \(X\) 表示首次停车时所通过的红绿灯数,求其概率分布律:
X | 0 | 1 | 2 | 3 |
---|---|---|---|---|
P | \(p\) | \(p(1-p)\) | \(p(1-p)^2\) | \((1-p)^3\) |
例 2:
若随机变量 \(X\) 的概率分布律为
求常数 c:
0-1 分布¶
若随机变量 \(X\) 的分布律为:
X | 0 | 1 |
---|---|---|
P | \(1-p\) | \(p\) |
则称 \(X\) 服从参数为 \(p\) 的 0-1 分布(两点分布),记为 \(X\sim 0-1(p)\) 或 \(B(1,p)\)
它的分布律也可以写作:
对于一个样本空间仅含两个元素的随机事件 \(S=\{e_1, e_2\}\) ,我们总能在 \(S\) 上定义一个服从 0-1 分布的随机变量来描述这个随机试验的结果:
二项分布¶
设试验 \(E\) 只有两种可能的结果:\(A\) 和 \(\overline{A}\) ,\(p(A)=p\) ,将试验 \(E\) 独立地重复进行 n 次,则称这一串重复的独立试验为 n重贝努利试验
设 \(A\) 在n重贝努利试验中发生 \(X\) 次,则其分布律为:
则称 \(X\) 服从参数为 \(p\) 的二项分布,记为 \(X\sim B(n,p)\)
泊松分布¶
设随机变量 \(X\) 的概率分布律为:
则称 \(X\) 服从参数为 \(\lambda\) 的泊松分布,记为 \(X=P(\lambda)\)
超几何分布¶
若随机变量 \(X\) 的概率分布律为:
其中 \(l_1 = \max (0,n-b),\ l_2=min(a,n)\) 。则称随机变量 \(X\) 服从超几何分布
例子
一袋中有 a 个白球,b 个红球,a+b=N。从中不放回地取 n 个球,设每次取到各球的概率相等,以 \(X\) 表示取到的白球数,则 \(X\) 服从超几何分布。
几何分布¶
若随机变量 \(X\) 的概率分布律为:
则称随机变量 \(X\) 服从参数 \(p\) 的几何分布
巴斯卡分布¶
若随机变量 \(X\) 的概率分布律为:
则称随机变量 \(X\) 服从参数为 \((r,p)\) 的巴斯卡分布
连续型随机变量¶
对于随机变量 \(X\) 的分布函数 \(F(x)\) ,若存在非负的函数 \(f(x)\) 使得对于任意实数 \(x\) 都有:
则称 \(X\) 为连续性随机变量。其中 \(f(x)\) 为随机变量 \(X\) 的概率密度函数,简称 密度函数 ,其有如下性质:
(1)\(f(x)\ge 0\)
(2)\(\int _{-\infty} ^{+\infty} f(x)dx=1\)
(3)对任意实数 \(x_1,x _2( x_2\gt x_1)\) ,有 \(P\{x_1 \lt X\le x_2\}= \int _{x_1} ^{x_2}f(x)dx\)
(4)在连续点,\(F'(x)=f(x)\)
概率为零不一定为不可能事件
均匀分布¶
设随机变量 \(X\) 具有概率密度函数:
则称随机变量 \(X\) 在区间 \((a,b)\) 上服从均匀分布,记为 \(X\sim U(a,b)\)
指数分布¶
设随机变量 \(X\) 具有概率密度函数:
其中 \(\lambda \gt 0\) 为常数,则称随机变量 \(X\) 服从参数为 \(\lambda\) 的指数分布,记为 \(X\sim Exp(\lambda)\) 或 \(X\sim E(\lambda)\)
根据定义可得指数分布的分布函数为:
需要特别注意,指数分布的 \(X\) 具有以下 无记忆性
如果 \(X\) 表示等待时间,那么无记忆性表明只要还没等到,剩余等待时间仍然服从参数为 \(\lambda\) 的指数分布;
如果 \(X\) 表示元件寿命,那么无记忆性表明只要还没坏掉,剩余元件寿命仍然服从参数为 \(\lambda\) 的指数分布。
正态分布¶
设随机变量 \(X\) 具有概率密度函数:
其中 \(-\infty \lt \mu\lt \infty,\ \sigma \gt 0\) 为常数,则称随机变量 \(X\) 服从参数为 \(\mu,\sigma\) 的正态分布(Gauss分布),记为 \(X\sim N(\mu,\sigma^2)\)
在自然现象和社会现象中,大量随机变量服从或近似服从正态分布
傻逼浙大正态分布
随机变量的概率分布函数¶
随机变量 \(X\) ,若对任意实数 \(x\) ,函数 \(F(x)=P(X\le x)\) ,称其为 \(X\) 的分布函数。
- (1)\(0\le F(x)\le 1\)
- (2)\(F(x)\) 单调不减,且 \(F(-\infty) =0,F(+\infty)=1\)
- \(P(x_1\lt X\le x_2)= F(x_2) -F(x_1)\)
- (3)\(F(x)\) 右连续,即 \(F(x+0)=F(x)\)
- (4)\(P(X=x)=F(x)-F(x-0)\)
一般的,设离散型随机变量的分布律为 \(P(X=x_k)= p_k\) ,由概率的可列可加性得 \(X\) 的分布函数为:
分布函数在 \(x=x_k\) 处均有跳跃,跳跃值为 \(p_k=P(X= x_k)\)
随机变量函数的分布¶
在实际问题中,我们常会碰到已知一随机变量的分布,要求这一变量的函数分布问题。例如,测量一个圆的面积,总是测量其半径;而半径的测量值可看作随机变量 \(X\) ,则求对应圆面积的分布。
这类题的做题步骤为:
- <1> 确定 \(Y\) 的取值范围
- <2> 写出 \(Y\) 的概率分布函数 \(F_Y (y)=P\{Y\le y\}\) ,找出 \(\{Y\le y\}\) 的等价事件 \(\{x\in D\}\)
- <3> 对得到的 \(F_Y (y)\) 求导,得到对应的概率密度函数 \(f_Y(y)\)
例子
设随机变量 \(X\) 具有密度函数 \(f_X(x)\) ,求随机变量 \(Y=|X|\) 的概率密度函数:
- 当 \(y\le 0\) 时,\(F_Y(y)=0\)
- 当 \(y\gt 0\) 时:
- \(F_Y (y)=P\{Y\le y\}=P\{|X|\le y\}=F_X(y) - F_X(-y)\)
- 求导可得 \(f_Y(y)= f_X(y) + f_X(-y)\)
综上: