Skip to content

随机变量及其分布

约 1847 个字 预计阅读时间 9 分钟

随机变量

设随机试验的样本空间为 \(S={e}\) ,若 \(X=X(e)\) 为定义在样本空间 \(S\) 上的实值单值函数,则称 \(X=X(e)\) 为随机变量。

实值单值函数

指自变量x和函数y都在实数范围内取值,且对于每个x,均有唯一确定的y和它对应的函数

常见的两类随机变量分别为离散型随机变量和连续型随机变量

离散型随机变量

取值至多可数的随机变量称为离散型随机变量,其概率分布(分布律)为:

X \(x_1\) \(x_2\) ... \(x_i\) ...
P \(p_1\) \(p_2\) ... \(p_i\) ...
\[ \text{且有} p_i\ge 0,\ \sum p_i=1 \]

例 1:

某人上学路上要经过三个红绿灯,每次到路口时为红灯的概率为 \(p\) ,以 \(X\) 表示首次停车时所通过的红绿灯数,求其概率分布律:

X 0 1 2 3
P \(p\) \(p(1-p)\) \(p(1-p)^2\) \((1-p)^3\)

例 2:

若随机变量 \(X\) 的概率分布律为

\[ P(X=k)=\frac{c\lambda^k}{k!},\ k=0,1,2,...,\ \lambda \gt 0 \]

求常数 c:

\[ 1=\sum P(X=k) = c\sum \frac{\lambda^k}{k!} =c e^{\lambda} \]

0-1 分布

若随机变量 \(X\) 的分布律为:

X 0 1
P \(1-p\) \(p\)

则称 \(X\) 服从参数为 \(p\) 的 0-1 分布(两点分布),记为 \(X\sim 0-1(p)\)\(B(1,p)\)

它的分布律也可以写作:

\[ P(X=k)=p^k (1-p)^{1-k} \]

对于一个样本空间仅含两个元素的随机事件 \(S=\{e_1, e_2\}\) ,我们总能在 \(S\) 上定义一个服从 0-1 分布的随机变量来描述这个随机试验的结果:

\[ X=X(e)=\left \{ \begin{array}l 0 , & \text{当} e=e_1 \\ 1, & \text{当} e=e_2 \end{array} \right . \]

二项分布

设试验 \(E\) 只有两种可能的结果:\(A\)\(\overline{A}\)\(p(A)=p\) ,将试验 \(E\) 独立地重复进行 n 次,则称这一串重复的独立试验为 n重贝努利试验

\(A\) 在n重贝努利试验中发生 \(X\) 次,则其分布律为:

\[ P(X=k) =C^k _n p^k(1-p) ^{n-k},\ k=0,1,... \]

则称 \(X\) 服从参数为 \(p\) 的二项分布,记为 \(X\sim B(n,p)\)

泊松分布

设随机变量 \(X\) 的概率分布律为:

\[ P(X=k) =\frac{\lambda^k e^{-\lambda}}{k!},\ k=0,1,2,...,\ \lambda \gt 0 \]

则称 \(X\) 服从参数为 \(\lambda\) 的泊松分布,记为 \(X=P(\lambda)\)

二项分布和泊松分布有如下近似公式

二项泊松近似公式.png

超几何分布

若随机变量 \(X\) 的概率分布律为:

\[ P(X=k) =\frac{C^k _a C^{n-k}_b}{C ^n_N},\ k=l_1, l_1+1,..., l_2 \]

其中 \(l_1 = \max (0,n-b),\ l_2=min(a,n)\) 。则称随机变量 \(X\) 服从超几何分布

例子

一袋中有 a 个白球,b 个红球,a+b=N。从中不放回地取 n 个球,设每次取到各球的概率相等,以 \(X\) 表示取到的白球数,则 \(X\) 服从超几何分布。

几何分布

若随机变量 \(X\) 的概率分布律为:

\[ P(X=k)=p(1-p)^{k-1},\ k=1,2,3,...,\ 0\lt p\lt 1 \]

则称随机变量 \(X\) 服从参数 \(p\) 的几何分布

巴斯卡分布

若随机变量 \(X\) 的概率分布律为:

\[ P(X=k)=C^{r-1}_{k-1} p^r(1-p) ^{k-r},\ k=r,r+1,r+2,... \]

则称随机变量 \(X\) 服从参数为 \((r,p)\) 的巴斯卡分布

连续型随机变量

对于随机变量 \(X\) 的分布函数 \(F(x)\) ,若存在非负的函数 \(f(x)\) 使得对于任意实数 \(x\) 都有:

\[ F(x)=\int_\infty ^x f(t)dt \]

则称 \(X\) 为连续性随机变量。其中 \(f(x)\) 为随机变量 \(X\) 的概率密度函数,简称 密度函数 ,其有如下性质:

(1)\(f(x)\ge 0\)

(2)\(\int _{-\infty} ^{+\infty} f(x)dx=1\)

(3)对任意实数 \(x_1,x _2( x_2\gt x_1)\) ,有 \(P\{x_1 \lt X\le x_2\}= \int _{x_1} ^{x_2}f(x)dx\)

(4)在连续点,\(F'(x)=f(x)\)

概率为零不一定为不可能事件

均匀分布

设随机变量 \(X\) 具有概率密度函数:

\[ f(x)=\left \{ \begin{array}l \frac{1}{b-a}, & x\in (a,b) \\ 0, & \text{其他} \end{array} \right . \]

则称随机变量 \(X\) 在区间 \((a,b)\) 上服从均匀分布,记为 \(X\sim U(a,b)\)

指数分布

设随机变量 \(X\) 具有概率密度函数:

\[ f(x)= \left \{ \begin{array}l \lambda e^{-\lambda x} & , x\gt 0 \\ 0 & , x\le 0 \end{array} \right . \]

其中 \(\lambda \gt 0\) 为常数,则称随机变量 \(X\) 服从参数为 \(\lambda\) 的指数分布,记为 \(X\sim Exp(\lambda)\)\(X\sim E(\lambda)\)

根据定义可得指数分布的分布函数为:

\[ F(x) =\left \{ \begin{array}l 1-e^{-\lambda x}, & x\gt 0 \\ 0, & x\le 0 \end{array} \right . \]

需要特别注意,指数分布的 \(X\) 具有以下 无记忆性

\[ P(X\gt t_0 +t |X\gt t_0) = P(X\gt t) \]

如果 \(X\) 表示等待时间,那么无记忆性表明只要还没等到,剩余等待时间仍然服从参数为 \(\lambda\) 的指数分布;

如果 \(X\) 表示元件寿命,那么无记忆性表明只要还没坏掉,剩余元件寿命仍然服从参数为 \(\lambda\) 的指数分布。

例题

指数分布例题题面.png

指数分布例题答案.png

正态分布

设随机变量 \(X\) 具有概率密度函数:

\[ f(x)=\frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-\mu) ^2}{2\sigma ^2}},\ -\infty \lt x\lt \infty \]

其中 \(-\infty \lt \mu\lt \infty,\ \sigma \gt 0\) 为常数,则称随机变量 \(X\) 服从参数为 \(\mu,\sigma\) 的正态分布(Gauss分布),记为 \(X\sim N(\mu,\sigma^2)\)

在自然现象和社会现象中,大量随机变量服从或近似服从正态分布

傻逼浙大正态分布

正态分布关键节点.png

随机变量的概率分布函数

随机变量 \(X\) ,若对任意实数 \(x\) ,函数 \(F(x)=P(X\le x)\) ,称其为 \(X\) 的分布函数。

  • (1)\(0\le F(x)\le 1\)
  • (2)\(F(x)\) 单调不减,且 \(F(-\infty) =0,F(+\infty)=1\)
    • \(P(x_1\lt X\le x_2)= F(x_2) -F(x_1)\)
  • (3)\(F(x)\) 右连续,即 \(F(x+0)=F(x)\)
  • (4)\(P(X=x)=F(x)-F(x-0)\)

一般的,设离散型随机变量的分布律为 \(P(X=x_k)= p_k\) ,由概率的可列可加性得 \(X\) 的分布函数为:

\[ F(x)=\sum _{x_k\le x} p_k \]

分布函数在 \(x=x_k\) 处均有跳跃,跳跃值为 \(p_k=P(X= x_k)\)

随机变量函数的分布

在实际问题中,我们常会碰到已知一随机变量的分布,要求这一变量的函数分布问题。例如,测量一个圆的面积,总是测量其半径;而半径的测量值可看作随机变量 \(X\) ,则求对应圆面积的分布。

这类题的做题步骤为:

  • <1> 确定 \(Y\) 的取值范围
  • <2> 写出 \(Y\) 的概率分布函数 \(F_Y (y)=P\{Y\le y\}\) ,找出 \(\{Y\le y\}\) 的等价事件 \(\{x\in D\}\)
  • <3> 对得到的 \(F_Y (y)\) 求导,得到对应的概率密度函数 \(f_Y(y)\)

例子

设随机变量 \(X\) 具有密度函数 \(f_X(x)\) ,求随机变量 \(Y=|X|\) 的概率密度函数:

  • \(y\le 0\) 时,\(F_Y(y)=0\)
  • \(y\gt 0\) 时:
    • \(F_Y (y)=P\{Y\le y\}=P\{|X|\le y\}=F_X(y) - F_X(-y)\)
    • 求导可得 \(f_Y(y)= f_X(y) + f_X(-y)\)

综上:

\[ f_Y(y) = \left \{ \begin{array}l f_X(y) + f_X(-y) & ,y\gt 0 \\ 0 &, y\le 0 \end{array} \right . \]
Comments: