CHAPTER 4

随机变量的数字特征

从“概率分布”到“特征数值”的抽象飞跃。
本章重点:期望的物理意义、方差的风险度量、协方差与相关性的本质。

数学期望 (Mathematical Expectation)

定义与计算

离散型 $$ E(X) = \sum_{k} x_{k} p_{k} $$
连续型 $$ E(X) = \int_{-\infty}^{+\infty} x f(x) dx $$

关键性质

  • 线性性质: $E(aX+b) = aE(X) + b$
  • 加法定理: $E(X \pm Y) = E(X) \pm E(Y)$ (无需独立)
  • 乘法定理: 若 $X, Y$ 独立,则 $E(XY) = E(X)E(Y)$
  • 函数期望: $E[g(X)] = \int g(x)f(x)dx$ (无意识统计学家法则)

常用分布期望 E(X)

分布E(X)
0-1分布 $B(1,p)$$p$
二项分布 $B(n,p)$$np$
泊松分布 $P(\lambda)$$\lambda$
均匀分布 $U(a,b)$$(a+b)/2$
指数分布 $E(\theta)$$\theta$
正态分布 $N(\mu,\sigma^2)$$\mu$

常用分布方差速查

分布 参数范围 方差 D(X)
两点分布 $0 < p < 1$ $p(1-p)$
二项分布 $n \ge 1, 0 $np(1-p)$
泊松分布 $\lambda > 0$ $\lambda$
均匀分布 $a < b$ $(b-a)^2 / 12$
指数分布 $\theta > 0$ $\theta^2$
正态分布 $\mu, \sigma > 0$ $\sigma^2$
重点记忆:泊松分布 $E(X)=D(X)=\lambda$

方差 (Variance)

方差刻画了随机变量取值的分散程度(波动性)。

计算公式

$$ D(X) = E(X^2) - [E(X)]^2 $$

关键性质

  • $D(C) = 0$ (常数无波动)
  • $D(aX+b) = a^2 D(X)$ (注意系数平方)
  • 若 X, Y 独立:$D(X \pm Y) = D(X) + D(Y)$
  • 若不独立:$D(X \pm Y) = D(X) + D(Y) \pm 2Cov(X,Y)$

切比雪夫不等式

$$ P\{|X - E(X)| \ge \varepsilon\} \le \frac{D(X)}{\varepsilon^2} $$
SECTION 03

协方差与相关系数

多维随机变量的核心:研究变量间的相互影响与线性关系。

1. 协方差 (Covariance)

定义式:$Cov(X, Y) = E[(X - E(X))(Y - E(Y))]$

常用计算公式 $$ Cov(X, Y) = E(XY) - E(X)E(Y) $$
  • 对称性:$Cov(X, Y) = Cov(Y, X)$
  • 线性:$Cov(aX, bY) = ab Cov(X, Y)$
  • 分配律:$Cov(X_1+X_2, Y) = Cov(X_1, Y) + Cov(X_2, Y)$

2. 相关系数 (Correlation Coefficient)

随机变量的标准化后的协方差。

$$ \rho_{XY} = \frac{Cov(X, Y)}{\sqrt{D(X)}\sqrt{D(Y)}} $$

重要性质与定理

性质 1: 有界性

$|\rho_{XY}| \le 1$。
(1) $|\rho|=1 \iff Y=aX+b$ (存在严格线性关系)
(2) $\rho=0 \iff X, Y$ 不相关

性质 2: 5个等价命题

以下说法是等价的:

  1. $X$ 与 $Y$ 不相关
  2. $\rho_{XY} = 0$
  3. $Cov(X, Y) = 0$
  4. $E(XY) = E(X)E(Y)$
  5. $D(X \pm Y) = D(X) + D(Y)$

性质 3: 独立 vs 不相关

独立 $\implies$ 不相关
(独立一定不相关,反之不一定)

特例: 对于二维正态分布,独立 $\iff$ 不相关。