跳到主要内容

概率分布

概率分布是描述随机变量取值规律的函数!理解常见的概率分布,是学习概率与统计的重要内容。

什么是概率分布?

概率分布(Probability Distribution)是描述随机变量取值规律的函数。

简单理解

概率分布就像"随机变量的取值规律":

  • 描述随机变量取各个值的概率
  • 离散随机变量用概率质量函数
  • 连续随机变量用概率密度函数

离散概率分布

1. 二项分布

二项分布(Binomial Distribution)描述 nn 次独立重复试验中成功次数的分布。

参数

  • nn:试验次数
  • pp:每次试验成功的概率

概率质量函数

P(X=k)=Cnkpk(1p)nk=(nk)pk(1p)nkP(X = k) = C_n^k p^k (1-p)^{n-k} = \binom{n}{k} p^k (1-p)^{n-k}

其中 k=0,1,2,,nk = 0, 1, 2, \ldots, n

期望和方差

E(X)=npE(X) = np

Var(X)=np(1p)\text{Var}(X) = np(1-p)

例子:抛硬币 10 次,求正面出现 5 次的概率

  • n=10n = 10p=0.5p = 0.5k=5k = 5
  • P(X=5)=C105(0.5)5(0.5)5=252×0.03125=0.246P(X = 5) = C_{10}^5 (0.5)^5 (0.5)^5 = 252 \times 0.03125 = 0.246

2. 泊松分布

泊松分布(Poisson Distribution)描述单位时间内事件发生次数的分布。

参数

  • λ\lambda:平均发生次数

概率质量函数

P(X=k)=λkeλk!P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}

其中 k=0,1,2,k = 0, 1, 2, \ldots

期望和方差

E(X)=λE(X) = \lambda

Var(X)=λ\text{Var}(X) = \lambda

例子:某路口平均每小时发生 2 起事故,求 1 小时内发生 3 起事故的概率

  • λ=2\lambda = 2k=3k = 3
  • P(X=3)=23e23!=8e260.180P(X = 3) = \frac{2^3 e^{-2}}{3!} = \frac{8 e^{-2}}{6} \approx 0.180

3. 几何分布

几何分布(Geometric Distribution)描述首次成功所需的试验次数。

参数

  • pp:每次试验成功的概率

概率质量函数

P(X=k)=(1p)k1pP(X = k) = (1-p)^{k-1} p

其中 k=1,2,3,k = 1, 2, 3, \ldots

期望和方差

E(X)=1pE(X) = \frac{1}{p}

Var(X)=1pp2\text{Var}(X) = \frac{1-p}{p^2}

例子:抛硬币,求首次出现正面所需的次数

  • p=0.5p = 0.5
  • P(X=3)=(0.5)2×0.5=0.125P(X = 3) = (0.5)^2 \times 0.5 = 0.125

连续概率分布

1. 均匀分布

均匀分布(Uniform Distribution)描述在区间 [a,b][a, b] 上均匀分布的随机变量。

概率密度函数

f(x)={1ba如果 axb0其他f(x) = \begin{cases} \frac{1}{b-a} & \text{如果 } a \le x \le b \\ 0 & \text{其他} \end{cases}

期望和方差

E(X)=a+b2E(X) = \frac{a + b}{2} Var(X)=(ba)212\text{Var}(X) = \frac{(b-a)^2}{12}

例子:随机变量 XX[0,10][0, 10] 上均匀分布

  • E(X)=0+102=5E(X) = \frac{0 + 10}{2} = 5
  • Var(X)=(100)212=10012=253\text{Var}(X) = \frac{(10-0)^2}{12} = \frac{100}{12} = \frac{25}{3}

2. 正态分布

正态分布(Normal Distribution)是最重要的连续概率分布。

参数

  • μ\mu:均值
  • σ2\sigma^2:方差

概率密度函数

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}

期望和方差

E(X)=μE(X) = \mu Var(X)=σ2\text{Var}(X) = \sigma^2

标准正态分布μ=0\mu = 0σ=1\sigma = 1

f(x)=12πex22f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}

性质

  • 关于 x=μx = \mu 对称
  • 68%68\% 的数据在 [μσ,μ+σ][\mu - \sigma, \mu + \sigma]
  • 95%95\% 的数据在 [μ2σ,μ+2σ][\mu - 2\sigma, \mu + 2\sigma]
  • 99.7%99.7\% 的数据在 [μ3σ,μ+3σ][\mu - 3\sigma, \mu + 3\sigma]

3. 指数分布

指数分布(Exponential Distribution)描述事件发生的时间间隔。

参数

  • λ\lambda:速率参数

概率密度函数

f(x)={λeλx如果 x00如果 x<0f(x) = \begin{cases} \lambda e^{-\lambda x} & \text{如果 } x \ge 0 \\ 0 & \text{如果 } x < 0 \end{cases}

期望和方差

E(X)=1λE(X) = \frac{1}{\lambda} Var(X)=1λ2\text{Var}(X) = \frac{1}{\lambda^2}

例子:某设备平均每 10 小时故障一次,求故障时间间隔的分布

  • λ=110=0.1\lambda = \frac{1}{10} = 0.1
  • E(X)=10E(X) = 10 小时

生活中的应用

统计

  • 📊 数据分析:用概率分布描述数据
  • 📈 统计推断:用概率分布进行统计推断

工程

  • ⚙️ 质量控制:用概率分布控制质量
  • 🏗️ 可靠性分析:用概率分布分析可靠性

科学

  • 🔬 实验分析:用概率分布分析实验结果
  • 📊 模型建立:用概率分布建立模型

常见错误

错误 1:分布类型混淆

要分清离散分布和连续分布。

错误 2:参数理解错误

要正确理解分布的参数含义。

错误 3:公式使用错误

要正确使用概率质量函数和概率密度函数。

小练习

  1. 抛硬币 5 次,求正面出现 3 次的概率(用二项分布)
  2. 某路口平均每小时发生 3 起事故,求 1 小时内发生 2 起事故的概率(用泊松分布)
  3. 随机变量 XX[2,8][2, 8] 上均匀分布,求 E(X)E(X)Var(X)\text{Var}(X)
  4. 应用题:某产品的寿命服从指数分布,平均寿命是 1000 小时,求寿命超过 1500 小时的概率

💡 小贴士:概率分布是描述随机变量取值规律的函数。记住:二项分布描述成功次数,正态分布是最重要的连续分布。掌握常见的概率分布,你就能更好地分析和描述随机现象!