概率分布是描述随机变量取值规律的函数!理解常见的概率分布,是学习概率与统计的重要内容。
什么是概率分布?
概率分布(Probability Distribution)是描述随机变量取值规律的函数。
简单理解
概率分布就像"随机变量的取值规律":
- 描述随机变量取各个值的概率
- 离散随机变量用概率质量函数
- 连续随机变量用概率密度函数
离散概率分布
1. 二项分布
二项分布(Binomial Distribution)描述 n 次独立重复试验中成功次数的分布。
参数:
概率质量函数:
P(X=k)=Cnkpk(1−p)n−k=(kn)pk(1−p)n−k
其中 k=0,1,2,…,n。
期望和方差:
E(X)=np
Var(X)=np(1−p)
例子:抛硬币 10 次,求正面出现 5 次的概率
- n=10,p=0.5,k=5
- P(X=5)=C105(0.5)5(0.5)5=252×0.03125=0.246
2. 泊松分布
泊松分布(Poisson Distribution)描述单位时间内事件发生次数的分布。
参数:
概率质量函数:
P(X=k)=k!λke−λ
其中 k=0,1,2,…。
期望和方差:
E(X)=λ
Var(X)=λ
例子:某路口平均每小时发生 2 起事故,求 1 小时内发生 3 起事故的概率
- λ=2,k=3
- P(X=3)=3!23e−2=68e−2≈0.180
3. 几何分布
几何分布(Geometric Distribution)描述首次成功所需的试验次数。
参数:
概率质量函数:
P(X=k)=(1−p)k−1p
其中 k=1,2,3,…。
期望和方差:
E(X)=p1
Var(X)=p21−p
例子:抛硬币,求首次出现正面所需的次数
- p=0.5
- P(X=3)=(0.5)2×0.5=0.125
连续概率分布
1. 均匀分布
均匀分布(Uniform Distribution)描述在区间 [a,b] 上均匀分布的随机变量。
概率密度函数:
f(x)={b−a10如果 a≤x≤b其他
期望和方差:
E(X)=2a+b
Var(X)=12(b−a)2
例子:随机变量 X 在 [0,10] 上均匀分布
- E(X)=20+10=5
- Var(X)=12(10−0)2=12100=325
2. 正态分布
正态分布(Normal Distribution)是最重要的连续概率分布。
参数:
概率密度函数:
f(x)=σ2π1e−2σ2(x−μ)2
期望和方差:
E(X)=μ
Var(X)=σ2
标准正态分布:μ=0,σ=1
f(x)=2π1e−2x2
性质:
- 关于 x=μ 对称
- 68% 的数据在 [μ−σ,μ+σ] 内
- 95% 的数据在 [μ−2σ,μ+2σ] 内
- 99.7% 的数据在 [μ−3σ,μ+3σ] 内
3. 指数分布
指数分布(Exponential Distribution)描述事件发生的时间间隔。
参数:
概率密度函数:
f(x)={λe−λx0如果 x≥0如果 x<0
期望和方差:
E(X)=λ1
Var(X)=λ21
例子:某设备平均每 10 小时故障一次,求故障时间间隔的分布
- λ=101=0.1
- E(X)=10 小时
生活中的应用
- 📊 数据分析:用概率分布描述数据
- 📈 统计推断:用概率分布进行统计推断
- ⚙️ 质量控制:用概率分布控制质量
- 🏗️ 可靠性分析:用概率分布分析可靠性
- 🔬 实验分析:用概率分布分析实验结果
- 📊 模型建立:用概率分布建立模型
常见错误
错误 1:分布类型混淆
要分清离散分布和连续分布。
错误 2:参数理解错误
要正确理解分布的参数含义。
错误 3:公式使用错误
要正确使用概率质量函数和概率密度函数。
小练习
- 抛硬币 5 次,求正面出现 3 次的概率(用二项分布)
- 某路口平均每小时发生 3 起事故,求 1 小时内发生 2 起事故的概率(用泊松分布)
- 随机变量 X 在 [2,8] 上均匀分布,求 E(X) 和 Var(X)
- 应用题:某产品的寿命服从指数分布,平均寿命是 1000 小时,求寿命超过 1500 小时的概率
💡 小贴士:概率分布是描述随机变量取值规律的函数。记住:二项分布描述成功次数,正态分布是最重要的连续分布。掌握常见的概率分布,你就能更好地分析和描述随机现象!