文章目录(Table of Contents)
连续分布
这里介绍一些常用的连续分布,关于使用 matplotlib 可视化分布的 pdf(概率密度函数) 和 cdf(累计分布函数),可以参考文章,matplotlib 可视化概率密度函数(pdf)和累计分布函数(cdf)
这一章中所有的测试均使用 mathematicas 来进行测试,例如绘制 cdf 和 pdf,计算均值与方差。
- 正态分布(Normal distribution),又名高斯分布(Gaussian distribution),若随机变量
X
服从一个数学期望为μ
、方差为σ^2
的正态分布,记为X~N(μ, σ^2)
。 - 正态分布的概率分布列:
- 均值:μ
- 方差:σ^2
- 使用 mathematica 产生正态分布(举例 N(0,1)):
- data1 = NormalDistribution[0, 1]
则 data1中存有模拟该正态分布得到的数据
- 计算均值和方差:
- Mean[data1]
- >>0.
- Variance[data1]
- >>1.
- 画出正态分布的概率密度函数图(pdf):
- Plot[PDF[data1, x], {x, -5, 5}]
- 可视化正态分布的分布函数图(cdf):
- Plot[CDF[data1, x], {x, -5, 5}]
- 在概率论和统计学中,均匀分布也叫矩形分布,它在相同长度间隔的分布概率是等可能的。 均匀分布由两个参数 a 和 b 定义,它们是数轴上的最小值和最大值,通常记为
U(a, b)
。 - 均匀分布的概率分布列:
- 均值:
(a+b)/2
- 方差:
(b-a)^2/12
- 使用 mathematica 产生均匀分,举例
U(0,1)
:
- data2 = UniformDistribution[{0, 1}]
- 计算均值和方差:
- Mean[data2]
- >>1/2.
- Variance[data2]
- >>1/12.
- 画出其密度函数图:
- Plot[PDF[data2, x], {x, 0, 1}]
- 画出其分布函数图:
- Plot[CDF[data2, x], {x, 0, 1}]
- 指数分布,也称为负指数分布,具有无记忆的性质,其中
λ > 0
是分布的一个参数, 如果一个随机变量X
呈指数分布,则可以记作X~Exp(λ)
。 - 指数分布的概率分布列:
均值:1/λ
方差:1/λ^2
使用 mathematica 产生指数分布,这里举例 Exp(0.5):
- data3 = ExponentialDistribution[0.5]
则data3中存有模拟该指数分布得到的数据
- 计算均值和方差:
- Mean[data3]
- >>2.
- Variance[data3]
- >>4.
- 画出其密度函数图:
- Plot[PDF[data3, x], {x, 0, 20}]
- 画出其分布函数图:
- Plot[CDF[data3, x], {x, 0, 20}]
- 伽玛分布(Gamma Distribution)中的参数 α 称为形状参数,β 称为尺度参数,若随机变量服从伽马分布,则记为
X~Ga(α,β)
。 - 伽马分布的概率分布列:
均值:α/β
方差:α/β^2
使用 mathematica 产生伽马分布,举例 Ga(2,2)
:
- data4 = GammaDistribution[2, 2]
则 data4 中存有模拟该伽马分布得到的数据
- 计算均值和方差:
- Mean[data4]
- >>4.
- Variance[data4]
- >>8.
- 画出其密度函数图:
- Plot[PDF[data4, x], {x, 0, 20}]
- 画出其分布函数图:
- Plot[CDF[data4, x], {x, 0, 20}]
- 不同参数的密度函数比较:
- Ga[10, 20] = PDF[GammaDistribution[1, 2], x]
- Ga[20, 20] = PDF[GammaDistribution[3, 3], x]
- Ga[20, 30] = PDF[GammaDistribution[4, 7], x]
- Ga[10, 50] = PDF[GammaDistribution[5, 10], x]
- Plot[{Ga[10, 20], Ga[20, 20], Ga[20, 30], Ga[10, 50]},
- {x, 0, 50},
- PlotLegends -> "Expressions",
- PlotRange -> {0, 0.15}]
- 服从贝塔分布(Beta Distribution)的变量 x 仅能出现于 0 到 1 之间,a,b是两个大于 0 的参数,随机变量服从参数为 a 和 b 的贝塔分布,则记为
X~B(a,b)
。 - 伽马分布的概率分布列:
- 均值:a/(a+b)
- 方差:ab / ((a+b)^2*(a+b+1))
- 使用 Mathematica 产生伽马分布,举例Be(2,2):
- data5 = BetaDistribution[2, 2]
则 data5 中存有模拟该贝塔分布得到的数据
- 计算均值和方差:
- Mean[data5]
- >>1/2.
- Variance[data5]
- >>1/20.
- 画出其密度函数图:
- Plot[PDF[data5, x], {x, 0, 1}]
- 画出其分布函数图:
- Plot[CDF[data5, x], {x, 0, 1}]
- 不同参数的密度函数比较:
- B[2, 2] = PDF[BetaDistribution[2, 2], x]
- B[2, 3] = PDF[BetaDistribution[2, 3], x]
- B[2, 4] = PDF[BetaDistribution[2, 4], x]
- B[3, 5] = PDF[BetaDistribution[3, 5], x]
- Plot[{B[2, 2], B[2, 3], B[2, 4], B[3, 5]}, {x, 0, 1}, PlotLegends -> "Expressions"]
- 微信公众号
- 关注微信公众号
- QQ群
- 我们的QQ群号
2017年12月29日 下午10:16 1F
这一篇超级详细!行家啊
2017年12月29日 下午11:49 B1
@ xqq 这个系列都写得很好,欢迎继续看下去。