参数估计之区间估计

  • A+
摘要介绍经典的对于正态总体参数的区间估计方法并使用mathematica进行模拟实现。

区间估计:

度量一个点估计的精度的最直观方法就是给出未知参数的区间,此即是区间估计。

置信区间:

设θ是总体的一个参数,x1,x2,...,xn是来自该总体的样本,对于一个给定的置信水平α(0<α<1),假设有两个统计量θ1,θ2,它们都是样本的函数,若对在θ的参数空间中的任何一个值,都有P(θ1≤θ≤θ2)≥1-α,则称随机区间[θ1,θ2]为θ的置信水平为1-α的置信区间。

说明:求置信区间的方法主要是枢轴量法,枢轴量法有以下三步

  1. 设法构造一个样本和θ的函数G,使得其分布不依赖于未知参数,称其为枢轴量。
  2. 适当的选取两个常数c,d,使得对给定的α有P(c≤G≤d)=1-α。(离散场合改为≥α)
  3. 假如能将c≤G≤d进行不等式等价变形成为θ1≤θ≤θ2,则[θ1,θ2]是θ的1-α置信区间。

 

现主要讨论正态总体情况下的区间估计。

下面会用到一些抽样分布的知识,一些基础知识可以看下面的链接:

三大抽样分布总结

关于求置信区间的例子,可以看一下这个链接:

区间估计习题

 

一、单个正态总体参数的区间估计

1.σ未知时μ的置信区间

枢轴量:

参数估计之区间估计

1-α置信区间:

参数估计之区间估计

下面看一下mathenatica实现:

  1. dist = RandomReal[NormalDistribution[2, 3], 100];
  2. (*采用均值为2,方差为9的正态分布样本*)
  3. Needs["HypothesisTesting`"]
  4. (*使用估计的函数必须加入的语句,在此声明,此为导入函数包,下文代码中此句将不再重复出现*)
  5. MeanCI[dist, ConfidenceLevel -> .90]
  6. (*取置信水平为90%*)
  7. >>{1.2249, 2.32561}

 

2.σ已知时μ的置信区间

枢轴量:

参数估计之区间估计

1-α置信区间:

参数估计之区间估计

mathenatica实现:

  1. (*采用上个例子的样本*)
  2. MeanCI[dist, KnownVariance -> 9, ConfidenceLevel -> .90]
  3. >>{1.2818, 2.26871}

 

3.σ^2的置信区间

 

枢轴量:

参数估计之区间估计

1-α置信区间:

参数估计之区间估计

mathematica实现:

  1. (*采用上个例子的样本*)
  2. VarianceCI[dist, ConfidenceLevel -> .90]
  3. >>{5.84527, 9.34872}

 

二、双正态总体参数的区间估计

 

1.σ1^2和 σ2^2均已知时,μ1-μ2的区间估计

枢轴量:

参数估计之区间估计

1-α置信区间:

参数估计之区间估计

mathematica实现:

  1. dist1 = RandomReal[NormalDistribution[2, 3], 100];
  2. dist2 = RandomReal[NormalDistribution[5, 5], 100];
  3. (*产生两组不同的正态分布数据*)
  4. MeanDifferenceCI[dist1, dist2, KnownVariance -> {9, 25},ConfidenceLevel -> .90]
  5. (*给定两组数据的方差为9和25*)
  6. >>{-3.94347, -2.02526}

 

2.σ1^2和 σ2^2未知但相等时,μ1-μ2的区间估计

枢轴量:

参数估计之区间估计

1-α置信区间:

参数估计之区间估计

mathematica实现:

  1. (*采用上个例子的样本*)
  2. MeanDifferenceCI[dist1, dist2, EqualVariances -> True,ConfidenceLevel -> .90]
  3. >>{-3.88088, -2.08785}

 

3.σ1^2/ σ2^2的区间估计

枢轴量:

参数估计之区间估计

1-α置信区间:

参数估计之区间估计

mathematica实现:

  1. (*采用上个例子的样本*)
  2. VarianceRatioCI[dist1, dist2, ConfidenceLevel -> .90]
  3. >>{0.271585, 0.527801}

 

三、其他可行函数

在使用下面的函数之前,去要先导入函数包,Needs["HypothesisTesting`"]

1.NormalCI

对于单正态总体方差已知时均值的区间估计,还可以用函数NormalCI估计,NormalCI是在分布标准差已知,由样本平均值来求正态总体数学期望的置信区间,它的参数依次需要样本均值,总体期望的标准差。

  1. (*数据仍采用“一”中的*)
  2. dist = RandomReal[NormalDistribution[2, 3], 100];
  3. std = 3/Sqrt[100]; (*均值的标准差*)
  4. NormalCI[Mean[dist],std,ConfidenceLevel -> .90]
  5. >>{1.2818, 2.26871}

结果和“一”中的一样

 

2.StudentTCI

 

对于单正态总体方差未知时的均值的区间估计,还可以用函数StudentCI估计,它由样本平均值和样本标准差来求总体数学期望的置信区间,它的参数依次需要样本均值,样本的标准差以及自由度,因为是利用t分布求解,所以自由度为数据个数减一,即100-1=99。

  1. (*数据仍采用“一”中的*)
  2. sstd = StandardDeviation[dist]/Sqrt[100]; (*样本标准差*)
  3. dist = RandomReal[NormalDistribution[2, 3], 100];
  4. StudentTCI[Mean[dist], sstd, 100 - 1, ConfidenceLevel -> .90]
  5. {1.2249, 2.32561}

 

结果和“一”中的一样

 

3.ChiSquareCI

对于单正态总体方差的区间估计可以使用ChiSquareCI,它使用总体方差的无偏估计以及自由度来求总体方差的置信区间。

  1. (*数据仍采用“一”中的*)
  2. dist = RandomReal[NormalDistribution[2, 3], 100];
  3. stdn = Variance[dist]; (*样本方差*)
  4. ChiSquareCI[stdn, 100 - 1, ConfidenceLevel -> .90]
  5. >>{8.82679, 14.1173}

 

4.FRatioCI

对于双正态总体方差比值的区间估计可以使用FRatioCI,它使用两个总体方差之比以及各自数据个数来求方差比值的置信区间。

  1. (*数据仍采用“二”中的*)
  2. dist1 = RandomReal[NormalDistribution[2, 3], 100];
  3. dist2 = RandomReal[NormalDistribution[5, 5], 100];
  4. FRatioCI[Variance[dist1]/Variance[dist2], 100, 100,ConfidenceLevel -> .90]
  5. >>{0.272042, 0.526914}

 

结果和“二”中相近,略有差别因为比例的小数位保留不一样

  • 微信公众号
  • 关注微信公众号
  • weinxin
  • QQ群
  • 我们的QQ群号
  • weinxin
邵亚男

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: