不同均值和方差的正态分布的均值怎么求和怎么求

-- 君子慎独,修身律己。飓风过岗,伏草唯存。
日18:30:07
摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理。首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集。诚然在传统学科中,其在以上学科发挥作用很大。然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要。本系列统计学的学习基于《深入浅出统计学》一书(偏向代码实现,需要读者有一定基础,可以参见后面PPT学习)。正如(吴军)先生在《数学之美》一书中阐述的,基于统计和数学模型对机器智能发挥重大的作用。诸如:语音识别、词性分析、机器翻译等世界级的难题也是从统计中找到开启成功之门钥匙的。尤其是在自然语言处理方面更显得重要,因此,对统计和数学建模的学习是尤为重要的。最后感谢团队所有人的参与。( 本文原创,转载注明出处:&
【程序员眼中的统计学(1)】
【程序员眼中的统计学(2)】
【程序员眼中的统计学(3)】
【程序员眼中的统计学(4)】
【程序员眼中的统计学(5)】
【程序员眼中的统计学(6)】
【程序员眼中的统计学(7)】
【程序员眼中的统计学(8)】
【程序员眼中的统计学(9)】
【程序员眼中的统计学(10)】
【程序员眼中的统计学(11)】
【程序员眼中的统计学(12)】
1正态分布描述
正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre(棣莫弗)于1733年受次提出的,但由于德国数学家Gauss(高斯)率先将其应用于天文学家研究,故正态分布又叫高斯分布。正态分布起源于误差分析,早期的天文学家通过长期对一些天体的观测收集到了大量数据,并利用这些数据天体运动的物理模型,其中第谷与开 普勒在建模中提出了一条原则&&模型选择的最终标准是其与观测数据的符合程度&,这个&符合程度&实质上蕴涵了误差概率理论的问题,伽例略是第一个在其著作中提出随机误差这一概念的人。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是& = 0,& = 1的正态分布。
正态分布的定义
正态分布()又名高斯分布(),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。正态分布之所以被称为正态,是因为它的形态看起来合乎理想。在现实生活中,遇到测量之类的大量连续数据时,你"正常情况下"会期望看到这种形态。
1.2正态分布符号定义
若随机变量服从一个数学期望为&、方差为的高斯分布,记为&,。其概率密度函数为正态分布的期望值&决定了其位置,其标准差&决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。正态分布有两个参数,即均数(&)和标准差(&)。是位置参数,当&固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数,当&固定不变时,&越大,曲线越平阔;&越小,曲线越尖峭。通常用表示标准正态分布。
1.3正态分布公式
正态分布函数密度曲线可以表示为:称服从正态分布,记为ms,其中&为均值,s为标准差,&(&,&。标准正态分布另正态分布的&为,s为
标准正态分布图形如下所示
1.4正态分布函数密度曲特征
A、正态分布函数密度曲线在横轴上方均数处最高。
B、正态分布函数密度曲线以均数为中心,左右对称。
C、正态分布函数密度曲线有两个参数,即均数(&)和标准差( s )。 &是位置参数,当s固定不变时, &越大,曲线沿横轴,越向右移动;反之, &越小,则曲线沿横轴,越向左移动。是形状参数,当&固定不变时, s越大,曲线越平阔; s 越小,曲线越尖峭。通常用N( & ,
)表示均数为& ,方差为s的正态分布。用N(0,1)表示标准正态分布。
D、正态分布函数密度曲线下面积的总和为1。
1.5正态概率计算公式
如图下图所示a到b的阴影部分面积其中,为自变量,为期望,s为标准差。
对于标准正态分布概率求解公式如下,即令一般正态概率公式为,s为,上下限为负无穷到正无穷即可得到,通常我们用来表示标准正态概率。
1.5标准正态分布方差和期望
标准正态分布期望E(x)=&
标准正态分布方差Var(x)=
1.6正态概率计算步骤
第一步:确定数据分布:在做正态概率分计算,首先确定数据是否符合正态分布,确定正态分布的均值和方差。对一些不符和正态分布的数据进行取对数或者样本重新排列称符合正态分布的标准后,在确定均值和方差。
第二步:标准化(平移,收放):对一般正态分布进行标准化,标准化的过程为先平移,平移过程用公式表达即再对结果进行收放,收放过程即为,其中。则标准化公式:;其中为标准分,为随机变量,&为均值,s为标准差。
第三步:使用概率表:通过标准分,进行查表(标准正态分布概率表),得到具体的概率。
2正态概率的应用
例:某公司准备通过考试招工名。其中名正式工,名临时工。实际报考人数为名。考试满分分。考试不久后,通过当地新闻媒体得到如下消息:考试平均成绩是分,分以上的高分考生名。某考生的成绩为分。问他能否被录取?若被录取,能否是正式工?
数学建模:由具体问题,我们可以假设考生的成绩分布符合正态分布。设考生的成绩为,最低分数线为,均值为,方差设为,正态分布可以记作:。
解决思想:根据条件求出方差 根据正态分布求出最低分数线&,根据考生的成绩算出该考生在所有考生中的比例
3正态分布的优缺点
3.1正态分布优点
对于社会上遇到的大部分问题,其概率分布规律基本都满足正态分布,为了计算某种概率,我们就可以通过数学建模利用正态分布方便解决问题。
一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。
在一定条件下可以利用正态分布近似估算二项分布和泊松分布。
3.2正态分布缺点
无法近似估算符合几何分布的问题,无法精确解决离散数据概率。
3.3正态分布不适用场景
&&&&数据离散性太大,数据不符合正态分布特点,通过对数据进行取对数或者重新排序亦无法达到正态分布特点,无法得出均数(期望)和标准差。
3.4正态分布适用场景
&&&&连续型数据或者数据离散性小,数据基本符合正态分布特点,或者对不符合的数据进行取对数或者样本重新排序达到正态分布特点,有具体的均数(期望)和标准差。
4正态概率算法输入数据
4.1正态概率算法输入数据
double,表示正态分布均数(期望)
double,表示正态分布标准差(方差的开平方)
4.2正态概率算法中间结果
double,表示正态分布标准差
4.3正态分布算法输出结果
double,表示正态概率值
4.4正态概率算法图形化展示
5正态概率算法异常和误差
5.1正态概率算法可能异常或误差
异常:算出的标准差超出概率表出现异常
误差:保留小数位数造成不精确
5.2正态概率算法异常或误差处理
异常:解决,过小捕获异常并给予概率为0。
误差:解决,进行小数点位数自定义保留封装,根据具体精度进行设置。
6正态概率算法描述
6.1类和方法描述
类源码见源程序:
方法描述:通过对需要计算标准概率的的正态分布的均值和标准差进行计算得出具体标准分再通过调用mons.math3.distribution类来实现。
6.2类和方法调用接口
见源程序:
zheng04.java 下包含如下方法:
cumulativeProbability(double z)
//需要求的正态分布的标准分
调用封装方法:
NumFormat.java
下如下方法:
ZeroFormat (double num ,int n) //对num数值保留位数n的自行设置
* 保留几位小数
* @param num double,预备格式数据
* @return result double,保留指定小数点数据
public static double ZeroFormat(double num,int n)
BigDecimal bigDecimal=new BigDecimal(num);
//DecimalFormat ff = new DecimalFormat("#.0000");
//保留四位小数
//double result = Double.valueOf(ff.format(num));
return bigDecimal.setScale(n, BigDecimal.ROUND_HALF_UP).doubleValue();
//setscale(n,BigDecimal.ROUND_HALF_UP).doubleV
package NormalD
import java.util.S
import mons.math3.distribution.NormalD
* @(#)zheng01.java
* @Description:描述:根据提供的正态分布的均值和标准差得到正态概率的具体实现。
* @Definitions:定义:在处理符合正态分布的连续型数据,知道了这组数据的均值和方差为了求得随机变量符合某个范围的概率为:P(X&x)这类问题称之为正态概率。表达式为:X~N(&,&^2)
* @Explanation:符号解释:&为该组连续数据的均值;&为该组连续数据的标准差。
* @Comments:条件:在一组连续型数据,已知该组数据的均值和标准差,求解随机变量x的正态概率。这种情况下适用于本算法。
* @优点:知道正态分布具体的均值和标准差可以利用此算法快速求出小于随机变量X的正态概率。
* @缺点:无法近似估算符合几何分布的问题,无法精确解决离散数据概率,对于没有给出均值或者标准差的正态分布无法计算。
* @适用场景:连续型数据或者数据离散性小,数据基本符合正态分布特点,或者对不符合的数据进行取对数或者样本重新排序达到正态分布特点,有具体的均数(期望)和标准差。。
* @不适用场景:数据离散性太大,数据不符合正态分布特点,通过对数据进行取对数或者重新排序亦无法达到正态分布特点,无法得出均数(期望)和标准差。
* @输入/出参数:见具体方法
* @异常/误差:
异常:输入数据不合法,如:要求输入double数据,输入字母。
误差:保留小数位数造成不精确
异常:输入不合法给予提示。
误差:进行小数点位数自定义保留封装,根据具体精度进行设置。
* @Create Date:
日16:39:25
* @author Magicfairytail
public class zheng04 {
public static void main(String[] args) {
* 均值为 &标准差&的正态分布的具体实现
* @param & double型保留四位小数,表示正态分布均值
* @param & double型保留四位小数,表示正态分布标准差
* @return S1 double型保留四位小数,表示p(X&x)的正态概率
NormalDistribution normalDistributioin = new NormalDistribution(0,1);//新建一个标准正态分布对象
Scanner in=new Scanner(System.in);
System.out.println("请输入ц:");
double ц=in.nextDouble();
//ц=NumberFormat.ZeroFormat(ц);//对所得数据保留4位小数
System.out.println("请输入&:");
double &=in.nextDouble();
//&=NumberFormat.ZeroFormat(&);
//对所得数据保留4位小数
System.out.println("请输入x:");
double x=in.nextDouble();
//x=NumberFormat.ZeroFormat(x);//对所得数据保留4位小数
double z=(x-ц)/&;
z=NumberFormat.ZeroFormat(z,4);//对所得数据保留4位小数
double S1 = normalDistributioin.cumulativeProbability(z);
S1=NumberFormat.ZeroFormat(S1,4);//对所得数据保留4位小数
System.out.println("正态分布概率为:");
System.out.println(S1);
System.out.println();
System.out.println("请问您还要继续输入吗?(1/0)");
} catch (Exception e) {
// 这里的异常为所得的结果过小导致异常,直接将结果自动置0
System.out.println("正态分布概率为:");
System.out.println("0");
System.out.println();
System.out.println("请问您还要继续输入吗?(1/0)");
} while (in.nextInt()==1);//while循环,当输入的值为1继续,为其他值则终止程序
7正态分布的变换
7.1在随机变量独立性的情况下,正态分布可以做以下的变换
7.2在随机变量独立性的情况下,正态分布方差和期望的变换
7.3在随机变量独立观察的情况下,正态分布方差和期望的变换
8正态分布估算二项分布
8.1正态分布估算二项分布条件
a、二项分布和正态分布的形状十分相似
b、np和nq双双大于5可以用正态分布近似代替二项分布
若符合以上2个条件,正态分布的期望等于np,方差等于npq即;
其中n为二项分布实验总次数,p为一次成功的概率,q为。记作
8.2误差修正
8.2.1连续修正概念
将离散数据转换为连续标度时,所做的小幅调整,这个过程叫做连续修正
8.2.2连续修正使用方法
总结起来就是"小加大减",即在计算 这种形式的概率时,关键是要确保所选择的范围中包含离散数值a,在一个连续标度上一般加上相邻两个自变量单位距离的一半(eg:修正后即为;自变量X的单位距离为1);而在在计算 这种形式的概率时,一定要确保所选择的范围中包含离散数值b,在一个连续标度上一般减去相邻两个自变量单位距离的一半(eg:修正后即为;自变量X的单位距离为1);处理介于型数据时,需要进行连续性修正,以便确保a和b均包含在内(eg:修正后即为;自变量X的单位距离为1) tip:这里的数据都为离散型数据,因为我们是拿正态分布来估算二项分布,所以就会存在误差,通过对离散数据的连续修正则可以减小误差。
9正态分布估算泊松分布
9.1正态分布估算泊松分布条件
a、泊松分布的形状与正态分布相似
b、如果且 ,则可用进行近似
若符合以上2个条件,我们就可以用正态分布近似估算泊松分布,正态分布的期望等于,方差等于即; 其中为泊松分布的平均发生次数(或者发生率)。
tip:近似计算时注意连续性修正。
10正态分布估算应用
10.1正态分布近似估算二项分布应用
在12个问题中答对5题或5题以下的概率,其中每个问题只有两个备选答案。
使用二项分布计算如下:
由题可知,即求出 ,其中
各个概率用下列公式进行计算:
我们需要求 ,其中。为此,需要求至。然后将算得的所有概率加起来。各个概率为:
将以上概率加起来,得到总概率为:
(保留三位小数)
使用正态分布近似计算:
,即近似正态分布为也就是。我们要求这里注意连续性修正应为,先计算标准差(保留两位小数)
这与二项分布计算的0.387十分接近。
10.2正态分布近似估算泊松分布
游乐园过山车发生故障的次数符合泊松分布,其中 。求第一年的故障次数小于52次的概率有多大?
使用泊松分布计算:
如果某物体以某种平均频率发生故障,则这种情况符合泊松分布,以均值为其参数,如果X表示一年内的故障次数,则 。
我们需要求 ,因此我们要求出52以内的所有X值分别对应的概率。
这个概率太过复杂这里给出计算方法
使用正态分布近似估算泊松分布:
如果用X表示一年内故障次数,则。
由于 较大,我们可以用正态分布近似代替泊松分布。即可以用
我们需要求故障次数小于52的概率,由于用连续概率分布近似代替离散概率分布,所以必须进行连续性修正。我们不应将52计算在内,只需要求出 。
计算标准分
(保留两位小数)
通过查询标准正态概率表可得结果为0.9656,则一年内的故障次数小于52的概率为0.9656。
11&总结与共享&
PPT: 访问密码 ed27
开源代码:访问密码 8ff6
阅读(...) 评论()均值、方差、正态分布――学生用_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
均值、方差、正态分布――学生用
上传于|0|0|暂无简介
阅读已结束,如果下载本文需要使用2下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩4页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
五、正态总体样本均值和方差的分布【PPT】
下载积分:991
内容提示:五、正态总体样本均值和方差的分布【PPT】
文档格式:PPT|
浏览次数:701|
上传日期: 03:08:14|
文档星级:
全文阅读已结束,如果下载本文需要使用
 991 积分
下载此文档
阅读此文档的用户还读了
五、正态总体样本均值和方差的分布【PPT】
官方公共微信}

我要回帖

更多关于 对数正态分布均值方差 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信