这一组数据,怎么把标准差除以平均值加到平均值的柱图上面,在线等

平均值的概念很简单:所有数据之和除以数据点的个数,以此表示数据集的平均大小;其数学定义为

以下面10个点的CPU使用率数据为例,其平均值为17.2。


方差这一概念的目的是为了表示数据集中数据点的离散程度;其数学定义为:
标准差与方差一样,表示的也是数据点的离散程度;其在数学上定义为方差的平方根:


标准差定义是总体各单位标准值( xi)与其平均数(μ)离差平方和的算术平均数的。它反映组内个体间的离散程度。

所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减一,即变异数),再把所得值开根号,所得之数就是这组数据的标准差。

假设有一组数值X?,X?,X?,......Xn(皆为),其()为μ,公式如图1。
标准差也被称为,或者实验标准差,公式为

一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。

例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差约为17.08分,B组的标准差约为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。

与方差相比,使用标准差来表示数据点的离散程度有3个好处:

  1. 表示离散程度的数字与样本数据点的数量级一致,更适合对数据样本形成感性认知。依然以上述10个点的CPU使用率数据为例,其方差约为41,而标准差则为6.4;两者相比较,标准差更适合人理解。
  2. 表示离散程度的数字单位与样本数据的单位一致,更方便做后续的分析运算。
  3. 在样本数据大致符合正态分布的情况下,标准差具有方便估算的特性:66.7%的数据点落在平均值前后1个标准差的范围内、95%的数据点落在平均值前后2个标准差的范围内,而99%的数据点将会落在平均值前后3个标准差的范围内。

在上面的方差公式和标准差公式中,存在一个值为N的分母,其作用为将计算得到的累积偏差进行平均,从而消除数据集大小对计算数据离散程度所产生的影响。不过,使用N所计算得到的方差及标准差只能用来表示该数据集本身(population)的离散程度;如果数据集是某个更大的研究对象的样本(sample),那么在计算该研究对象的离散程度时,就需要对上述方差公式和标准差公式进行贝塞尔修正,将N替换为N-1:
经过贝塞尔修正后的方差公式:

经过贝塞尔修正后的标准差公式:

是否使用贝塞尔修正,是由数据集的性质来决定的:如果只想计算数据集本身的离散程度(population),那么就使用未经修正的公式;如果数据集是一个样本(sample),而想要计算的则是样本所表达对象的离散程度,那么就使用贝塞尔修正后的公式。在特殊情况下,如果该数据集相较总体而言是一个极大的样本 (比如一分钟内采集了十万次的IO数据) — 在这种情况下,该样本数据集不可能错过任何的异常值(outlier),此时可以使用未经修正的公式来计算总体数据的离散程度。


平均值与标准差的适用范围及误用

大多数统计学指标都有其适用范围,平均值、方差和标准差也不例外,其适用的数据集必须满足以下条件:

  1. 数据集只存在一个峰值。很简单,以假想的CPU使用率数据为例,如果50%的数据点位于20附近,另外50%的数据点位于80附近(两个峰),那么计算得到的平均值约为50,而标准差约为31;这两个计算结果完全无法描述数据点的特征,反而具有误导性。

  2. 这个峰值必须大致位于数据集中部。还是以假想的CPU数据为例,如果80%的数据点位于20附近,剩下的20%数据随机分布于30~90之间,那么计算得到的平均值约为35,而标准差约为25;与之前一样,这两个计算结果不仅无法描述数据特征,反而会造成误导。

遗憾的是,在现实生活中,很多数据分布并不满足上述两个条件;因此,在使用平均值、方差和标准差的时候,必须谨慎小心。


如果数据集仅仅满足一个条件:单峰。那么,峰值在哪里?峰的宽带是多少?峰两边的数据对称性如何?有没有异常值(outlier)?为了回答这些问题,除了平均值、方差和标准差,需要更合适的工具和分析指标,而这,就是中位数、均方根、百分位数和四分差的意义所在。

}

网友:分别解释一下极差、方差、标准差定义?极差、方差、标准差定义?怎么算啊?
回复:极差是指一组数据内的最大值和最小值之间的差异。平均差是说明集中趋势标准差是说明一组数据的离中趋势的。一组数据中各数据与平均数的差的平方和的平均数...

网友:均值除以标准差表示什么
回复:应该是标准差除以平均值表示离散系数吧!

网友:样本均值的标准差为什么是总体均值标准差除以根号n?如题等
回复:刚刚好也在这个问题,看了一些其他的。顺便贴过来给你看看,不过我虽然知道公式怎么用了。但是还是没有理解为什么一个是除以n,一个是除以n-样本标准...

网友:概率里标准差定义及意义
回复:X是一个随机变量,E(X)称为随机变量X的数学期望,也叫做均值,是概率意义下的X的平均值;D(X)=E{{X-E(X)]^}称为随机变量X的方,这个指标是衡量X取值的分散...

网友:均值标准差是什么?物理实验测量误差和数据处理中的,根本找不到这个的定义
回复:就是平均值的标准差,等于测量列贝塞尔标准差的/(n)^(/),n为测量次数

回复:从一个数量为N的总体中抽取了n个样本,由这n个样本的数据可以进行统计,常用的统计量是均值标准差与变异系数。样本均值是由n个样本平均所得,部分消除了样本的...

网友:样本均值的抽样标准差是什么东西啊?等,摆脱了,
回复:从总体中抽出一个样本,这个样本有一个均值。然而具有相同容量的样本不止一个,每次抽的的样本的均值也可能不同,即所抽样本的均值也构成一个统计量。如果总体的...

回复:标准差(Standard Deviation),也称均方差(mean square error),是各数据偏离平均数的距离的平均数,它是离均差平方均后的方根,用σ表示。标准差是方差...

网友:何为标准差?写出均值标准差的计算公式。

网友:举例说明如何用计算器计算:均值、方差、n项和、标准差_...举例说明如何用计算器计算:均值、方差、n项和、标准差
回复:、因为f(x)在x时是否有定义也不知道,当然无法判断x=a是否是函数的间断点了。但因为f'+(a)存在,f(x)在x=a处一定是右连续的。同理,f(x)在x=a处一定是左连续的...

网友:标准差/均值”是什么意思,有什么数学含义,
回复:标准差/均值”是什么意思,有什么数学含义,标准差/均值,反映单位均值上的离散程度,常用在两个总体均值

回复:很抱歉,我的英语生疏了,只能从数理统计的角度来猜,使其平均值接近,是减小平均值,使其与标准差的可比接近,否则,与其标准偏差相比时,它的变异系数就太小。在...

网友:求解一道关于均值标准差的题设Y和X为两个的随机变量,已知X的均值为,标准差为;Y的均值为,标准差...

网友:样本均值的标准差是什么统计学里面的
回复:反应数据的波动范围,表现出数据的稳定。

}

我要回帖

更多关于 标准差除以平均值 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信