统计学时间excel里一列数相加中不能直接相加的有?

统计百科,有疑问的可以戳进来_统计学吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:15,246贴子:
统计百科,有疑问的可以戳进来收藏
帖子内容转自 中国统计网 统计百科。。。
什么是统计学简介
统计学(statistics)是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。
统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。 起源
统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文 statista (国民或政治家)。 德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。   统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。 统计学的创立时期   德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计。”可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。   统计学的萌芽产生在欧洲。17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。1、国势学派  国势学派又称记述学派,产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。其主要代表人物是海尔曼·康令和阿亨华尔。康令第一个在德国黑尔姆斯太特大学以“国势学”为题讲授政治活动家应具备的知识。阿亨华尔在格丁根大学开设“国家学”课程,其主要著作是《近代欧洲各国国势学纲要》,书中讲述“一国或多数国家的显著事项”,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了各国实力的强弱,为德国的君主政体服务。因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。但随着资本主义市场经济的发展,对事物量的计算和分析显得越来越重要,该学派后来发生了分裂,分化为图表学派和比较学派。2、政治算术学派  政治算术学派产生于17世纪中叶的英国,创始人是威廉·配第(),其代表作是他于1676年完成的《政治算术》一书。这里的“政治”是指政治经济学,“算术”是指统计方法。在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。因此马克思说:“威廉·佩第——政治经济学之父,在某种程度上也是统计学的创始人。”   政治算术学派的另一个代表人物是约翰·格朗特()。他以1604年伦敦教会每周一次发表的“死亡公报”为研究资料,在 1662年发表了《关于死亡公报的自然和政治观察》的论著。书中分析了60年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注。他的研究清楚地表明了统计学作为国家管理工具的重要作用。
什么是总体总体 (population)   根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。  表示考察对象的全体。又称母体。总体中每个成员称为个体。例如考察某厂生产的灯泡的使用寿命,该厂生产的所有灯泡为总体,每个灯泡为一个个体。当总体中所含个体总数是有限时,称为有限总体,否则,称为无限总体。在实际中全面了解总体的情况,往往难以办到,如不可能对所有灯泡进行试验,记录每一个灯泡的使用寿命。所以常通过观测部分个体,以获得总体的信息。   总体单位:构成总体的所有个体。
一个统计总统可以有多个指标
3. 什么是个体? 个体:总体中的每一个考察对象叫做个体。
4. 什么是样本? 研究中实际观测或调查的一部分个体称为样本(sample),研究对象的全部称为总体。为了使样本能够正确反映总体情况,对总体要有明确的规定;总体内所有观察单位必须是同质的;在抽取样本的过程中,必须遵守随机化原则;样本的观察单位还要有足够的数量。又称“子样”。按照一定的抽样规则从总体中取出的一部分个体。样本中个体的数目称为“样本容量”。
5. 什么是样本容量? 样本容量是对于你研究的总体而言的,是总体的一些抽样.比如:中国人的身高值为一个总体,你随机取一百个人的身高,这一百个人的身高数据就是总体的样本.样本的数量就是样本容量.。在假设检验里样本容量越大越好.但实际上不可能无穷大,就像你研究中国人的身高不可能把所有中国人的身高都量一量一样。
6.什么是平均数?
平均数是指在一组数据中所有数据之和再除以数据的个数。平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标。解答平均数应用题的关键在于确定“总数量”以及和总数量对应的总份数。在统计工作中,平均数(均值)和标准差是描述数据资料集中趋势和离散程度的两个最重要的测度值。 分类 算术平均数  算术平均数是指在一组数据中所有数据之和再除以数据的个数。它是反映数据集中趋势的一项指标。  把n个数的总和除以n,所得的商叫做这n个数的平均数 一般平均数  一般平均数是n个数的和除 n 如:4,5,6,7,8,9. (4+5+6+7+8+9)÷6=6.5 6.5就是它们的平均数 几何平均数  geometric mean   n个观察值连乘积的n次方根就是几何平均数。根据资料的条件不同,几何平均数分为加权和不加权之分。  公式:x=(x1*x2*......*xn)^(1/n) 调和平均数  harmonic mean   调和平均数是平均数的一种。但统计调和平均数,与数学调和平均数不同。 在数学中调和平均数与算术平均数都是独立的自成体系的。计算结果两者不相同且前者恒小于后者。 因而数学调和平均数定义为:数值倒数的平均数的倒数。但统计加权调和平均数则与之不同,它是加权算术平均数的变形,附属于算术平均数,不能单独成立体系。且计算结果与加权算术平均数完全相等。 主要是用来解决在无法掌握总体单位数(频数)的情况下,只有每组的变量值和相应的标志总量,而需要求得平均数的情况下使用的一种数据方法。  公式:n/(1/A1+1/A2+...+1/An) 加权平均数  Weighted average   加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算,若 n个数中,x1出现f1次,x2出现f2次,…,xk出现fk次,那么(x1f1 + x2f2+ ... xkfk)÷ (f1 + f2 + ... + fk) 叫做x1,x2,…,xk的加权平均数。f1,f2,…,fk是x1,x2,…,xk的权。  公式:(x1f1 + x2f2+ ... xkfk)/n,其中f1 + f2 + ... + fk=n,f1,f2,…,fk叫做权。  说明:1)“权”的英文是weight,表示数据的重要程度。即数据的权能反映数据的相对“重要程度”。  2) 平均数是加权平均数的一种特殊情况,即各项的权相等时,加权平均数就是算术平均数。平方平均数  quadratic mean   平方平均数  公式:M=[(a^2+b^2+c^2+…n^2)/n] ^ (1/2)。 指数平均数  指标概述  指数平均数[EXPMA],其构造原理是对股票收盘价进行算术平均,并根据计算结果来进行分析,用于判断价格未来走势得变动趋势。  EXPMA指标是一种趋向类指标,与平滑异同移动平均线[MACD]、平行线差指标[DMA]相比,EXPMA指标由于其计算公式中着重考虑了价格当天 [当期]行情得权重,因此在使用中可克服其他指标信号对于价格走势得滞后性。同时也在一定程度中消除了DMA指标在某些时候对于价格走势所产生得信号提前性,是一个非常有效得分析指标。
  1.EXPMA=[当日或当期收盘价-上日或上期EXPMA]/N 上日或上期EXPMA   2.首次上期EXPMA值为上期收盘价,N为天数。  3.可设置多条指标线,参数为12,50
7.什么是加权平均数?   加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算  若在一组数中,X1出现F1次,X2出现F2次,…,Xk出现Fk次,那么(X1F1 + X2F2+ ... XkFk)÷ (F1 + F2 + ... + Fk)叫做X1、X2…Xk的加权平均数。F1、F2…Fk是X1、X2…Xk的权。其中,算术平均数是加权平均数的一种特殊形式(它特殊在各项的权相等),当实际问题中,当各项权不相等时,计算平均数时就要采用加权平均数,当各项权相等时,计算平均数就要采用算数平均数。两者不可混淆。公式: 加权平均数   x拔=(x1f1 + x2f2+ ... xkfk)/n,其中f1 + f2 + ... + fk=n,f1,f2,…,fk叫做权。通过数和权的成绩来计算  要点明晰  1.在日常生活中,我们常用平均数表示一组数据的‘平均水平’。  2.在一组数据里,一个数据出现的次数称为权。  例子 你的小测成绩是80分,期末考成绩是90分,老师要计算总的平均成绩,就按照小测40%、期末成绩60%的比例来算,所以你的平均成绩是:  80×40%+90×60%=86   学校食堂吃饭,吃三碗的有 χ 人,吃两碗的有 y 人,吃一碗的 z 人。平均每人吃多少?  (3×χ + 2×y + 1×z)÷(χ + y + z)   这里x、y、z分别就是权数值,“加权”就是考虑到不同变量在总体中的比例份额。  =============================   当一组数据中的某些数重复出现几次时,那么它们的平均数的表示形式发生了一定的变化.例如,某人射击十次,其中二次射中10环,三次射中8环,四次射中7环,一次射中9环,那么他平均射中的环数为  (10×2 + 9×1 + 8×3 + 7×4 )÷10 = 8.1   这里,7,8,9,10这四个数是射击者射中的几个不同环数,但它们出现的频数不同,分别为4,3,l,2,数据的频数越大,表明它对整组数据的平均数影响越大,实际上,频数起着权衡数据的作用,称之为权数或权重,上面的平均数称为加权平均数,不难看出,各个数据的权重之和恰为10.   在加权平均数中,除了一组数据中某一个数的频数称为权重外,权重还有更广泛的含义.   比如在一些体育比赛项目中,也要用到权重的思想.比如在跳水比赛中,每个运动员除完成规定动作外,还要完成一定数量的自选动作,而自选动作的难度是不同的,两位选手由于所选动作的难度系数不同,尽管完成各自动作的质量相同,但得分也是不相同的,难度系数大的运动员得分应该高些,难度系数实际上起着权重的作用.   而普通的算术平均数的权重相等,都是1,(比如,3和5的平均数为4)也就是说它们的重要性相同,所以平均数是特殊的加权平均数.
8.什么是方差? 样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。数学上一般用E{[X-E(X)]^2}来度量随机变量X与其均值E(X)的偏离程度,称为X的方差。定义设X是一个随机变量,若E{[X-E(X)]^2}存在,则称E{[X-E(X)]^2}为X的方差,记为D(X)或DX。即D(X)=E{[X-E(X)]^2},而σ(X)=D(X)^0.5(与X有相同的量纲)称为标准差或均方差。由方差的定义可以得到以下常用计算公式:D(X)=E(X^2)-[E(X)]^2S^2=[(x1-x拔)2+(x2-x拔)^2+(x3-x拔)^2+…+(xn-x拔)^2]/n方差的几个重要性质(设一下各个方差均存在)。(1)设c是常数,则D(c)=0。(2)设X是随机变量,c是常数,则有D(cX)=(c^2)D(X)。(3)设X,Y是两个相互独立的随机变量,则D(X+Y)=D(X)+D(Y)。(4)D(X)=0的充分必要条件是X以概率为1取常数值c,即P{X=c}=1,其中E(X)=c。
9.标准差(Standard Deviation) 各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根。用σ表示。因此,标准差也是一种平均数标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差为17.08分,B组的标准差为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。标准差也被称为标准偏差,或者实验标准差。关于这个函数在EXCEL中的STDEVP函数有详细描述,EXCEL中文版里面就是用的“标准偏差”字样。但我国的中文教材等通常还是使用的是“标准差”。
10.什么是频率  随机事件在n次试验中发生m次的相对频次m/n。一般物理科学中频率指每秒中的振动次数,可以是随机的,也可以是确定性的。   在一定条件下,对所研究的对象进行观察或测验,每实现一次条件组,称为一次试验。其结果称为事件。在一次试验中,可能发生也可能不发生的事件称为随机事件。   随机事件 A发生的概率p(A)是该事件出现的可能性大小的度量。其数值在0与1之间。在一定条件下进行试验,如果事件A不可能发生,则p(A)=0;如果事件A必然发生,则p(A)=1。随着试验次数n的增大,频率接近于概率的可能性也越大,即:式中δ是任意小数值。   水文现象是复杂的自然现象,其出现的概率无法确知,只能通过统计实测水文资料中出现的频率作出推断。由于受到所依据资料的限制,总会带有一定的误差。   描述水文随机现象的随机变量X , 一般属于连续型。因此,X等于任意数x的概率是p{X=x}。水文计算中以累积频率曲线FX(x)~x来描述水文变量的统计特性。如求长江宜昌站年洪峰流量大于或等于 80000m3/s的概率p{X≥80000}=FX(80000)。  在水文计算中,一般根据实测资料通过统计分析推估水文变量的频率密度函数fX(x),再对fX(x)积分(见图),可求得水文变量累积频率函数FX(x):   水文计算中,习惯上把累积频率曲线FX(x)简称为频率曲线,fX(x)~x曲线则称为频率密度分布曲线。
11.【概率的定义】随机事件出现的可能性的量度。概率论最基本的概念之一。人们常说某人有百分之多少的把握能通过这次考试,某件事发生的可能性是多少,这都是概率的实例。■概率的频率定义 随着人们遇到问题的复杂程度的增加,等可能性逐渐暴露出它的弱点,特别是对于同一事件,可以从不同的等可能性角度算出不同的概率,从而产生了种种悖论。另一方面,随着经验的积累,人们逐渐认识到,在做大量重复试验时,随着试验次数的增加,一个事件出现的频率,总在一个固定数的附近摆动,显示一定的稳定性。R.von米泽斯把这个固定数定义为该事件的概率,这就是概率的频率定义。从理论上讲,概率的频率定义是不够严谨的。A.H.柯尔莫哥洛夫于1933年给出了概率的公理化定义。■概率的严格定义设E是随机试验,S是它的样本空间。对于E的每一事件A赋于一个实数,记为P(A),称为事件A的概率。这里P(·)是一个集合函数,P(·)要满足下列条件:(1)非负性:对于每一个事件A,有P(A)≥0;(2)规范性:对于必然事件S,有P(S)=1;(3)可列可加性:设A1,A2……是两两互不相容的事件,即对于i≠j,Ai∩Aj=φ,(i,j=1,2……),则有P(A1∪A2∪……)=P(A1)+P(A2)+…… ■概率的古典定义如果一个试验满足两条:(1)试验只有有限个基本结果;(2)试验的每个基本结果出现的可能性是一样的。这样的试验,成为古典试验。对于古典试验中的事件A,它的概率定义为:P(A)=m/n,n表示该试验中所有可能出现的基本结果的总数目。m表示事件A包含的试验基本结果数。这种定义概率的方法称为概率的古典定义。■概率的统计定义在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附近,则数值p称为事件A在该条件下发生的概率,记做P(A)=p。这个定义成为概率的统计定义。在历史上,第一个对“当试验次数n逐渐增大,频率nA稳定在其概率p上”这一论断给以严格的意义和数学证明的是早期概率论史上最重要的学者雅各布·伯努利(Jocob Bernoulli,公元1654年~1705年)。从概率的统计定义可以看到,数值p就是在该条件下刻画事件A发生可能性大小的一个数量指标。由于频率nA/n总是介于0和1之间,从概率的统计定义可知,对任意事件A,皆有0≤P(A)≤1,P(Ω)=1,P(Φ)=0。Ω、Φ分别表示必然事件(在一定条件下必然发生的事件)和不可能事件(在一定条件下必然不发生的事件)。
12.什么是变量变量(variable):说明现象某种特征的概念称为变量,在统计学中有时候也定义为可变的数量标志。具体可以分为:确定性变量:指受确定性因素影响的变量随机变量:指受随机因素影响的变量连续型变量:在一个区间内可以连续不断取值的变量离散型变量:其一切可能取值都以整数形式出现,并可以一一列举的变量
13.什么是统计量?统计量(statistic):是指用来描述样本特征的概括性数字度量,又称为样本指标。我们所要研究的主要样本指标有:样本平均数、样本方差、样本比例等。
14.什么是统计指标统计指标是指用来刻画于描述总体基本状况和各个变量分布特征的综合数量。例如,全国人口总体的基本状况和性别分布特征可用总人口数,男性人口数,女性人口数,男女性别比例,男性人口比重,女性人口比重等指标来描述。不同的统计指标所反映的内容不同,根据其内容的不同统计指标可分为基础指标和特征指标。基础指标是反映总体基本状况的指标,由总量指标和相对指标构成。特征指标是反映数据取值分布特征的指标,由三部分组成:一是反映数据取值分布集中趋势的平均指标;二是反映数据分布离散程度的变异指标;三是反映数据分布形状的偏态和峰度系数。
15.什么是抽样调查抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。
根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。在我国,习惯上将概率抽样称为抽样调查。
抽样调查有以下三个突出特点:
1、按随机原则抽选样本;
2、总体中每一个单位都有一定的概率被抽中;
3、可以用一定的概率来保证将误差控制在规定的范围之内
16.什么是普查普查,统计调查的组织形式之一。对统计总体的全部单位进行调查以搜集统计资料的工作。普查资料常被用来说明现象在一定时点上的全面情况。如人口普查就是对全国人口一一进行调查登记,规定某个特定时点(某年某月某日某时)作为全国统一的统计时点,以反映有关人口的自然和社会的各类特征。
其定义为:为特定目的而专门组织的一次性全面调查
普查的几个特点:
需要规定统一的标准时间(资料所属时间)
通常是一次性或周期性的
数据的规范化程度较高
适用于关乎于国计民生的重要数据的搜集,应用范围比较狭窄
组织普查工作必须遵循的原则:  1.必须统一规定调查资料所属的标准时点。  2.正确确定调查期限、选择登记时间。为了提高资料的准确性,一般应选择在调查对象变动较小和登记、填报较为方便的时间,并尽可能在各普查地区同时进行,力求最短时间完成;  3.规定统一的调查项目和计量单位。同种普查,各次基本项目应力求—致,以便历次普查资料的汇总和对比;  4.普查尽可能按一定周期进行,以便于研究现象的发展趋势及其规律性。
17. 什么是典型调查 从研究总体中有意识地挑选出少数具有代表性的对象进行调查,以达到了解总体的特征和本质的方法。 典型调查要求搜集大量的第一手资料,搞清所调查的典型中各方面的情况,作系统、细致的解剖,从中得出用以指导工作的结论和办法。 典型调查适用于调查总体同质性比较大的情形。 同时,它要求研究者有较丰富的经验,在划分类别、选择典型上有较大的把握 。 实施典型调查的主要步骤是 : 根据研究目的,通过多种途径了解研究对象的总体情况; 从总体中初选出备选单位,加以比较,慎重选出有较大代表性的典型; 进点(典型)调查,具体搜集资料; 分析研究资料,得出结论。
18.什么是重点调查重点调查是指在全体调查对象中选择一部分重点单位进行调查,以取得统计数据的一种非全面调查方法。由于重点单位在全体调查对象中只占一小部分,调查的标志量在总体中却占较大的比重,因而对这部分重点单位进行调查所取得的统计数据能够反映社会经济现象发展变化的基本趋势。和抽样调查不同的是,重点调查取得的数据只能反映总体的基本发展趋势,不能用以推断总体,因而也只是一种补充性的调查方法。目前主要是在一些企业集团的调查中运用。
19.什么是调和平均数调和平均数是各个标志值倒数的算数平均数的倒数,又成为倒数平均数。调和平均数作为一种独立的形式,在社会经济统计中应用场合较少。在实际工作中,当所掌握的资料无法用算数平均数直接计算时,往往是把调和平均数的计算形式作为算数平均数的形式来使用。 计算公式: H=1/(1/a+1/b+1/c+1/d+……)调和平均数可以分为简单平均数和加权平均数两种。
20.什么是中位数
中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数用Me表示。    1、定义:一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)。2、意义:反映了一组数的一般情况。    3、中位数的优缺点:中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,有时用它代表全体数据的一般水平更合适。   4、在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。   5、中位数也可表述为第50百分位数,二者等价。   6、直观印象描述:一半比“我”小,一半比“我”大。
21.什么是四分位数四分位数:将所有数值按大小顺序排列并分成四等份,处于三个分割点位置的得分就是四分位数。最小的四分位数称为下四分位数,所有数值中,有四分之一小于下四分位数,四分之三大于下四分位数。中点位置的四分位数就是中位数。最大的四分位数称为上四分位数,所有数值中,有四分之三小于上四分位数,四分之一大于上四分位数。也有叫第25百分位数、第75百分位数的。
22.什么是众数众数是一组数据中出现频数最多的那个数值,用M。表示。简单的说,就是一组数据中占比例最多的那个数。用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。当数值或被观察者没有明显次序(常发生于非数值性资料)时特别有用,由于可能无法良好定义算术平均数和中位数。例如:1,2,3,3,4的众数是3。 但是,如果有两个或两个以上个数出现次数都是最多的,那么这几个数都是这组数据的众数。 例如:1,2,2,3,3,4的众数是2和3。 还有,如果所有数据出现的次数都一样,那么这组数据没有众数。 例如:1,2,3,4,5没有众数。
23.什么是峰度和偏度峰度: 峰度(Kurtosis)是描述某变量所有取值分布形态陡缓程度的统计量。它是和正态分布相比较的。Kurtosis=0
与正态分布的陡缓程度相同。Kurtosis&0
比正态分布的高峰更加陡峭——尖顶峰Kurtosis&0
比正态分布的高峰来得平台——平顶峰计算公式:β= M_4/σ^4 偏度: 偏度(Skewness)是描述某变量取值分布对称性的统计量。Skewness=0
分布形态与正态分布偏度相同Skewness&0
正偏差数值较大,为正偏或右偏。长尾巴拖在右边。Skewness&0
负偏差数值较大,为负偏或左偏。长尾巴拖在左边。计算公式:S= (X拔-M_0)/δ Skewness 越大,分布形态偏移程度越大。
24.什么是权数在统计中,用来衡量总体中各单位标志值在总体中作用大小的数值叫权数。权数的总和一般为100或1000,现假设一个算例加以说明。平均报酬:按不加权计算(800+600+400)÷ 3 = 600元 按加权计算:按从业人员数加权(800×50+600×250+400×200)÷ 500 = 540元按各组从业人员占从业人员总人数比重加权 800×10%+600×50%+400×40%=540元从上例看,按不加权计算把不同报酬水平对总体平均报酬的影响等同起来,是不符合实际情况的。按加权方法计算考虑了不同报酬水平的人数(或比重)不同,对总体平均数的影响不同,计算结果表明600元的占50%对平均报酬影响最大,其次是400元的占40%,800元的占10%影响最小,因而平均报酬540元,是符合实际情况的。从理论上讲,权数决定指标的结构,权数如变动,绝对指标值和平均数也变动,所以权数是影响指标数值变动的一个重要因素。权数一般有两种表现形式,一是绝对数(频数)表示,另一个是用相对数(频率)表示,相对数是用绝对数计算出来的百分数(%)表示的,又称比重。平均数的大小不仅取决于总体中各单位的标志值(变量值)的大小,而且取决于各标志值出现的次数(频数),由于各标志值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。权数的权衡轻重作用是体现在各组单位数占总体单位数的比重大小上,在计算平均数和指数上得到广泛的应用。如,工业生产指数中的权数是对产品的个体指数在生产指数形成过程中的重要性进行界定的指标。零售物价指数除选用代表规格品计算个体物价指标外,还要采用零售额为权数。居民消费价格指数的权数来源于居民用于各类商品和服务项目的消费支出额以及各种商品、服务项目的实际消费支出额的构成比重,在居民消费价格指数的形成中起着权衡轻重的作用。
25. 因素分析法(Factor Analysis Approach)什么是因素分析法?   因素分析法是依据分析指标与其影响因素的关系,从数量上确定各因素对分析指标影响方向和影响程度的一种方法。因素分析法既可以全面分析各因素对某一经济指标的影响,又可以单独分析某个因素对经济指标的影响,在财务分析中应用颇为广泛。因素分析法的方法   连环替代法   它是将分析指标分解为各个可以计量的因素,并根据各个因素之间的依存关系,顺次用各因素的比较值(通常即实际值)替代基准值(通常为标准值或计划值),据以测定各因素对分析指标的影响。   例如,某一个财务指标及有关因素的关系由如下式子构成:实际指标:Po=×Bo×Co;标准指标:Ps=As×Bs×Cs;实际与标准的总差异为Po-Ps,P G 这一总差异同时受到A、B、C三个因素的影响,它们各自的影响程度可分别由以下式子计算求得:   A因素变动的影响:(Ao-As)×Bs×Cs;   B因素变动的影响;Ao×(Bo-Bs)×Cs;   C因素变动的影响:Ao×Bo×(Co-Cs)。   最后,可以将以上三大因素各自的影响数相加就应该等于总差异Po-Ps。   差额分析法   它是连环替代法的一种简化形式,是利用各个因素的比较值与基准值之间的差额,来计算各因素对分析指标的影响。   例如,企业利润总额是由三个因素影响的,其表达式为:利润总额=营业利润+投资损益±营业外收支净额,在分析去年和今年的利润变化时可以分别算出今年利润总额的变化,以及三个影响因素与去年比较时不同的变化,这样就可以了解今年利润增加或减少是主要由三个因素中的哪个因素引起的。   指标分解法   例如资产利润率,可分解为资产周转率和销售利润率的乘积。   定基替代法   分别用分析值替代标准值,测定各因素对财务指标的影响,例如标准成本的差异分析。运用因素分析法的一般程序   1、确定需要分析的指标;   2、确定影响该指标的各因素及与该指标的关系;   3、计算确定各个因素影响的程度数额。 采用因素分析法时注意的问题   1、注意因素分解的关联性;   2、因素替代的顺序性;   3、顺序替代的连环性,即计算每一个因素变动时,都是在前一次计算的基础上进行,并采用连环比较的方法确定因素变化影响结果;   4、计算结果的假定性,连环替代法计算的各因素变动的影响数,会因替代计算的顺序不同而有差别,即其计算结果只是在某种假定前提下的结果,为此,财务分析人员在具体运用此方法时,应注意力求使这种假定是合乎逻辑的假定,是具有实际经济意义的假定,这样,计算结果的假定性,就不会妨碍分析的有效性。是指确定影响因素,测量其影响程度,查明指标变动原因的一种分析方法。
26.什么是变异系数变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。  标准差与平均数的比值称为变异系数,记为C.V。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。标准变异系数是一组数据的变异指标与其平均指标之比,它是一个相对变异指标。变异系数有全距系数、平均差系数和标准差系数等。常用的是标准差系数,用CV(Coefficient of Variance)表示。 CV(Coefficient of Variance):标准差与均值的比率。
用公式表示为:CV=σ/μ
作用:反映单位均值上的离散程度,常用在两个总体均值不等的离散程度的比较上。若两个总体的均值相等,则比较标准差系数与比较标准差是等价的。变异系数又称离散系数。
27.什么是正态分布正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。
遵从正态分布的随机变量的概率规律为取
μ邻近的值的概率大
,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低
,图像是一条位于x轴上方的钟形曲线。当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。
28.什么是物价指数物价指数是反映计算期销售或购进的全部商品价格总水平比基期水平升降变动程度的相对数,通常以计算期(年度、季度或月度)与基期(某年度、季度或月度)相对比,以百分数表示。物价指数是经济指数中比较复杂的一种相对数。按包括商品种类不同,分为单项商品价格指数、商品类别指数和总指数。按采用基期的不同,分为环比物价指数(以上一期为基期)、年距环比物价指数(以上年同期为基期)、定基物价指数(和固定时期比较)。按商品的种类和流通环节区分,有工业品出厂价格指数,农副产品收购价格指数、批发物价指数、零售物价指数、服务项目价格指数、职工生活费用价格指数、工农业商品的综合比价指数。按商品流通渠道区分,又可分为国营、集市贸易等物价指数。计算物价指数除了要选择好基期和计算期外,还要选择好提供价格资料的典型地区,因为无法编制所有商品、所有市县的物价指数;要注意商品的可比性;要注意商品的代表性;要注意商品规格、等级、质量的一致性;要注意计算方法的科学性。 CPI的计算公式是 CPI=(一组固定商品按当期价格计算的价值)除以(一组固定商品按基期期价格计算的价值)乘以100。
29.什么是时间序列在统计分析中,为了反映现象随时间而发展变化的运动过程,就要进行时序分析。进行时序分析必须具备的统计资料就是时间序列。时间序列,也称时间数列或动态数列,就是将某个统计指标在不同时间上的数值,按时间先后顺序排列而成的数列。如表1。表1 辽宁省高新技术产业开发区概况()  
年末从业人员数(万人)
营业总收入(亿元)
工业总产值(亿元)
研究时间序列具有重要的作用:首先,可以描述现象发展的过程和结果;其次,可以研究现象的发展速度和发展趋势;第三,可以探索某些现象发展变化的数量规律性;第四,可以为某些现象的预测提供重要依据。一、时间序列的种类时间序列按所列统计指标数值的表现形式不同,可以分为绝对数时间序列、相对数时间序列和平均数时间序列三种。其中,绝对数时间序列是基本序列,相对数时间序列和平均数时间序列是派生序列,是根据绝对数时间序列加工计算得到的。 1.绝对数时间序列如果时间序列中所排列的指标数值是绝对数,则这个时间序列就是绝对数时间序列。如表1中的年末从业人员数时间序列、营业总收入时间序列和工业总产值时间序列就是绝对数时间序列。绝对数时间序列反映现象在各个时间达到的绝对水平及其发展变化情况。由于构成绝对数时间序列的指标所反映现象的时间状况不同,绝对数时间序列又可分为时期数列和时点数列。 (1)时期数列时期数列中各个指标数值都反映现象在一段时期内发展过程的总量或绝对水平。如表1中的营业总收入时间序列就是时期数列。其特点是: ①时期数列中的各个指标数值具有可加性。 ②时期数列中每个指标数值的大小与其时期长短有直接的关系。时期愈长,指标数值愈大,反之,则相反。这里所说的时期是指每个指标所包括的时间长度。 ③时期数列中的每个指标数值通常是通过连续登记得到的。 (2)时点数列时点数列中的每个指标数值都反映现象在某一时点(或时刻)上的状态或水平。如表1的年末从业人员数时间序列应是时点数列。其特点是: ①时点数列中的各个指标数值不具有可加性。 ②时点数列中每个指标数值的大小与其间隔长短没有直接的关系。这里所说的间隔是指两个相邻指标数值在时间上的距离。 ③时点数列中的每个指标数值通常是通过一定时期登记一次得到的。 2.相对数时间序列如果时间序列中所排列的指标数值是相对数,则这个时间序列就是相对数时间序列。相对数时间序列反映现象之间相互联系的发展过程。相对数时间序列是由绝对数时间序列派生出来的。序列中的各个指标数值不能直接相加。 3.平均数时间序列如果时间序列中所排列的指标数值是平均数,则这个时间序列就是平均数时间序列。平均数时间序列反映现象一般水平的发展趋势。平均数时间序列也是由绝对数时间序列派生出来的。序列中的各个指标数值也不能直接相加。二、编制时间序列的原则编制时间序列是为了从动态上分析说明现象的发展过程,反映现象发展变化的基本趋势和数量规律性。因此,保证时间序列中各个指标数值的可比性,就成为编制时间序列的基本原则。具体地应注意下列几点: 1.时间方面的可比性对于时期数列来说,由于数列中每个指标数值的大小与其时期长短有直接的关系,因此,应该编制时期长度一致的时期数列。但这个原则也不能绝对化,有时为了特殊的研究目的,如研究各个历史阶段某些现象的发展变化,也可将时期长度不等的指标数值编成时期数列。对于时点数列来说,由于数列中每个指标数值的大小与其间隔长短没有直接的关系,因此,时间间隔相等不是编制时点数列必须具备的条件。但是,为了更准确地反映现象的发展趋势和发展规律,应该尽可能编制时间间隔相等的时点数列。 2.指标方面的可比性同一时间序列中,按时间先后顺序排列的各个指标数值所包含的指标内涵、计算范围、空间范围、计算方法、计算价格、计量单位等各方面都必须前后一致。如果某一方面不一致,整个时间序列就不可比。这时,只有按照研究目的,以现行规定为准进行调整,才能保证各个指标数值具有可比性。
登录百度帐号推荐应用
为兴趣而生,贴吧更懂你。或}

我要回帖

更多关于 excel 列数 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信