概率论中,一个概率密度与分布函数分布函数乘以一个常数后,乘后分布函数的概率密度与分布函数函数是不是直接乘常数得到的?

当前位置: >>
概率密度和分布函数
观测数据的分析与处理随机变量及其分布:概率密度和分布函数重点: 介绍有关随机变量和概率分布的基本概念,讨论各种常见的 有实用价值的分布函数。[例]设某工厂产品中成分A的含量受不可控的随机因素影 响而有波动。工厂每2小时测量一次A的百分含量,记为x。 下表是一个时间段的数据。日期 1 2 3 4 5 1.40 1.46 1
.70 1.46 1.58 1.28 1.50 1.62 1.38 1.38 1.36 1.58 1.58 1.42 1.34 1.38 1.54 1.62 1.38 1.28 产品中成分A的百分含量数据 1.44 1.50 1.76 1.60 1.18 1.40 1.48 1.68 1.44 1.08 1.34 1.52 1.68 1.46 1.36 1.54 1.58 1.66 1.28 1.50 1.44 1.52 1.62 1.34 1.46 1.46 1.46 1.72 1.38 1.28 1.80 1.42 1.60 1.24 1.18 1.44 1.58 1.62 1.36 1.28 随机变量及其分布:概率密度和分布函数级宽或段宽?x j ? ? xb ? xa ? j(将随机变量x的整个取值范围分成有限个区段,每个级 段的取值范围即为级宽或段宽)级频数?Fj(每个级段中数据值出现的次数)相对频数或频率?f j ? ?Fj / SFSF ? ? ?Fj(将级频数被样本中数据总个数相除,相当于x取值在该 级段的概率。) 将上表数据从 x ? 1.0 到 x ? 1.9 取级宽0.1分为9级 分级频数分布图级频数0.3 0.25 0.2频率16 12 8 4 00.15 0.1 0.05 0 1 1.2 1.4 级中值 1.6 1.8级频数频率 概率密度为了使分布图有更好的泛化可以性,将相对频数除以级 宽,得到概率密度:pj ?级宽取微量:?Fj / SF ?x j??f j?x jdf p? dx概率密度p对x的曲线称为概率密度分布曲线,简称概率 分布曲线、分布曲线等。 随机变量及其分布:概率分布的数字特征不同性质事物对象具有各种不同形状的分布,为了定量 地区别各种分布的特征,通常采用的一组判别指标,称 为分布的数字特征。[1]算术平均值 总体:? ? ? ? ? pi xi 离散 , ? ? ? ? pxdx 连续 ? ?一阶原点矩(随机变量取值可能 性最大的位置)样本:x??xi ?1nin?n??? ? ??0 1一阶原点矩的 样本估计值 随机变量及其分布:概率分布的数字特征[2]方差总体:2 ? ? ? ? ? 2 ? ? N? f jxj ? ? ? ? f jxj ? ? ? ? j ? ?? ? ? j 2 ? N ? N ? 1? ? 2 ? 2 ? 2 ? ? px dx ? ? pxdx ? ?离散 , 连续二阶中心矩(随机变量的变异程度)??2 s 样本: ??? x ? x ?i ?1 inn ?1?n? x ? ? ? xi ?2 i i2 n ?? ? ??? ? ? ?2 ? ? 2n ? n ? 1?二阶中心矩的 样本估计值 随机变量及其分布:概率分布的数字特征[3]偏斜度? ? 3? f x ? ? ? ?/ N ? ?? j ? j ? ?? ? ? j 3 3 ? ? ?2 2 ? ? f j ? xj ? ? ? / N ? ? 总体: ? ? ? j ? ? 3 ? p x ? ? dx ? ? ? ? ?3 ? 3 ? 2 2 p x ? ? d x ? ? ? ? ?三阶中心矩和 二阶中心矩的 3/2次幂的商(曲线偏离对称的程度)??样本:?3 ?? ? xi ? x ?3/n2? ? ? xi ? x ? ? ? n ?? ? ? ?3 2n ?? ? ??? ? ? ?3 ??3? ?2 ?3 2样本估计值
随机变量及其分布:概率分布的数字特征[4]峭度或峰态? ? 4? f x ? ? ? ?/ N ? ?? j ? j ? ?? ? ? j 4 ? 2 2 ? f j ? xj ? ? ? ? ? ? ? j ? ? ? ? ? N ? ? ? ? ? ? ? ? 4 ? p x ? ? dx ? ? ? ?4 ? ? 2 2 ? ? p ? x ? ? ? dx ? ?总体:四阶中心矩和二阶 中心矩平方的商(一阶原点矩附近的斜率, 和偏离后斜率的变化率)???4 ? 样本:? ? xi ? x ? / n4 i? ? ? xi ? x ?2 ? ? i ? ? ? n ? ? ? ?2n ?? ? ??? ? ? ?4 ??4 2 ? ?2 ?样本估计值
随机变量及其分布:离散型随机变量的概率分布客观世界很多随机过程经分析后可以用某种数学模型表 示。不同的物质现象有可能用类似的模型描述。 重点:介绍若干重要的随机分布模型。 离散均匀分布 二项分布 多项分布 负二项分布 几何分布 超几何分布 扩充几何分布 泊桑分布 离散均匀分布分布模型条件: (1)每次试验可以有k种结果: x1 , x2 , , xk (2)每种结果出现的概率均相等。 1 数学模型: u ? k ? ? , x ? x1 , x2 , , xk k 均匀分布的数字特征:2 k k ? 1? ? 1 2 ? ? ? ? ? ? E ? x ? ? ? ? ? ?u ? k ?? x j ? ? ? ? ? ? ? x j ? ? ? ? ? ? ? ? k j ?1 12 2 21 k k ?1 ? ? E ? x? ? ?u ? k ? x j ? ? x j ? k j ?1 2 j ?1k?3 ? 00.6 ? 3k ? 7 ? 4 ? 2? ?4 ? 4 ? 2 ? k ? ? x j ? ? ? / ?? ? x j ? ? ? ? ? 2 ?2 k ? 1? j ?1 j ? 1 ? ? ?k k 2 2 二项分布分布模型条件:(1)设试验系由n次观测组成。 (2)每次观测只有“是”和“非”两种可能的结果出现。 ( 3 )观测结果中出现“是”的概率为常数 p ,而出现 “非”的概率为q=1-p。(4)每一次观测均为独立的,即每次观测的结果不受其它任何一次观测的影响。 二项分布在n次观测中“是”出现x次的概率呈二项分布,模型:b ? n, p ? ? C ? n x ? p ?1 ? p ?xn? x? n? x n! n? x n? x x ? ? ? p ?1 ? p ? ? p ?1 ? p ? x !? n ? x ? ! ? x?x ? 0,1, 2, ,nC(n|x)表示组合数,即从n个事物中拿出x个的方法数. 二项分布二项分布的数字特征:x ? z1 ? z2 ?总体平均值? zn其中 z i 可以是0或1,表示“非”或 “是”。对 z i 的方差i? n ? ? ? E ? x ? ? E ? ? zi ? ? E ? z1 ? ? E ? z2 ? ? ? i ?1 ?2 2? E ? zn ? ? p ?? ? z2n? p ? np总体的方差为? 2 ? ? z2 ? ? z2 ?1 2? z2 ? E ?? zi ? E ? zi ? ? ? ? E ?? zi ? p ? ?? E ? zi2 ? ? 2 pE ? zi ? ? p 2 ? p ?1 ? p ? ? ? ? ? ? E ? zi2 ? ? p 2 ? ?1 ? p ?? 0 ? ? p ?1? ? p 22 2? np ?1 ? p ??3 ??1 ? 2 p ? np ?1 ? p ?1 ? 6 p ?1 ? p ? np ?1 ? p ??4 ? 3 ? 二项分布[ 例] 已知某厂生产某 A产品的合格率75%,现进行一试验,随机地检 查3个产品,看它是否合格。定义不合格产品为“是”,则试验结果为 “是”的次数x作为随机变量,可取:0,1,2,3中一个值。 多项分布分布模型条件(二项分布的一种扩充模型 ):(1)每次观测可以有k种可能的结果出现: r 1 , r2 , 结果都相互排斥。, rk。,而各种(2)各种结果出现的概率分别为常数: p1 ,p2 ,, pk(3)每一次观测均为独立,即每次观测的结果不受其他任何一次观测的影响。 多项分布x1 次 r1, x2 次 r2,…,xk 次 rk 的概 则n次试验的结果,出现:率系多项分布,表示为:m ? x1 ,? C ? n x1 , x2 ,, p1 ,x2 , xk ? p1x1 p2, pk , n ?pkxkn! x2 ? p1x1 p2 x1 ! x2 ! xk !pkxk 负二项分布分布模型条件: (条件与二项试验相仿,考虑问题的角度相反 )(1)由多次独立观测构成的试验。(2)每次观测只有“是”和“非”两种可能的结果出现。(3)结果为“是”的概率为常数p。得到k次“是”所需的观测次数x的概率系负二项分布:nb ? k , p ? ? C ? x ? 1? ? k ? 1? p ?1 ? p ?k??x?kx ? 1?! ? x ?k ? p k ?1 ? p ? ? k ? 1?!? x ? k ?!, x ? k , k ? 1, k ? 2, 负二项分布[例] 由统计知道某药剂的有效率为 60%,将该药剂用于 一组病人。当用到第7名病人时,累计有效的病人数增加 到5名的概率为多少?解:除了最后一次按题意必须成功之外,其余(7-1)次中有(5-1)次成功的方式共有 C ? 6 4 ? 种,因此,满足要 求的概率为:C ? 7 ? 1? ? 5 ? 1? ? 0.6 ? ? 0.4 ?5??7 ?5? 0.1866 负二项分布负二项分布的数字特征为:k ?? pk ?1 ? p ? ? ? p22?3 ??2 ? p? k ?1 ? p ?6 ?1 ? p ? ? p 2 ?4 ? 3 ? 1? p 几何分布这是负二项分布当 k ? 1 时的一个特例,即:得到第一次 “是”所需要的试验次数为x时的概率。设,出现“是” 的概率为p,几何分布的模型描述为:g ? p ? ? p ?1 ? p ?几何分布的数字特征为:x ?1, x ? 1, 2,3,??1 p?2 ?1? p p22? p ?3 ? 1? p9 ?1 ? p ? ? p 2 ?4 ? 1? p 几何分布[例] 由统计结果已知某生产过程平均每 100件产品中有 1 件废品。随机检查到第5件产品,发现废品的概率为多少? 解:这是几何分布, ,则x ? 5, p ? 0.01g ? 5;0.01? ? ? 0.01?? 0.99 ? ? 0.00964 超几何分布是二项分布的一种变型,其条件为:(1)对象为有限的N个物体,其中k件为“是”,N-k为“非”。 ( 2 )从 N 个物件中,随机地逐个取出 n 件,且每次取出后没有替换。则在n件中出现“是”的次数x系超几何分布,其模型描述为:h ? N , n, k ? ?C ?k x?C ? N ? k ? ?n ? x? C ? N n???k !? N ? k ?!n !? N ? n ?! ? x !? k ? x ?!? n ? x ?!? N ? k ? n ? x ?! N ! 超几何分布[例] 某车间生产的元件按40个装箱后进行质量检验,其步骤为:从 每箱随机检查5个元件,若出现二等品,则把该箱退回车间返装。现 若车间采取每40个元件中允许有3个二等品的质量控制标准,则返装 的概率p为多少?解:用超几何分布模型计算:N ? 40, k ? 3, n ? 5p ? ? h ? 40,5,3? ? C ? 3 1? C ? 37 4 ? ? C ? 3 2 ? C ? 37 3? ? C ? 3 3? C ? 37 2 ? C ? 40 5 ?i ?1 3? 0.3376 超几何分布超几何分布的数字特征:nk ?? ? np N N ?n ?2 ? np ?1 ? p ? N ?1?3 ?1? 2 p np ?1 ? p ?N ? 1 N ? 2n N ?n N ?2N ? 1? r ? ?4 ? np ?1 ? p ?? N ? n ?? N ? 2 ?? N ? 3? ?p ? k / N ? ?r ? N ? N ? 1? ? 6n ? N ? n ? ? 3 p ?1 ? p ? t ? 2 2 t ? N n ? 2 ? Nn ? 6n ? N ? n ? ? ? ? 扩充几何分布将超几何分布扩充到以下条件:(1)全体为有限的N个物体,可分为m类: 在N中分别含k1 , k2 ,, km件。A1, A2 ,, Am,它们(2)从N物件中,随机地逐个取出n件,且每次取出后不再替换,则得到 x1个 A1类,x2 个 A2 类,…,xm个 Am 类物件的概率为 扩充超几何分布,其模型为:eh ? x1 ,m i ?1, N , n, k1 ,? xi ? ? ki ?, km ? ?? xm ? kmC ? k1 x1 ?n ? ? xi ? x1 ? N ? ? ki ? k1 ?i ?1 mC ? N n?C ? km xm ? 泊桑分布这是一种常见的重要离散分布,其条件是:(1)已知某种事件在一定时间区段内出现的平均次数为 (2)这种事件可能出现的次数远大于?。?。(3)该事件每次出现均为独立。(4)该事件出现的次数仅与时间区段长度有关,而与区段外这种事 件出现的次数无关。则在某个给定的时间区段内,该事件出现x次的概率为泊桑分布,其模型描述为:exp ? ? ? ? ? x ps ? ? ? ? , x ? 0,1, 2, x! [例] 1910年Rutherford和Geiger在镤放射源前的小屏幕上记录? 粒子 每分钟撞击次数x的频数列于下表。x每分钟撞击次数 0 1 2 3 4 5 6 7 8 9 10 11 总计f ? x?观测到的频数 57 203 383 525 535 408 273 139 45 27 10 6 2608xf ? x ?撞击次数 0 203 766 40
243 100 66 10092ps ? x ?按泊桑分布计算 的频数 54 211 407 526 508 394 254 140 68 29 11 6 2608 [例] 1910年Rutherford和Geiger在镤放射源前的小屏幕上记录? 粒子 每分钟撞击次数x的频数列于下表。解:考虑到不太长的时期内,? 粒子放出的平均次数为常数,每个 粒子的放出可认为独立,且放出次数只与时间有关,故可假设符合 泊桑分布。 首先计算 ? 粒子放出的平均次数:xf ? x ? 10092 ? ?? ? ? 3.87 ? f ? x ? 2608则泊桑分布模型:exp ? ?3.87 ?? 3.87 ? ps ?3.87 ? ? x!计算不同xx 值时的频数列于表,可见与实际观测值非常接近。 泊桑分布泊桑分布的数字特征:exp ? ? ? ? ? x ? exp ? ? ? ? ? x E ? x? ? ? x ?? x x! x! x ?0 x ?1??3 ?1? ??x ?1?exp ? ? ? ? ? x ?1? x ? 1?!?? ?y ?0?exp ? ? ? ? ? y y!?1??? 2 ? E ? x 2 ? x ? ? ? ? ? 2 ? E ? x ? x ? 1? ? ? ? ? ? 2exp ? ? ? ? ? x ? ? x ? x ? 1? ? ? ? ?2 x! x ?0? x?2 exp ? ? ? ? ? ? ?2? ? ? ? ?2 ? x ? 2 ?! x?2 ??4 ? 3 ???? 泊桑分布与二项分布之间的关系由二项分布的数字特征得:? ? np ? p ?由二项分布模型得:?nn! n? x x b ? n, p ? ? p ?1 ? p ? x !? n ? x ? ! ? ? n ? n ? 1? n ? n ? 1? x!? n ? x ? 1? p x?1 ? p ?xn? x? n ? x ? 1? ? ? ? ? ? x! ?n?x? ?? ?1 ? ? ? n?nn? x? 1? ? ?1 ? ? ? n?? x ?1 ? ? ? ? ? ?1 ? ? ?1 ? ? n ? x! ? n ? ?? ?? ?1 ? ? ? n??x 泊桑分布与二项分布之间的关系当n ??时,上式有b ? n, p ? ? limn?????x ??1 ? ? x! ? n ???nn ? ? ? ? ? ?? ? ? ? ? n 1 ? ?? ? ? ? 1 ? ? ? ? lim ?1 ? ? 又因为: lim n ?? n ? ? n?? ? ? n ?? ? ? ? ? ? ? ?? ? ? ? ? ?? ? ? ? ? ? ?? exp ? ? ? ?所以得: b ? n, p ? ?n ?? ? ? np?xx!exp ? ?? ? ? ps ? ? ?但是只有当 p ? 0 时, ?? np才为有限值,所以应写为:b ? n, p ? ? ps ? ? ?p ?0 n ?? ? ? np 几 种 离 散 分 布 模 型 之 间 的 关 系 随机变量及其分布:连续型随机变量的概率分布当随机变量可以在数轴的一个连续区段内取任意值,则 需要用连续型概率分布模型。 重点:介绍连续型随机变量若干重要的分布模型。 连续均匀分布 指数分布 Gamma分布 Beta分布 Weibull分布 Chi平方分布 连续均匀分布(矩形分布)特点:在一定范围内(从上限a到下限b),事件出现的概 率密度q为常数,而在该范围之外为0。? 1 ? 概率密度的数学模型: q ? r ? a, b ? ? ? b ? a , ? ? 0 a? x?b other 连续均匀分布(矩形分布)?x?a ?b ? a a ? x ? b x 对x积分后得到分布函数Q:Q ? x ? ? ? q ? t ? dt ? ? x?a ? 0 , -? ? 1 b?x ? ? 连续均匀分布(矩形分布)矩形分布的数字特征:a?b ?? 2 b ? a? ? ? ?2 2?3 ? 0 ? 4 ? 1.812 指数分布适用于描述出现某事件所需等待时间的概率分布。 (例如设备从开始运行到出现故障的延续时间。) 数学形式可在以下假设条件下引出: (1)在任一时间段 ? ta , tb ? 内,事件发生的概率仅与时间段 的长度 ?tb ? ta ? 有关,而与时间的起点 t a 或终点 tb 无关。(2)在一小段时间 ?t, t ? ?t ? 内,事件发生的概率 r ? ?t ?近似地正比于时间段长 ?t ,即r ??t ? ? ??t 。(3)在不相重叠的各时间段内,事件的发生是独立的。 指数分布将不发生事件的时间段(0,x)分成n等份:? 1 ? ?1 2 ? ? 0, x ? , ? x, x ? , ? n ? ?n n ?n ?1? n ?1 ? ,? x, x ? ? n ?各时间段内事件系独立发生,又令p为不发生事件的概率:? i i ?1 ? P ? t ? x ? ? ? p ? x, x? n ? ?n i ?0t为发生事件的时刻根据条件(1)和(2):i ? x ? i i ?1 ? ? i ?1 p ? x, x ? ? 1? ? ? x ? x ? ? 1? ? n ? n ? n ?n ? n?? xx ? 为发生事件的概率 nn ? ? ? ? x ? ? ?? n x ? ?? 1 ? ? ? P ? t ? x ? ? ?1 ? ? ? ? ?1 ? ? ? ? n n ? ? ? ? ? ? ? ?? ? x ? ? ? ? ? ?n ? ? exp ? ?? x ? 指数分布因此,在 t ? x 时发生事件的概率为:Q ? x ? ? 1 ? P ?t ? x ? ? 1? exp ? ?? x ?这是分布函数,相应的密度函数为分布函数的导数:dQ ? x ? ?? exp ? ?? x ? 0 ? x q ? x? ? ? ex ? ? ? ? ? , x?0 dx 0 ? 其中 ? 为寿命参数。(这是和离散型的几何分布相对应的一种连续分布模型。它在设备和元件的寿命问题中有广泛的应用,实际上是可靠性研究领域中的一种标准分布。) 指数分布当 ? ? 0.5 时,指数 分布的密度函数当 ? ? 0.5 时,指数 分布的分布函数 指数分布指数分布的数字特征为:??21?1? ??3 ? 2 ?4 ? 9?2 指数分布[ 例] 某设备采用一元件,它的故障时间 T遵循指数分布, 并已测得参数为 ? ? 0.2 。现将该种元件分别用于5台设备 中,试问:8年以后,至少还有2个该种元件仍在工作着的 概率为多少? 解:根据指数分布,8年后该元件仍在工作着的概率为:P ?T ? 8? ? ? 0.2exp ? ?0.2t ? dt ? exp ? ?1.6 ? ? 0.28 ?令x表示8年后仍在工作着的元件数,由于这是离散性问题 ,所以采用二项分布:P ? x ? 2 ? ? ? b ?5,0.2 ? ? 1 ? ? b ?5,0.2 ? ? 1 ? 0.7373 ? 0.2627x ?2 x ?0 5 1 Gamma分布(第三类Pearson分布)设在时间区段 ? 0, T ?内,事件的平均出现率为每单位时间? 次。Gamma分布系用来描述出现r次事件所需要的时间长 度x的概率分布。 数学模型:[1] 将时间区段?0,T ?离散化,把它等分为n个子区段,长度均为T/n。取n足够大,使每个区段出现1次以上事件的概率可以忽略不计。 又设各子区段中事件的出现均为独立。因此,在任一子区段出现 一个事件的概率为:T pn ? ? n[2] 出现r次事件所需要的时间区段个数k的概率可以用负二项分布描 述为: ? k ? 1? k ?rr nb ? r , pn ? ? ? p ? n ?1 ? pn ? ? r ? 1? 数学模型:[3] 得到x的密度函数为:r nb ? r , pn ? k ? 1?! pn 1 ? pn ? ? ? q ? x ? ? lim ? lim n ?? n ?? ? k ? r ? !? r ? 1? ! T /n T /nr nx ?r Tk ?r? nx ? ? ?T ? ? ?T ? T ? 1 ! ? ? ? ? ?1 ? ? x ? k ? k ? nx / T T n ? ? n ? ? ? ? q ? x ? ? lim n n ?? ? nx T /n ? T ? r ! r ? 1 ! ? ? ? ? p ? ? n ?T ? n ? nx ?? nx ? ? nx ? nx ? 1 ? 2 ? r ? 1 r ?1 ? ?? ? ? ? T T T ? ?T ? T ? ?? ? ? ? r ?T ? ? lim ? ? ? ?1 ? ? n ?? n ? ? r ? 1?! ?n? ? T ?? T? ? T? ? nx x ? x ? 2 x ? r ? 1 ? ? ? ?? ? ? ? n ?? n? ? n ? r ? ?T ? T ? ? lim ? ?1 ? ? n ?? n ? ? r ? 1?! ? ?? r ? 1?!?rx r ?1 exp ? ?? x ? Gamma分布考虑Gamma函数:? ? r ? ? ? x r ?1 exp ? ? x ? dx 当r为非负整数时0 ?? ? r ? ? ? r ?1?!q ? x? ?? r ?1?!?rxr ?1exp ? ?? x ? ???r ??rx r ?1 exp ? ?? x ?出现每次事件平均所需时间? ? 1/ ?? x r ?1 exp ? ? x / ? ? x?0 ? r q ? x ? ? gm2 ? r , ? ? ? ? , ? ? ?r ? x?0 ? 0 ?? ?1单参数 Gamma分布 Gamma分布二参数Gamma分布的数字特征为:? ? r? ? ? r?2 2?3 ? 2 / ? r???4 ? 3 ? ?6 / r? ? 当r=1时,单参数Gamma分布 就是 ? ? 1 的指数分布。单 参 数设有r个独立的随机变量 x1 , , xi , 符合的 ? ? 1 指数分布, 定义另一随机变量: y ? x1 ? ? xr 则y将符合单参数Gamma分布。, xr 都Gamma 分 布 Beta分布(第一类Pearson分布 )最简单的二参数形式的密度函数为( r和s是二参数 ): s ?1 r ?1 ? 0 ? x ? 1, r ? 0, s ? 0 ?bt 2 ? r , s ? ? Kx ?1 ? x ? q ? x? ? ? , x ? 0, x ? 1, r ? 0, s ? 0 0 ? ?1 K? ? B ? r, s ? 1r ?1 x ? ?1 ? x ? 0 1 s ?1dx? ?r ? s? ? ??r ? ??s?二参数Beta分布的数字特征: r rs 2 ?? ? ?r?s 2? s ? r ? t ?1 ?3 ? t?2 rs t ?r?st ? t ? 1?2?4 ?3rst ? t ? 1? ? 6 ? t ? 1? ? r 2 ? rs ? s 2 ? rs ? t ? 2 ?? t ? 3? Weibull分布? ?广泛应用于寿命检验,可 靠性研究等方面的模型。最常用的是它最简单的二参数形式密度函数:k k ?1 k ? x ? 0, k ? 0, s ? 0 wb 2 k , s ? x exp ? x / s ? ? ? ? ? k q ? x? ? ? , s x?0 ? 0 ?k为标度参数,s为形状参数。二参数Weibull分布的数字特征为:? ? s? ? ? 1? k ?3 ? ? 3 ? 3? 2?1 ? 2?13?1 ? ? ?2 3/ 2 1? 2 ? s 2 ?? ? ? 1? ? ? 2 ? ? 1? ? k k? ?2 ? ?? ??1 ??? ????2????4 ?? 4 ? 4? 3?1 ? 6? 2?12 ? 3?14??2??2 2 1??i ? ? i ? ? ? ? 1? , i ? 1, 2,3, 4 ?k ? s ?1q ? x ? ? wb1? k ? ? kx k ?1 exp ? ? x k ?单 参 数Weibull 分 布 的 密 度 函 数 Chi分布Gamma分布的另一种特殊情况是当:r ? ? / 2, ? ? 2时称为Chi平方分布。它是假设检验的重要工具,其密度函 数为: 1 2 q ? x? ? ? ? x? ? ? /2 x? / 2?1 exp ? ? x / 2 ? 2 ? ?? / 2 ?? 称为自由度(它的含义将在以后章节中介绍)。Chi平方分布的数字特征为: ? ??? 2 ? 2? 几种分布之间的关系 几种连续和离散分布之间的关系离散对象 单 次 事 件 连续对象几何分布 出现一次事件需要测试 的次数指数分布 出现一次事件需要延续的 时间长度多 次 事 件负二项分布 出现k次事件需要测试的 次数xGamma分布 出现r次事件需要延续的 时间长度x 随机变量及其分布:正态分布这是连续型随机变量的一种最常见分布模型。在很多实 际情况下可以用它描述或近似地描述随机变量的分布。当观测数据中包含的误差纯属随机性,则这种随机变量 的概率密度函数一般可用正态分布模型描述。随机误差 的特点: (1)大小相等而符号相反的误差出现的概率密度相同。 (2)概率密度随误差的绝对值增大而单调下降。 (3)绝对值很大的误差出现的概率密度趋于零。 正态分布正态分布的密度函数为:2 ? ? x ? ? ? ? 1 q ? x ? ? n ? ? , ? ? ? exp ? ? ? 2 ? ? 2 ? ? 2? ? ? h 2 2 ? exp ?h ? x ? ? ????? 2 ? 和 ? 分别表示观测数据总体平均值和标准差。 正态分布密度函数曲线的位置和形状决定于 ? 和 ? 两个 参数,可以简单地表示为: x ? N ? ? ,? ?h?1(精确度指数) 正 态 分 布 曲 线 正态分布根据误差定义? ? x?? 只包含随机因素影响的观测数据,? 为随机误差。得:? ?2 ? h 1 q ? ? ? ? n ?? ;? ? ? exp ? ? 2 ? ? exp ? ?h2? 2 ? ? 2? ? ? 2? ?这就是随机误差的概率密度函数,或称随机误差的正态分 布。因为它们的形状只决定于单个参数 ?,所以表示为:? ? N ? 0,? ?又称其为Gauss误差分布概率方程。 随 机 误 差 的 正 态 分 布 标准正态分布引入一个新的随机变量: ? x?? z? ? ? ? 得: q? z? ? n?z?? z2 ? 1 ? exp ? ? ? 2? ? 2?z ? N ? 0,1? 标准正态分布有下列性质(1) z ? 0 时, q ? z ? ? 1/ 2? ,为概率密度最大位置。 (2) z 从正负两方面离开0后,概率密度q ? z ? 的值都下降。 (3)密度曲线对 z ? 0 垂直线对称, q ? a ? ? q ? ?a ? 。(4)在 z ? 1 和 z ? ?1处各有一个变凹点。(5)在 z ? a 和 z ? b 之间,密度曲线下的面积表示 z 取值 b 1 2 在区间 ? a, b ? 的概率,即: P ? a ? x ? b ? ? exp ? z / 2 ?dx ? ? 2? a (6)从 z ? ?? 到 z ? ? ,曲线下的面积为1.0。 (7)正态分布的数字特征为: ? ? 0,? ? 1,?3 ? 0,?4 ? 3 (8) 3? 规则: P ? ?3? ? z ? 3? ? ? 0.9973 重要特性设x1 , x2 ,, xn 为n个具有正态分布的随机变量,它们的2 , ?n 和 ?12 ,? 2 , 2 ,? n?1 , ?2 , 总体平均值和方差 分别为:则由 x1 , x2 ,, xn 线性组合而构成的随机变量 y ? a1x1 ? a2 x2 ? ? an xn也将具有正态分布。 且它的总体平均值为:? y ? a1?1 ? a2 ?2 ?2 2 2 方差为: ? y ? a12?12 ? a2 ?2 ? 2 2 ? an ?n? an ?n正态分布的重现性。可以证明:泊桑分布和Chi平方分布也具有重现性。 正态分布和其他分布的关系对于具有 b ? n, p ? 二项分布的随机变量x,当 n ?? 时, 它经变换后的变量:y? x ? np np ?1 ? p ?将遵循标准正态分布,即 y ? z ? N ? 0,1?。对于Gamma分布,在r值逐渐增大后,将趋于正态分布。例如 r ? 100,设? ?1,则Gamma分布的数字特征: ?3 ? 0.2, ?4 ? 3.06 和正态分布的数字特征已非常接近。 正态分布判断过程测量变量:(1)平均值附近出现的概率最大。(2)离平均值正负两方面偏差出现的概率差不多。 (3)很大的偏差出现的概率很小。 如果:? 3 ? 0.2 ? 4 ? 3 ? 0.3则可以满意地用正态分布。 对数正态分布对数正态分布 是描 述不对称分布最重 要的一种模型:2 ? ? ln x ? ? ? ? ? ? 1 ?, 0 ? x ? ? q ? x? ? exp ? ? 2 2? ? ? ? 2? ? ? ? ? E ? ln ? x ? ?? 2 ? Var ? ln ? x ? ?对数正态分布的数字特征: ? ?2 ? ? ? exp ? ? ? ? 2 ? ? ? 2 ? exp ? 2? ? ? 2 exp ? ? 2 ? ? 1 ? ? ???若x为具有对数正态分布的随机变量,则 y ? ln ? x ? 将是一 个具有正态分布的随机变量。 对 数 正 态 分 布 的 密 度 函 数 随机变量的函数设x和y是两个随机变量,它们同时取某两个值时的概率 j ? x, y ? 称为x和y的联合概率分布函数。 若x和y为离散型随机变量,在二维空间x-y中任一区域A上 取值,如果: (1)对所有的 ? x, y ? ,函数值 j ? x, y ? ? 0 。 (2) ?? j ? x, y ? ? 1.0 。(3)x和y在区域A上概率为:xyP? ? A ? ? x, y ?? ? ? ?? j ? x, y ?A则 j ? x, y ? 是x和y的联合概率密度。 随机变量的函数若x和y为连续型随机变量,在二维空间x-y中任一区间A取值,如果: (1)对所有的 ? x, y ? ,函数值 j ? x, y ? ? 0 。 (2) ?? ?? ??? j ? x, y ? dxdy ? 1.0?。(3)x和y在区域A上概率为:P? ? A ? ? x, y ?? ? ? ?? j ? x, y ? dxdy ? 1.0A则 j ? x, y ? 是x和y的联合概率密度。 随机变量的函数一个或多个随机变量的函数的概率分布: 有离散型随机变量x的概率分布为 f ? x ? ,而 y ? u ? x ? 表示 x和y之间“一对一”的函数变换关系,且 x ? w? y ? 示的x值。则y的概率分布为: 为用y表g ? y? ? P ? ? x ? w ? y ?? ?? f ? ? w ? y ?? ? 随机变量的函数一个或多个随机变量的函数的概率分布: 连续型随机变量x的概率密度分布为 f ? x ? ,而 y ? u ? x ? 表 示x和y之间“一对一”的函数变换关系,且x ? w? y ? 为用y表示的x值。则y取值在? a, b ? 区间内的概率分布为:P ?a ? y ? b? ? P ? ? w ? a ? ? x ? w ?b ?? ?w? b ??w? a ??dx f ? x ? dx ? ? f ? w y ? ? ? ? ? dy dy ? ? g ? y ?dya abb由此可知y的概率密度函数为:? dx ? g ? y? ? f ? ? w ? y ?? ? ? dy ? ? ?
中公考研辅导老师为考生整理了【概率论与数理统计-分布函数、分 布律和概率密度部分的知识点的讲解和习题】 ,同时可以为大家提供 名师考研数学视频、考研数学复习...概率密度函数与分布函数的Matlab作图_高等教育_教育专区。正态分布,二项分布,泊松分布的分布律与分布函数绘图 概率密度函数与分布函数的 Matlab 作图 1、二项分布...中公考研辅导老师为考生整理了【概率论与数理统计-分布函数、分 布律和概率密度知识点讲解和习题】 ,同时可以为大家提供名师考研 数学视频、考研数学复习资料、考研...统计图及概率密度与分布函数作图_数学_自然科学_专业资料。统计图及概率密度与分布函数作图 统计学原理大连民族学院 数学实验报告 课程: 实验题目: 系别: 专业: 姓...正态分布的概率密度、分布函数、数学期望与方差_数学_自然科学_专业资料。正态分布的概率密度、分布函数、数学期望与方差 概率论与数理统计习题解答 第二章随机变量...matlab 画分布函数和概率密度函数作者:独闲居士 Matlab 工具箱命令汇总 学习 数表Ⅰ-1 概率密度函数 函数名 对应分布的概率密度函数 betapdf 贝塔分布的概率密度...概率密度、分布函数和上分位点的数值计算_数学_自然科学_专业资料。数理统计 概率密度、分布函数和上分位点的数值计算大连民族学院 数学实验报告 课程: 实验题目: ...假设随机变量X的概率密度f(x)是偶函数,分布函数为F(x),则 A.F(x)是偶函数.B.F(x)是奇函数.C.F(x)+F(-x)=1.D.2F(x)-F(-x)=1.正确答案及...4 第一章 分布函数的定义及性质 ...目录引言 ......的概率分布情况则由密度函数的积分来描述,还有连续取 值而非连续型(即密度函数不存在)或混合型,则用...累积分布函数_数学_自然科学_专业资料。累积分布函数给出与某个分布相关联的累积概率。更确切地说,累积分布函数 (CDF) 给出了 概率密度函数下的面积(直至您指定...
All rights reserved Powered by
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。}

我要回帖

更多关于 概率密度和分布函数 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信