如何计算KS检验中的p-p value 计算

点击联系发帖人 时间：2017-08-12 04:42

p value如何计算

假设检验p-value，FDR，q-value
一、p-value相关
单个假设检验中主要依靠p值(或统计量t)做出是否拒绝零假设H0的决定：p-value和预先设定的检验水准alpha做对比，如果p-value小于等于alpha，拒绝原假设，否则不拒绝原假设。
&1.&p-value：表征了在原假设成立的条件下，重复进行当前的试验，获得现有统计量t及其更极端情况的概率。
给定检验水准alpha时，可得出对应的拒绝域；根据当前试验，可以计算出p-value。当p-value越小时，表示此时试验得到的统计量t越落在拒绝域。因此基于p-value的结果等价于基于t值的结果。因此，p-value越小，拒绝原假设的信心越大。
&3. 假阳性率：false positive rate,
FPR.检验水准alpha给出了事先犯I-型错误的最大概率。
二、多重假设检验和总体错误率
在进行多重假设检验时，每个单独的假设都具有其本身的I型错误。在这种情况下，如果不进行任何的控制，犯I-型错误的概率会随着假设检验的个数而迅速增加。
多重假设检验中，广泛使用的错误控制指标是总体错误率（family-wise error
rate,FWER）,即至少出现一次错误地拒绝真实H0的可能性；FWER小于等于alpha。而研究者更关心的是能否尽量多地识别出差异表达的基因，并且能够容忍和允许总的拒绝中发生少量的错误识别，称为错误发现false
discovery。即需要在错误发现和总的拒绝次数R之间寻找一种平衡，即在检验出尽可能多的候选变量的同时将错误发现率控制在一个可以接受的范围。
&2. 错误发现率(False Discovery
Rate,FDR)，表示了在所有R次拒绝中错误发现的期望比例。错误发现率和假阳性率之间有着本质的差别。错误发现率将范围限定在总的拒绝次数中；而假阳性率则针对所有变量数而言。
给定FDR的控制水平alpha，多重假设检验次数M，通过求得拒绝H0的次数N，可得出多重检验M次中，有多少次是被错误识别的（=alpha
N）。Benjamini和Hochberg给出了一个基于p-value的逐步向下控制程序，用于求出拒绝H0的次数N的值。并且证明在BH控制下，FDR
小于等于 alpha。
三、pFDR和q值
pFDR阳性错误拒绝率，是基于至少拒绝一个H0的事实。经过一系列的推导，pFDR的实际意义是，在pFDR错误率控制下，当拒绝一个H0时，该假设为真实的概率；pFDR反应了已经在拒绝H0的情况下H0
= 0的概率。可以认为pFDR是贝叶斯后验p值。
按照和p-value类似的定义，Storey给出了q-value的定义。
&2. q-value量化了在观察统计量T =
t时，拒绝H0所犯的最小pFDR。p-value的定义基于H0=0的条件而量化T属于Talpha的概率，显然q值是p值定义的一个逆过程，q值是基于T属于Talpha的条件而量化H0=0的概率。
和BH控制不同，q值和pFDR正好相反，即通过选定的拒绝域Talpha去估计对应的q值，当q小于等于alpha时，可保证FDr小于等于alpha。Storey给出了关于q值和pFDR的估计算法。
根据p-value或q-value可以计算对应的FDR，多重假设检验中拒绝H0的次数。
BH计算错误发现率时具有保守性，即在降低假阳性的同时，也减少了正确的假设。为此可采用q-value用于FDR计算。
reference:&"错误发现率和
q 值及其微阵列数据分析的应用."&现代预防医学40.005
(2013): 811-814.
以上网友发言只代表其个人观点，不代表新浪网的观点或立场。excel数据表计算卡方检验的p值_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
excel数据表计算卡方检验的p值
&&很简单实用,看到有收费的,我的不收钱,方便大家下载,设计版权告诉我,我删!
阅读已结束，下载文档到电脑
想免费下载本文？
定制HR最喜欢的简历
你可能喜欢百度拇指医生
&&&普通咨询
您的网络环境存在异常，
请输入验证码
验证码输入错误，请重新输入线性回归中p值到底怎么计算？并非简单的 t 检验或 F 检验
已有 2146 次阅读
|个人分类:|系统分类:|关键词:线性回归中p值到底怎么计算？
题目可以改为：线性回归中p值到底怎么计算？并非对原始数据进行 t 检验或 F 检验。线性回归中 p值的计算方法探究梅卫平（Basic knowledge worth spreading !）线性回归在软件中的计算代码如下：以软件自带的数据为例即可得到线性回归结果的各个参数： (Intercept) -2.040877 & 0.482820 &-4.227 & &0.000507 ***waiting & & &0.075245 & 0.006787 &11.087 & & &1.78e-09 ***---Signif. codes: &0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.44 on 18 degrees of freedomMultiple R-squared: &0.8723, &Adjusted R-squared: &0.8652 F-statistic: 122.9 on 1 and 18 DF, &p-value: 1.784e-09可知线性回归方程为，，。温馨提醒：上述结果中的
Std. Error 的数值表示回归参数的标准方差(SD)，不是标准误差(SE)。参考薛毅老师的《统计建模与R软件》一书的第304页。补充：在R软件中线性回归方程的 t-value 和 p值（即Pr(&|t|) 的数值）的计算# 计算t-valuet.value&- coef(half.lm) / sqrt(diag(vcov(half.lm)))t.value#输出截距和斜率的t-value结果为(Intercept) & & waiting
& -4.22699 & &11.08720# 计算p值2 * pt(abs(t.value), df = df.residual(half.lm), lower.tail = FALSE)#输出截距和斜率的结果为(Intercept) & & & & & & & &waiting 5. & & & &1. --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------那么p-value是通过什么检验得来的呢？和在数值上是完全一致的，因此，的P-value肯定和上述结果！Pearson's product-moment correlationdata: &waiting and eruptionst = 11.087, df = 18, p-value = 1.784e-09alternative hypothesis: true correlation is not equal to 095 percent confidence interval: 0..9739486sample estimates: & & &cor 0.9339558 & #此为Pearson相关系数 r& 0.[1] 0.8722734 #此为Pearson相关系数的平方 r^2-------------------------------------------------------------------------------其次，经数据验证，是回归分析的检验，或者说方差分析。参考依据外链网址写法如下：anova(half.lm)Analysis of Variance Table Response: eruptions & & & & & & & & & &Df &Sum Sq &Mean Sq &F value & &Pr(&F) & &waiting & &1 23.2 & &122.93 & 1.784e-09 ***Residuals 18 &3.6
上面的anova()与下面的 ANOVA 的 Type I 结果是等价的。原始数据的 ANOVA 的 Type I &的结果，注意是 aov（y~x），不是 aov(y~factor(x)).mod.half=aov(eruptions~waiting,data=half)summary(mod.half) & & & & & &
& & & & & & &Df Sum Sq & Mean Sq & F value & Pr(&F) & &waiting &1 &23.794 & 23.794 & & 122.9 & &1.78e-09 ***Residuals & &18 &3.484 & &0.194 & & & & & & & & & &
需要说明的是，上述结果为的结果，也是我们回归分析所用的结果。自由度中，为样本数。其实也就是，。另外，语言代码写法需要时刻注意，分很多情况：①回归分析的（）的写法不同于②多组数据比较的（）。参考
补充，经验证， p-value, F-value, Sum Sq 等参数在ANOVA的 TypeI，TypeII，TypeIII 结果中的数值均完全相同，但是它们对应的参考基准或条件不相同，需注意，可以参考 ANCOVA的例子
&。-----------------------------------------------------------------------------------------------------第三，可以确定的是，线性回归的 t-value 并不是两组数据比较（）的 -vlaue，具体解释请参考薛毅老师的《统计建模与软件》一书的第页。 t-test 及结果如下： t.test(waiting,eruptions,data=half,var.equal = T) Two Sample t-test data: &waiting and eruptionst = 19.917, df = 38, p-value & 2.2e-16第四，p-value 和 F-satistic 也不是简单的两组数据的方差齐性F-test：参考和 F-test 及结果如下：var.test(waiting,eruptions,data=half,alternative=&two.sided&)F test to compare two variances data: &waiting and eruptionsF = 154.06, num df = 19, denom df = 19, p-value = 2.22e-16alternative hypothesis: true ratio of variances is not equal to 1
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------拓展......① 线性回归结果各参数间的相互转化关系，参考② 经软件和软件验证，对于完全相同的数据组，非线性回归的和线性回归的不一样，虽然两种回归方式输出的结果中都显示为检验结果。③ 经数据验证，非线性回归的和线性回归的的计算与 kruskal.test 没有关联，（）默认把设置为了。④ 当预测变量只有1个的时候，即y=a*x+b，anova的结果就是线性回归中关于预测变量的结果，并且t^2=F-value。参考 ⑤ 线性回归中，R-squared和p-value及t-value的关系，请参考和
-------------------------------------------------------------------------------------------------------以下内容转载于茉茉的回答线性回归中的 ANOVA 的作用是什么？话题的优秀回答者<span style="font-family:'helvetica',sans-color:# 人赞同了该回答LinearRegression analysis 和 ANOVA 是兩種不同的統計方法。ANOVA 是 Analysis of Variance 的縮寫。它是怎麼來的、主要用於解決什麼問題、如何用，請參考及其相關的 references，解釋非常詳盡：。LinearRegression analysis 和 ANOVA 的數學模型長得很像，但它們有本質的區別：<span style="font-family:'helvetica',sans-color:#. LinearRegression analysis 給出的是一個模型建議（一個函數），ANOVA 給出的則是不同組別觀測值間是否存在差別以及怎樣的差別（非函數）。<span style="font-family:'helvetica',sans-color:#. LinearRegression analysis 解決的問題是作為應變量的 Y 是如何受自變量（或多個） X 影響的；ANOVA 解決的問題是通過比較方差觀察某一或某些隨機變量是否以及如何受某一或某些因素（factor）影響而呈現出（組間）差別的。---------- 消歧義補充 ----------<span style="font-family:'helvetica',sans-color:#. 說這兩種是不同的方法和它們有本質區別，這兩個觀點都不有悖於在某些情況下使用它們可以得出等價的結果；但並不能因為可以得到等價結果就說這兩種方法是等價的。<span style="font-family:'helvetica',sans-color:#. 說這兩種是不同的方法和它們有本質區別，並沒有否認它們之間存在甚至是存在深層的內在聯繫。有人就提出過這樣的觀點：。因每人研究領域不同會有不同觀點這是很正常也是應該存在的事情。我們如果認為自己的說法是有理有據的，就堅持自己的觀點；堅持自己並不意味著一定要推翻那些不同於我們的觀點。在認可「因側重點不同而存在認知上的差異」這個基礎上，質疑是永遠都沒有問題並且應該被提倡的。<span style="font-family:'helvetica',sans-color:#. 在知識儲備暫時沒有豐富到可以貫通地理解不同方法之間的同與異之時，還是建議分開學習理解這兩種方法。---------- 補充完畢 ----------所以，題主能不能把你想知道的「线性回归中的 ANOVA」是對什麼做 ANOVA 再說詳細一些，方便大家幫你；比如你用的是什麼軟件，你想問的是不是其他知友提到的那個「表」。 -------------------------------------------------------------------------------------------------------以下内容转载于99v的回答在回归分析中,F检验和t检验各有什么作用? 推荐于 01:29:53最佳答案一元线性回归里t检验和f检验等价，但在里，t检验可以检验各个回归系数显著性，f检验用来检验总体回归关系的显著性。t检验常能用作检验中各个参数的显著性，而f检验则能用作检验整个回归关系的显著性。各解释变量联合起来对有显著的线性关系，并不意味着每一个解释变量分别对有显著的线性关系。在一般情形下,t检验与F检验的结果没有必然联系;但当解释变量之间两两不相关时,若所有解释变量的系数均通过t检验,那么也能通过F检验。采纳率：90% 来自团队：擅长：
-------------------------------------------------------------------------------------------------------向您请教：一元线性回归中常说的 t检验与F检验到底是怎么实施的？
转载本文请联系原作者获取授权，同时请注明本文来自梅卫平科学网博客。链接地址：
上一篇：下一篇：
当前推荐数：1
评论 ( 个评论)
扫一扫，分享此博文
作者的精选博文
作者的其他最新博文
热门博文导读
Powered by
Copyright &}

叫阿莫西中心