看到别人做统计分析的表格里有Pearson相关性 和 显著性差异(双侧) 还有一个N...请问是啥软件啊?

怎样对数据做相关性检验_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
怎样对数据做相关性检验
上传于|0|0|暂无简介
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩4页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
下载作业帮安装包
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
请问spss在pearson相关性分析中r值的负值与正值代表什么意思?
kzUQ89PH63
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
正或负相关
为您推荐:
其他类似问题
P>0.05表明没有相关性,P<0.05才有相关性。在有相关性的情况下,再看是否为正负相关,若为负相关,表明一个变量随另一个变量的增大而减小
正值表示两变量正相关,即一个随另一个的增大而增大,减小而减小,变化趋势相同;负值表示两变量负相关,即一个随另一个的增大而减小,变化趋势相反。
那同时在正相关的数据中p>0.05,而负相关相关p<0.05,这样的数据又作何分析呢?
扫描下载二维码&#xe621; 上传我的文档
&#xe602; 下载
&#xe60c; 收藏
&#xe602; 下载此文档
正在努力加载中...
spss统计分析及应用教程-第6章 相关和回归分析
下载积分:2000
内容提示:spss统计分析及应用教程-第6章 相关和回归分析
文档格式:PPT|
浏览次数:19|
上传日期: 04:07:59|
文档星级:&#xe60b;&#xe612;&#xe612;&#xe612;&#xe612;
该用户还上传了这些文档
spss统计分析及应用教程-第6章 相关和回归分析
官方公共微信R语言与显著性检验学习笔记
一、何为显著性检验
& & & &显著性检验的思想十分的简单,就是认为小概率事件不可能发生。虽然概率论中我们一直强调小概率事件必然发生,但显著性检验还是相信了小概率事件在我做的这一次检验中没有发生。
& & & 显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。
& & & 常把一个要检验的假设记作H0,称为原假设(或零假设),与H0对立的假设记作H1,称为备择假设。
⑴在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率通常记作α;
⑵在原假设不真时,决定接受原假设,称为第二类错误,其出现的概率通常记作β。
& & & 通常只限定犯第一类错误的最大概率α,不考虑犯第二类错误的概率β。这样的假设检验又称为显著性检验,概率α称为显著性水平。
& & & 我们常用的显著性检验有t检验,卡方检验,相关性检验等,在做这一些检验时,有什么需要注意的呢?
二、正态性与P值
& & & &t检验,卡方检验,相关性检验中的pearson方法都是建立在正态样本的假设下的,所以在假设检验开始时,一般都会做正态性分析。在R中可以使用shapiro.test()。来作正态性检验。当然在norm.test包中还提供了许多其他的方法供我们选择。
& & &P值是可以拒绝原假设的最小水平值。
三、四个重要的量
& & & & &综合前面的叙述,我们知道研究显著性检验有四个十分重要的量:样本大小,显著性水平,功效,效应值。
样本大小:这个显然,样本越多,对样本的把握显然越准确,但是鉴于我们不可能拥有无限制的样本,那么多少个样本可以达到要求?今天的分享中我们可以通过R来找到答案。
显著性水平:犯第一类错误的概率,这个在做检验前我们会提前约定,最后根据P值来决定取舍。
功效:这个是在显著性检验中一般不提及但实际十分有用的量。它衡量真实事件发生的概率。也就是说功效越大,第二类错误越不可能发生。虽然显著性假设检验不提及它,但衡量假设检验的好坏的重要指标便是两类错误尽可能小。
效应值:备择假设下效应的量
四、用pwr包做功效分析
&&&& Pwr包中提供了以下函数:
Pwr.r.test
Pwr.t.test
Pwr.t2n.test
样本数不同的t检验
Pwr.shisq.test
Pwr.p.test
下面我们来介绍以上一些函数的用法。
1、& t检验
& & & & 调用格式:
& & & &pwr.t.test(n = NULL, d = NULL, sig.level =0.05, power = NULL, &type =c(&two.sample&, &one.sample&, &paired&),alternative = c(&two.sided&, &less&,&greater&))
& & &参数说明:
&&&& N:样本大小
&&&& D:t检验的统计量
&&&& Sig.level:显著性水平
&&&& Power:功效水平
&&&& Type:检验类型,这里默认是两样本,且样本量相同
&&&& Alternative:统计检验是双侧还是单侧,这里默认为双侧
& & &举例说明:已知样本量为60,单一样本t检验的统计量的值为0.2(这个可以通过t.test(data)$statistic取出来),显著水平α=0.1,那么功效是多少呢?
& & R中输入命令:
pwr.t.test(d=0.2,n=60,sig.level=0.10,type=&one.sample&,alternative=&two.sided&)
& & &得到结果:
One-sample t test power calculation
&&&&&&&&&&&&& n = 60
&&&&&&&&&&&&& d = 0.2
&&&&& &&&&&&&&sig.level = 0.1
&&&&&&&&& &&&&power = 0.4555818
&&& &&&&&&&&&&alternative = two.sided
& & & &我们可以看到,犯第二类错误的概率在50%以上,我们应该相信这个结果吗(无论根据P值来看是拒绝还是接受)?显然不行,那么需要多少个样本才能把第二类错误降低到10%呢?
& & & & & &在R中输入:
pwr.t.test(d=0.2,power=0.9,sig.level=0.10,type=&one.sample&,alternative=&two.sided&)
& & & & & &得到结果:
One-sample t test power calculation
&&&&&&&&&&&&&&&&&&&&&&&n = 215.4542
&&&&&&&&&&&&&&&&&&&&&&&d = 0.2
&&&&&&&&&&&&&&&&&&&&&&&sig.level = 0.1
&&&&&&&&&&&&&&&&&&&&&&&power = 0.9
&&& &&&&&&&&&&&&&&&&&&&&alternative = two.sided
&&&&&&&&&&&也就是说216个样本才可以得到满意的结果,使得第二类错误概率不超过0.1.
&&&&&&&&&&&对于两样本而言是类似的,我们不在赘述,我们下面再介绍另一种t检验的情况:两样本不相等。
& & & & & 调用格式:
pwr.t2n.test(n1 = NULL, n2= NULL, d = NULL,sig.level = 0.05, power = NULL, alternative = c(&two.sided&,&less&,&greater&))
& & & & & 参数说明:
n1&&& Numberof observations in the first sample
n2&&& Numberof observations in the second sample
d&&&& Effectsize
sig.level& Significancelevel (Type I error probability)
power&&&& Powerof test (1 minus Type II error probability)
alternative&&&&& acharacter string specifying the alternative hypothesis, must be one of&two.sided& (default), &greater& or &less&
& & & & & &例如:两个样本量为90,60,统计量为0.6,单侧t检验,α=0.05,为望大指标。
R中的命令:
pwr.t2n.test(d=0.6,n1=90,n2=60,alternative=&greater&)
输出结果:
t test power calculation
&&&&&&&&&&&&n1 = 90
&&&&&&&&&&&&n2 = 60
&&&&&&&&&&&&d = 0.6
&&&&&&&&&&&&sig.level = 0.05
&&&&&&&&&&&&power = 0.9737262
&&& &&&&&&&&&alternative = greater
& & & & & &可以看出功效十分大,且α=0.05,我们相信这次检验的结论很可信。
2、& 相关性
& & & & & & Pwr.r.test()函数对相关性分析进行功效分析。格式如下:
pwr.r.test(n = NULL, r = NULL, sig.level = 0.05, power = NULL, &&&alternative = c(&two.sided&, &less&,&greater&))
&&&&&&&&&&&这里和t检验不同的是r是线性相关系数,可以通过cor(data1,data2)获取,但需要注意的是不要输入spearman,kendall相关系数,他们是衡量等级相关的。
&&& &&&&&&&&假定我们研究抑郁与孤独的关系,我们的原假设和备择假设为:
H0:r&0.25& v.s. &&&H1:r&0.25
& & & & & &假定显著水平为0.05,原假设不真,我们想有90%的信心拒绝H0,需要观测多少呢?
& & & & & 下面的代码给出答案:
pwr.r.test(r=0.25,sig.level=0.05,power=0.9,alt=&greater&)
& & approximate correlation power calculation (arctangh transformation)
&&&&&&&&&&&&&n = 133.8325
&&&&&&&&&&&&& r = 0.25
&&&&&&&&&&&&&sig.level = 0.05
&&&&&&&&&&&&&power = 0.9
&& &&&&&&&&&&alternative = greater
& & & & 易见,需要样本134个
3、& 卡方检验
& & & & 原假设为变量之间独立,备择假设为变量不独立。命令为pwr.chisq.test(),调用格式:
pwr.chisq.test(w = NULL, N = NULL, df = NULL, sig.level = 0.05, power = NULL)
其中w为效应值,可以通过ES.w2计算出来,df为列联表自由度
prob&-matrix(c(0.225,0.125,0.125,0.125,0.16,0.16,0.04,0.04),nrow=2,byrow=TRUE)
ES.w2(prob)
pwr.chisq.test(w=ES.w2(prob),df=(2-1)*(4-1),N=200)
输出结果:
&&&& Chi squared power calculation
&&&&&&&&&&&&& w = 0.2558646
&&&&&&&&&&&&& N = 200
&&&&&&&&&&&& &df = 3
&&&&& &&&&&&&&sig.level = 0.05
&&&&&&&&& &&&&power = 0.8733222
&NOTE: N is the number of observations
& & & & &也就是说,这个观测下反第二类错误的概率在13%左右,结果较为可信。
& & & & &在R中还有不少与功效分析有关的包,我们不加介绍的把它们列举如下:
真不错,这个笔记!
楼主的笔记做得很好啊,有几个问题想请教一下,不知道楼主有没有空回答?1、原始协变量是x1,x2,x3,x4,做了数据标准化处理之后变为z1,z2,z3,z4,得到模型lm1,要检验y是否只与x1,x2有关,那是不是要将模型lm1还原回y与x1,x2,x3,x4的模型后再做假设检验:b3=b4=0啊?能简单说一下该怎么操作吗?2、用cooks.distance做出来的结果为什么和直接套用cook距离计算公式不一样啊?:Di=(pi*ri^2/(p(1-pi)),ri是学生化残差,用rstudent()求的,pi是x(x&#39;x)^(-1)x&#39;的对角线元素
yujun7654321
[reply]u[/reply]我先回答你的第一个问题,你说的办法是可行的,在R中使用函数linear.hypothesis()可以实现,具体可以参见我的《Study note on Applied Econometrics with R(1)》,不过对于这样嵌套模型更推荐使用方差分析anova(),检验两个模型有无显著差异。两个函数的用法在那篇文章里都有。当然你自己做的时候也可以使用方差分析的思路来做。对于你的第二个问题,我估计可能R是使用cook距离的原始定义计算的,在计算精度方面可能会有差异。但相差是应该不大的。
本分类共有文章47篇,更多信息详见
& 2012 - 2016 &
&All Rights Reserved. &
/*爱悠闲图+*/
var cpro_id = "u1888441";}

我要回帖

更多关于 显著性差异 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信