SPSS应用+(终稿)_甜梦文库
SPSS应用+(终稿)
SPSS应用SPSS Demystified第1章 SPSS概述1.打开SPSS 2.数据编辑窗口 3.在SPSS中生成数据文件 4.数据输入及分析 5.Viewer(输出)窗口 6.保存文件 7.打印文件1.打开SPSS? What would you like do? ――cancel2.数据编辑窗口Data ViewSPSS中用来输入数据Variable ViewSPSS中用来 生成变量及增加数据文件信息Variale View 窗口不同列的名字与功能(附照片)3.在SPSS中生成数据文件? 一个SPSS数据文件(data file)是一个计算机文件,包 含一个或多个变量信息(数据)。 ? 一个变量(Variable)是一个属性(attribute)或者特征 (characteristic),它可以取两个或更多的值。 ? 要在SPSS中对变量执行分析,必须用数值形式(如age, IQ)。因此,在把数据输入SPSS之前,需要把目前为字符 型的变量(如gender,employment),转换为数值型。 ? 诸如gender 和employment这样的变量成为分类变量。 分类变量(categorical variable)取有限数目的值,仅 仅取两个值得变量成为二分变量(dichotomous variable)。连续变量取大量不同的值。4.数据输入及分析? 在所有变量都成为数值型的之后,现在我 们可以在SPSS中输入数据和分析数据。 ? 数据输入和分析过程分成下面四个步骤: ? 步骤1:生成变量 ? 步骤2:输入数据 ? 步骤3:分析数据 ? 步骤4:分析结果步骤1:生成变量? 注意:Variable View 窗口 第一列输入变量名称,并点击向下 箭头↓。所有右边的单元都自动填入默认值(label的默认值是 空单元)。生成变量值标签? 回顾我们把数值(如1,2)指定到 gender,employment不同的类别是因为它们需 要改变为数值形式,以便在SPSS中进行分析。 ? 我们指定的数值是任意的(可以选择任意两个数 值),只要它们能区别变量的两个类别即可。 ? 为了帮助我们更容易地记住指定的数值,我们将 用不同的数值表示类别输入SPSS(1为男性,2 为女性),这称为生成变量值标签的过程。示例:为gender生成变量值标签在Variable View窗口,点击“gender行,Value列“的单元(那里显示的是None,右 侧出现一个省略号)点击省略号按钮。Value Label 对话框
步骤2:输入数据? 在Data View 窗口输入数据步骤3:分析数据? 从SPSS的一个基本方法开始――利用 Case Summaries 方法产生一个关于变量 的概括报告 ? 进入 Summaries Case对话框的步骤: ? Analyze>Reports>Case Summaries ? 指选择Analyze,然后选择Reports,再选 择Case Summaries
Summaries Case 对话框
5.Viewer(输出)窗口 Case Summaries结果显示在&Viewer&窗口在SPSS中,Viewer 窗口分成两个不同的部分,窗口的左边包含了所要求分析的概要 窗口的右边展示了分析结果。步骤4:解释结果Case Summarize 方法分析结果主要包含 Case Processing Summary 和Case SummarizeCase Processing SummaryCase Processing Summary? 展示数据文件中的每个变量的参加者(如, 样本点)数目。第一列Included对每个变 量报告的N的值为5(N对应于参加者或样 本点的数目),说明对每个变量都有5个人 包含在分析之中。在EXcluded列对每个变 量报告了N值为0,表示没有参加者被排除 在分析之外(每个人都有所有四个变量的 值)。最后一列Total展示了数据中参加者 的总数,它等于5。Case SummarizeCase Summarize? 展示了参加者在四个感兴趣的变量上的取 值。注意gender和employment所生成的 变量值标签展示在表中,而不是原先输入 SPSS的数值(1和2),这便于阅读结果。6.保存文件? 在SPSS中,数据文件的扩展名为&.sav& ? 输出文件的扩展名是&.spo&第2章 描述统计,数据图形展示,利用系数α 描述的可靠性 1.频数 2.度量集中趋势与变异性 3.使用Means程序进行组分析 4.执行Frequencies和Means程序的步骤摘 要描述统计量介绍? 频数(Frenquencies)是指变量在每一类中的观测次数。 集中趋势度量(均值、中位数、众数) ? 均值(Mean)就是算数平均数 ? 中位数(Median)就是位于中间的得分 ? 众数(Mode)是在数据集中出现最多次数的得分数。 ? 变异性的度量用来描述得分集合的离散性和变异性 ? 标准差(standard deviation)和方差(variance)是 两个最常用的度量变异性的方法。其他方法有极差 (range,最大值和最小值的差)和四分位数间距 (interquartile range),分布75%分位数和25%分位数 的差。数据分析数据 1、使用Frequencies程序获得频数 2、使用Frequencies程序获得描述统计量 3、使用Mean程序获得关于一个或更多变 量的描述统计量1、使用Frequencies程序获得频数步骤摘要: ? 从菜单栏中选择Analyze> Descriptive Statistics > Frequencies... ? 把要分析的分类变量移到Variable(s)框中 ? 点击&OK&
Frequencies对话框Viewer窗口输出结果结果解释分析结果-变量gender,college的频数 ? 统计量(Statistics)表 显示了变量gender,college的样本量,该表表明变 量gender,college都有10个有效观测值(所有的 10个人在两个变量上都有值)。Missing行的值 为0表明任何一个变量都没有缺失值。 ? 频数表 (Frequency Table) 以频数表-gender为例,表明gender的每一类的 频数或说参与者的人数。在表中有5位男性和5位 女性,每个行别在数据中各占50%。2、使用Frequencies程序获得描述统 计量步骤摘要 ? 从菜单栏中选择Analyze> Descriptive Statistics > Frequencies... ? 把要分析的分类变量移到Variable(s)框中 ? 点击Statistics ? 选择感兴趣的统计量 ? 点击“Continue” ? 在Frequencies对话框中,不选择“Display frequency tables” ? 点击“OK”
Viewer窗口输出结果结果解释分析结果-变量Mathexam,Satquent的频数 ? 统计量(Statistics)表? minmum,maximum分别表明数 据中最低值和最高值,有助于保证 所有数据在可能的范围内取值(超 过这个范围的取值很有可能表明数 据输入有错) ? 注意表后备注说明3、使用Mean程序获得关于一个或更多 变量的描述统计量? 步骤摘要 ? 从菜单栏中选择Analyze> Compare Means > Means... ? 把要得到的描述统计量的变量移到Dependent List框中,把分类变量移到Indenpendent List框 中。 ? 如果想用第二分类变量对结果分层,点击 “Layered”按钮,把分类变量移到 Independent List框中(如果不想对结果分层就 忽略该步骤) ? 点击“OK”
Viewer窗口输出结果Viewer窗口输出结果结果解释分析结果:Means程序-College被Gender分层下的Satquant ? 案例处理摘要 ? Case Processing Summary表 表明了分析中的观测数量,已排除的观测数量,以及数据集中的全部观 测数量。该表说明所有10名参与者都包括在分析之中。(所有10人 在satquant,college和gender上都有取值) ? 报告(Report)表 ? 显示了College被gender分层下的Satquant的均值、样本量(N) 和标准差。 ? 该表第一部分显示了在本地上大学的男性和女性的均值和标准 差 ? 该表第二部分显示了在外地上大学的男性和女性的均值和标准 差 ? 该表最后一部分是男性和女性在本地上大学和在外地上大学合并起来 时的均值和标准差。第3章 作图1.条形图 2.直方图 3.散点图 4.盒形图数据descriptive statistics.sav1.条形图? 步骤摘要 ? 从菜单栏中选择Graphs>Legacy Dialogs>Bar... ? 在Bar Charts(条形图)对话框里,保留默 认选项Simple。点击&Define&。 ? 在Define Simple Bar :Summaries for Groups of Case对话框中,把感兴趣的变 量移到Category Axis(分类轴)对话框。 ? 点击“OK”
结果解释条形图-College ? 条形图中,组别&本地(home)&和&外地 (away)&显示在横轴(X轴),频数显示 在纵轴(Y轴)。对于给定的每一组,条形 的高度对应着每组的频数。条形图表明6个 学生在本地上大学,4个学生在外地上大学。2.直方图? 步骤摘要 ? 从菜单栏中选择Graphs>Legacy Dialogs>Histogram... ? 在Histogram对话框里,把感兴趣的变量 移到Variable框中。 ? 点击“OK”
结果解释直方图-Mathexam ? 直方图中,在X轴显示了Mathexam的值(从最小 到最大),在Y轴显示了频数。 ? 注意图中在X轴上每个条形的尺度是5分:第一个 条形包含15~20的区间,第二个条形包含20~25 的区间,等等(不同图中区间的尺度是不一样 的)。 ? 图表中有最大频数的区间是25~30,频数为3。 ? 注意SPSS能在直方图的右边默认给出平均值、标 准差和样本量3.散点图? 步骤摘要 ? 从菜单栏中选择Graphs>Legacy Dialogs>Scatter/Dot... ? 在Scatter/Dot对话框里,保留默认选项 Simple Scatter。点击&Define&。 ? 在Simple Scatterplot对话框中,把一个 变量移到Y Axis框中,把另一个变量移到X Axis框中 ? 点击“OK”
结果解释散点图-Mathexam和Satquant ? 散点图中,显示了每个参与者在两个变量Mathexam和Satquant上的坐标(每个坐标是图中的圆圈)。 正如较早前在Simple Scatterplot对话框里指定 的,变量Satquant的值在X轴上,把变量 Mathexam的值显示在Y轴上。在图中有10个不 同的坐标,每个坐标显示了每个参与者在两个变 量上的得分。例如,图中右边较远的坐标表示第 三个参与者在Mathexam和Satquant的分数分别是34和600。4.盒形图? 步骤摘要 ? 从菜单栏中选择Graphs>Legacy Dialogs> Boxplots... ? 在Boxplot对话框里,保留默认选项Simple。在 Data in Chart Are中选择Summaries of separate variables。点击&Define&。 ? 在Define Simple Boxplot :Summaries of separate variables对话框中,把感兴趣的变量 移到Boxes Represent框中。 ? 点击“OK”
结果解释盒形图-Mathexam ? 盒形图中,矩形框包括了中间50%的数据,框内 的 线等于中位数 ? 从框里延长的线对应着须线(whisker)。 ? 须线上的两个端点代表了最大值和最小值, ? 除非有一个或多个异常值,这用在须线之外的星 号表示第4章 可靠性(用α系数度量)1.例子 2.α系数的目标和数据要求 3.在SPSS中输入数据及分析 4.结果的表达基本概念? 可靠性指某些感兴趣的测量结果的一致性和可重 复性。 ? 例如,对一组参与者在两周内进行两次信心的10 个项目的测量,如果参与者对这些项目的反应相 同或很相近,这个测量的可靠性就很高;如果反 应有很大的不同,这个测量的可靠性就很低。 ? 尽管有几种不同方法用来估计可靠性,但是大部 分都可以归为两种形式: 基于对一个测量多次执行之上的可靠性; 基于对一个测量单独执行之上的可靠性;评估一个测量单独执行的可靠性? 包括执行一次量表以及测量参与者对测量的所有项目反映 的一致性。 ? 对一个测量单独执行的两种不同的可靠性是: 折半信度(split-half reliability):是将受测题目分层两半, 然后估计参与者对这两个部分反映的一致性; α系数(也称Cronbach's α):不是对测量的单独划分进行 计算,而是对测量所有可能的划分的均值。 ? 当使用折半系数或α系数对测量的可靠性进行估计时,重 要的是量表内所有项目测量同样的性质,否则内部的一致 性将大大减弱。评估一个测量多次执行的可靠性包括在两个不同时刻执行量表以及测量参与 者在两个执行内对这些项目的反应的一致 性 两种常用方法: ? 重测信度(test-retest reliability,重复测 量两次) ? 复本信度(alternate form reliability,执 行两次非常类似的测量,每次一个版本)? α系数是估计可靠性的 一种最常用的方法 ? α系数的取值范围通常 是0~1,取值越高表明 一系列项目的内部一 致性越强。 ? α系数不同取值范围的 正确性的近似准则α系数 0.90以上 0.80~0.89 0.70~0.79 0.60~0.69 0.59以下正确性 优秀 好 一般 边缘 糟糕2.例子(α系数应用)? ? 作为研究项目的一部分,一个学生想估计生活意义中5个项目的测量的内部一 致可靠性。 生活意义量表的项目 强烈不 同意 1 1 1 1 不同意 既不是同 意也不是 不同意 3 3 3 3 同意 强烈同 意 5 5 5 5项目1.我对我的人生方向感觉很好 2.我的生活有意义 3.通常我觉得是在我的生活轨 道上 4.我在生活中没有迷失过2 2 2 24 4 4 45.目前我正努力工作,以实现 自己的生活目标12345说明:对每个项目,反应选项是1(强烈不同意),2(不同意),3(既不是同意也不 是不同意),4(同意),5(强烈同意)。每个参与者被要求对每个问题仅选择一个 反应项。? 生活意义量表的每个项目的反应范围是1~5,1=强烈不同意,5=强烈 同意。 ? 把5个项目的反应加在一起可以得到量表的总分数,对每个参与者来 说,总得分的取值范围是5~25。 ? 量表中的得分越高表明生活意义水平越高。 ? 如果关于生活意义量表的项目有一个较高的内部一致性(量表是可靠 的),那么参与者需要在量表的每个项目上都有一致性的反应。 例如,生活意义量表中的项目,在生活意义上有较高得分的那些人应该 同意这些项目,而在生活意义上有较低得分的那些人应该不同意这些 项目。 ? 参与者的这种一致性反应模式将导致一个高的系数值,因为参与者在 量表上有一致性的反应。(例如,一个人同意所有项目,另一个人不 同意这些项目,等等) ? 该规则的一个例外是当量表中包括一个或更多个负向项目时。负向项目和反向编码? 在生活意义量表中给出了所有关于生活意义量表的项目,因此有较高生 活意义的人 倾向于对它们表示同意或强烈同意(假定量表是可靠的 ? 然而,一些测量设计使用了一些混合项目,其中在感兴趣的特征上有较 高得分的人同意一些项目,并且不同意其他项目 ? 那些在感兴趣的特征上有较高得分的人不同意的项目被认为是负向项目 ( negative item) 如果生活意义量表中的“项目2”被重写为“我的生活几乎没有意义”, 这就是一个负向项目的例子。有较高生活意义的人最有可能不同意或强 烈不同意这些负向项目 ? 如果一个量表里包含一个或更多的负向项目,在估计量表的内部一致性 之前,这些项目都需要反向编码。 ? 反向编码是这样一个过程:对负向项目的反应是按照字面反向的,因此1 变成了5,2变成了4,等等。2.α系数的目标和数据要求目标 在测量中估计反应 的内部一致性 数据要求 需要至少两个项目 (变量)的得分 (尽管推荐超过两 个项目)。所有项 目应该测量同样的 特点或特征 例子 生活意义量表包括 5个项目(变量)。 将确定参与者在5 个项目上反应的内 部一致性3.在SPSS中输入数据及分析数据meaning.sav在SPSS中执行α系数的步骤摘要: ?在SPSS中建立与量表中项目一样多的变量 ?输入参与者对量表里每个项目的反应 ?选择Analyze>Scale>Reliability Analysis... ?把量表里的每个项目移到Item框中。 ?点击“Statistics”。在Descriptives for 下选择Item和Scale。 点击“Continue”。 ?点击“OK”
Reliability Analysis:Statistics(可靠性分 析:统计)对话框Viewer窗口输出结果Viewer窗口输出结果结果解释? 案例处理摘要 显示计算量表可靠性所需要案例(参与者)的数量。表中显示N为20,这表明所 有20个参与者包括在分析中(在5个变量中它们有完整的数据) ? 可靠性分析 显示了5个项目量表的系数值(也叫Cronbach's α)。系数值是0.94(四舍五入 至小数点后两位),这表明量表中5个项目有很高的内部一致性。 ? 项目统计量 提供了量表的每个项目的均值、标准差和样本量。如果要检查5个项目的均值, 就会注意到参与者在项目1(meaning1)和项目2(meaning2)上有较高排名, 平均反应为4.00,这相当于对量表的“同意”的反应。剩下的三个项目上的平均 反应在3.60~3.75之间。项目1的变化是最大的,近似标准差为1.34(5个项目的 标准差是非常类似的)。 总体上,参与者在5个项目上的反应表明他们发现自己的生活是相当有意义的, 对每个项目的平均反应要么等于“同意”,要么在“同意”的方向上(值为 4.00). ? 尺度统计量 最后一个表格提供了总量表的均值、标准差和样本量(总量表等于5个项目的 和)。5个项目的量表的均值是19.05(回想一下总量表可能的范围是5~25), 标准差是5.61.因此,在这个量表上,参与者在个人意义上有相当高的排名。 量表的均值是评估参与者落在感兴趣的特性之中的一个替代的估计方法,它等于 5个项目的均值之和(4.00+4.00+3.75+3.70+3.60=19.05)4.结果的表达? 在写可靠性分析结果时,通常 需要提供总量表的α系数值、均 值和标准差(如果需要,单个 项目的均值和标准差也可以显 示在表格中)。下面给出了结 果的简单书面例子: 我们对有5个项目的生活意义 量表的内部一致性进行了研究。 该量表的α系数是0.94,显示这 个量表的项目有很高的内部一 致性。每个项目的均值取值范 围是3.65~4.00,总量表的均值 是19.05(SD=5.61)。该量表 显示参与者的生活有很高的意 义。下图提供了生活意义量表 里项目的均值和标准差Item 1 2 3 4 5 M 4.00 4.00 3.75 3.70 3.65 SD 1.34 1.17 1.29 1.30 1.10第5章 单样本t检验? ? ? ? ? ? ? ? 例子 单样本t检验的目标和数据要求 原假设和对立假设 研究问题 在SPSS中输入数据及分析 效应量 APA格式的结果表达 单样本t检验的假定? 当把一个样本均值和一些已知或估计的总 体均值进行比较时,我们可以使用单样本t 检验。 ? 从某种意义上说,这些样本通常不同于总 体,而且感兴趣的问题是:感兴趣的因变 量的样本均值是否显著不同于总体均值。 下面给出一个单样本t检验的例子:例子? 一家知名会计师事务所雇用的一名工业心 理学家想知道这家公司每周的平均工作小 时数是否显著不同于每周52小时的国家平 均水平。 ? 工业心理学家随机抽取来自公司不同部门 的16个人,记录他们在三个月期间的每周 平均工作小时数。 ? 该研究中的因变量是每周工作小时数。单样本t检验的目标和数据要求目标 数据要求 例子确定样本均值是否显著 不同于某个已知或估计 的总体均值参与者的一个样本知名会计师事务所中的 会计师们因变量 每周工作小时数因变量 连续原假设和对立假设? 原假设(H0)表明会计师事务所中每周工作小时数等于全国平均水平52小时: H0:? =52 ? 对立假设(H1)表明会计师事务所中每周工作小时数不等于全国平均水平52小时: H1:? ≠52原假设评价:? ? 单样本t检验对会计师事务所中每周工作小时数等于全国平均水平52小时的原假设进行 了检验。 如果t检验产生的结果在原假设正确时看起来不可能(结果发生的可能性小于5%)那么 拒绝原假设。 如果t检验产生的结果在原假设看起来正确(结果发生的可能性大于5%),那么不拒绝 原假设。研究问题? 在研究中基本的兴趣问题也可以用研究问 题的方式表示。 例如: “知名会计师事务所中的雇员每周工作小时 数不同于国家平均水平52小时吗?”在SPSS中输入数据及分析数据步骤摘要: ?在SPSS中生成一个变量 ?输入数据 ?从菜单栏中选择Analyze>Compare Means>One-Sample T Test… ?把因变量移到Test Variable(s)框 ?在Test Value 框输入原假设中的指定值。 ?点击“OK”
Viewer窗口输出结果解释结果? 单样本统计量表(One-sample Statistics Table)? 输出的第一个表格One-sample Statistics显示了样本量(N),平均值,标准差和样 本均值的标准误差。 ? 注意在会计师事务所中每周工作小时数的平均值是59,它比全国平均水平的52小时多 了7个小时。 接下来考虑这个差异(7小时)对具体统计显著性而言是否足够大。? 单样本检验表( One-sample Test Table )? 第二个表格One-sample Test提供了我们研究问题的答案,问题是这家会计师事务所每 周的平均工作小时数是否不同于全国平均水平52小时。 ? 原假设的检验是以t的形式显示的,这里 t=样本均值与总体均值之差/均值的标准误差 从表格One-sample Test代入适当的值(均值差,均值标准误差)得到t值是 t=9/1. ? 有16个参与者,自由度(df)等于15(参与者数目-1),对应的p-值为0.001。因为p值小于0.05,所以会计师事务所中每周工作小时数等于全国平均水平52小时的原假设 被拒绝。 ? 因为检验是显著的,从One-sample Statistics 表格中检查16个参与者的平均值,发 现会计师事务所每周的平均工作小时数(59)高于全国平均水平52小时效应量? ? 假设检验表明在群组间是否有一个显著的不同(回答是或不是的问题) 效应量提供了对结果的“大小”的表示(回答了一个什么程度的问题) 当前例子中,使用假设检验得到的结论是当地会计师事务所雇员的平均工作小时数 与全国平均水平存在差异。我们将要计算的效应量能表达这个差异有多大。 ? ? ? ? 单样本t检验的常用效用量统计量是Cohen’s d,这里d=样本均值与总体均值之差/标准 差 代入适当的值(均值差,标准差)得到d值为d=7/7.15=0.98 雅各布? 科恩 (Jacob Cohen)是一位推动效应量度量的先驱 科恩准则规定单样本t检验的小、中和大的效应量分别对应着0.20、0.50和0.8。这些 值表明可以用标准差表示样本均值和总体均值的差异有多大。0.20表示组别之间有1/5 的标准差,0.50表示群组之间有一半的标准差,0.80表示群组间有8/10的标准差。 利用科恩的结论,d值0.98对应实践中一个较大的效应,表明雇员在当地会计师事务所 与国家平均工作时间的差异基本上是1倍标准差(雇员在会计师事务所的工作时间更长)?APA格式的结果表达? ? ? 美国心理协会(APA)的出版手册(2001)上可找到APA格式特定的规则。 在写结果时,除了报告样本均值和样本标准差,还要报告假设检验的结论,自由度,t 值,p-值和效应量。 接下来我们将展示一个APA格式的简单书面例子: 在知名会计师事务所的雇员(M=59.0,SD=7.15)每周工作时间显著多于52个小时 的全国平均水平,t(15)=3.92,p<0.05,d=0.98。单样本t检验的假定? 假定是很重要的,因为如果不满足假定条件,特定的统计方法的结果就不具可信性 (p-值不准确)。然而,一个检验是否由于违反假定条件而无效取决于违反的特定假 定(与其他假定相比,一些假定更糟糕而且更易违反)和假定条件不满足的程度。 单样本t检验的假定条件: ? 观测是独立的 ? 该假定能通过设计你的研究使得参与者在任何情况下都不相互影响得到满足。 ? 违反这个假定可能会严重破坏单样本t检验的正确性; ? 如果有理由相信已经违反了独立性假定,就不应该再用单样本t检验了; ? 因变量总体服从正态分布 ? 该假定意味着每周的工作小时数的总体服从正态分布。 ? 对于中等到较大的样本量(N≥30),绝大部分的非正态分布趋向于对t检验的精确性 没有多少影响,尽管一些非正态分布可能不利于t检验的功效; ? 对非正态分布的修正办法就是对数据进行非线性变换;第6章 独立样本t检验? ? ? ? ? ? ? ? 例子 独立样本t检验的目标和数据要求 原假设和对立假设 研究问题 在SPSS中输入数据及分析 效应量 APA格式的结果表达 独立样本t检验的假定当对两个对立分组中感兴趣的一个连续因变量的均值进行比较时, 可以使用独立样本t检验。下面给出一个独立样本t检验的例子:例子? 临床心理学家想调查认知行为治疗和精神分析治疗对抑郁症的相对有 效性。 ? 30名患有抑郁症的病人随机分配接受两个疗法,其中15人接受行为 治疗,另外15人接受精神分析治疗。经过两个月的治疗后,记录下每 个病人抑郁症得分。 ? 在本研究中,自变量是治疗方法(认知行为治疗和精神分析治疗), ? 因变量时抑郁症 ? 较高的分数表示更高的抑郁水平(抑郁水平的分数变化范围为 10~70)。独立样本t检验的目标和数据要求目标 数据要求 例子检验两个组别中关于某 些感兴趣的因变量的均 值是否存在显著差异具有两个不同组别的一 个自变量自变量 ?治疗类型(认知行为 治疗与精神分析治疗)因变量 ?抑郁症一个连续因变量原假设和对立假设? 原假设指出两组的抑郁症分数均值在总体上是相等的: H0:? 精神分析= ? 认知行为 ? 对立假设指出两组的抑郁症分数均值在总体上是不等的: H1:? 精神分析≠ ? 认知行为原假设评价独立样本t检验对两组的总体均值相等的原假设进行检验。 ? 如果t检验产生的结果在原假设正确时看来不可能(结果发生的可能性 小于5%),那么拒绝原假设。 ? 如果t检验产生的结果在原假设正确时看来可能(结果发生的可能性大 于5%),那么不拒绝原假设。研究问题? 在研究中基本的兴趣问题也可以用研究问题 的方式表示。 例如: “在接受认知行为治疗与精神分析治疗的病人 中,抑郁症水平的均值是否存在差异呢?”在SPSS中输入数据及分析? 数据步骤摘要: ?在SPSS中生成两个变量(一个是自变量,另一个是因变量) ?输入数据 ?为自变量创建变量值标签。在Value Labels对话框,适当输入数值和标签。 点击“OK” ?从菜单栏中选择Analyze>Compare Means>Independent-Samples T Test… ?把因变量移到Test Variable(s)框,自变量移到Grouping Variable框 ?点击“Define Groups”。为1组输入1,2组输入2,点击“Continue” ?点击“OK”
Viewer窗口输出结果解释结果? 分组统计量表(Group Statistics Table) Group Statistics表格显示每个治疗组的描述统计量,包括样本量、平均值、标准差和 标准误差。 注意到认知行为治疗样本的抑郁分数均值(均值=45.00)比精神分析治疗样本(均值 =56.00)的低。 我们稍后将会考虑这两组之间的差异对具有统计显著性而言是否足够大。 独立样本检验表(Independent-Samples Test Table) Independent-Samples Test表格显示均值相等的t检验(t-test for Equality of Means )之后的方差相等的Levene检验(Levene’s Test for Equality of Variances)的结果。?方差相等的Levene检验(Levene’s Test for Equality of Variances)? 检验两个治疗组的总体方差是否相等,这是独立样本t检验的一个假设。 SPSS使用由Levene开发的方法来检验总体相等的假设。 Levene检验的原假设和对立假设是: H0:σ2精神分析 = σ2认知行为 (两组的总体方差相等) H1:σ2精神分析 ≠σ2认知行为 (两组的总体方差不相等) 通过检查输出结果Levene’s Test for Equality of Variances的检验报告的 p-值(sig.)来评价方差相等的假设。 如果p≤0.05,拒绝原假设,表明总体方差不想等; 如果p>0.05,拒绝原假设,表明总体方差不想等; 通过Independent Samples Test表格我们看到,Levene的检验得到F值为 0.311和p-值为0.582。因为0.582的p-值大于0.05,接受方差相等的原假设。 因此,基于Levene的检验结果,我们推断两个样本的总体方差相等。?? ? ? ?? 评价方差相等假设的决策规则评价方差相等的假设 Levene检验结果 p>0.05 p≤0.05 我们的数据 p=0.582 ;
不能拒绝H0 假设总体方差不相等 决策 不能拒绝H0 拒绝H0 结论 假设总体方差相等 假设总体方差不相等均值相等的t检验(t-test for Equality of Means )? ? ? ? ? ? ? ? ? ? t-test for Equality of Means为我们研究问题提供了答案,即两个治疗组的抑郁程 度是否不同。 在SPSS中的两个结果,一个假设组间方差相等,另一个假设组间方差不想等。 由于Levene的检验不显著(Levene检验中p-值>0.05),我们将使用标有Equal variances assumed第一行的结果。 如果Levene的检验是显著的,即p≤0.05,我们将使用标有Equal variances not assumed 第二行的结果。 均值相等的原假设的检验是以t的形式显式的,这里 t=两样本间均值之差/两均值之差的标准误差 从表格Independent Samples Test代入适当的值(均值差、均值标准误差)得到t值是: t=11/3. 这与表格Independent Samples Test中t列的值一致。有30个参与者,自由度(df)等 于28(参与者数目-1),对应的p-值为0.002。因为p-值小于0.05,所以均值相等的原 假设被拒绝,结论为两个治疗组的抑郁分数有显著差异。 由于检验是显著的,从Group Statistics 表格中检查均值,发现认知行为治疗样本的 抑郁分数均值(均值=45.00)比精神分析治疗样本(均值=56.00) 的低 如果t检验不显著,我们可以认为Group Statistics 表格中均值的任何差异都是由于 抽样误差导致的)效应量N1 ? N 2 d ?t N1 N 2 ? N1和N2是样本1和样本2的样本量,t是Independent Samples Test中 t统计给出的值。代入适当的值(均值差,标准差)得到效应量为? 对独立样本t检验的效应量的估计通常由d给出,其中15 ? 15 d ? 3.514 ? 1.28 15?15? 科恩给出了d值得估计0.2,0.5和0.8在行为科学中分别对应于小、中 和大得效应量。 ? 根据科恩准则,在实践中效应量1.28被认为非常大,表明认知行为治 疗组的抑郁分数比精神分析组低,差值为1.28倍标准差。APA格式的结果表达? 在写独立样本t检验的结果时,除了报告样本均值和样本标准差,还 要假设检验的结论,自由度,t值,p-值和效应量。 ? APA格式的简单例子 ? 接受认知行为治疗(M=45.00,SD=7.63)显著低于接受精神分析治疗 组的抑郁分数(M=56.00,SD=9.42)。t(28)=3.51,p<0.05, d=1.28。独立样本t检验的假定? 观测是独立的 ? 该假定能通过设计你的研究中的所有参与者在任何情况下都不相互影响得到 满足。(参与者们共同合作回答关于抑郁标准的问题是违反独立假定的一个 例子) ? 违反这个假定将严重破坏独立样本t检验的正确性; ? 如果有理由相信已经违反了独立性假定,就不应该再用独立样本t检验了; ? 每组因变量总体服从正态分布 ? 这个假定指的是两个治疗样本的抑郁分数的总体服从正态分布 ? 对于中等到较大的样本量,绝大部分的非正态分布趋向于对t检验的精确性没 有多少影响,尽管一些非正态分布可能对t检验的功效有不利影响; ? 每组总体方差相等 ? 违反方差相等假定将会损害独立样本t检验的准确性,尤其在样本量不相等时。 ? 解释SPSS中Levene的检验结果,从输出的结果中读出合适的结论来强调这个 假定。第7章 相依样本t检验? ? ? ? ? ? ? ? 例子 相依样本t检验的目标和数据要求 原假设和对立假设 研究问题 在SPSS中输入数据及分析 效应量 APA格式的结果表达 相依样本t检验的假定? ? ?在对某种程度上相关的两个样本的均值进行比较式,我们可以使用相依样本t检验(也 称为配对样本t检验,重复测量t检验,匹配样本t检验等) 在相依样本t检验中,两个样本可能包含同一个人在两个不同时刻进行测量或者两个联 系的人分别测量的结果(例如,双胞胎的IQ,妻子与丈夫的沟通质量) 准确定义相依样本t检验的关键在于记住两样本间要在某方面存在自然联系。例子? ? 一个国家选举机构的工作人员负责通过民意调查来决定经济和国家安全哪个议题对于 选民更重要。有25个选民被调查以确定两个议题的重要性等级。 每个议题用1~7的等级表示(1=一点也不重要,7=及其重要)。自变量是投票议题( 经济、国家安全),因变量时重要性等级。相依样本t检验的目标和数据要求目标 检验两个相关组别中关 于某些感兴趣的因变量 的均值是否存在显著的 差异 数据要求 具有两个有联系的组或 类别的一个自变量 一个连续因变量 例子 自变量 ?投票议题(经济、国家 安全) 因变量 ?重要性等级(1~7)原假设和对立假设? 原假设表明经济和国家安全的重要性等级之差在总体上为0: H0:? 经济- ? 国家安全=0 ? 对立假设表明经济和国家安全的重要性等级之差在总体上不为0: H1:? 经济- ? 国家安全≠ 0原假设评价相依样本t检验对两个总体均值差为0的原假设进行了检验。 ? 如果t检验产生的结果在原假设正确时看来不可能(结果发生的可能性 小于5%),那么拒绝原假设。 ? 如果t检验产生的结果在原假设正确时看来正确(结果发生的可能性大 于5%),那么不拒绝原假设。研究问题? 在研究中基本的兴趣问题也可以用研究问题 的方式表示。 例如: “对选民来说,经济重要性等级和国家安全是 否存在不同?”在SPSS中输入数据及分析? 数据步骤摘要: ?在SPSS中生成两个变量 ?输入数据 ?选择Analyze>Compare Means>Paired-Samples T Test… ?把两个变量移到Paired Variables框中 ?点击“OK”
Viewer窗口输出结果解释结果? ? ? 配对样本统计量(Paired Samples Statistics) 显示了economy和security的描述统计量,包括样本量、平均值,标准差和标准误差。 请注意,经济的平均重要性等级(均值=5.76)比国家安全(均值=4.60)的高。稍后会考虑着两 个平均等级之间的差异(5.76对4.60)是否大到足以具有统计显著性。 ? 配对样本相关性(Paired Samples Correlations) 除了提到这个相关性等于25个参与者对于经济和国家安全的等级之间的皮尔逊相关系数外,对于解释配 对样本t检验不是重要的。 ? 配对样本检验(Paired Samples Test) ? 对研究的问题提供了答案,就是经济和国家安全的重要性等级间是否存在差异。原假设的检验室以 t的形式显示的,这里t=经济和国家安全的等级之间的均值差/分数差的均值标准差 ? 代入适当的值(均值、均值标准误差)得到t值是t=1.16/0.。这与Paired Samples Test表中t列的值一致。有25个参与者,自由度(df)等于24(参与者数目-1),对应的p-值为 0.005 ? 因为p-值0.005小于0.05,所以均值相等的原假设被拒绝,结论为经济和国家安全的重要性等级有 显著差异。因为检验是显著的,从Paired Samples Statistics中检验均值,发现经济的重要性等 级均值(均值=5.76)比国家安全(均值=4.60)的高。 ? 如果t检验不显著,我们应该假设任何表格Paired Samples Statistics中的均值差异都会导致抽样 错误。效应量? 对相依样本t检验的效应量的估计通常由d给出,其中d=均值差/分数 差的标准差 ? 代入适当的值(均值、标准差)得到效应量为d=1.16/1.86=0.62 ? 科恩约定对于相依样本t检验的小、中和大的效应量分别对应着0.2、 0.5和0.8。根据科恩准则,在实践中效应量0.62被认为非常大,表明 经济的重要性等级比国家安全高,差值为0.62倍标准差。APA格式的结果表达? 在写结果是,除了报告样本均值和样本标准差,还要报告假设检验的 结论,自由度,t值,p-值和效应量。 APA格式的简单书面例子: ? 选民认为经济(M=5.76,SD=1.16)显著重要于国家安全( M=4.60,SD=1.78),t(24)=3.11,p小于0.05,d=0.62。相依样本t检验的假定? 组内观测是独立的 ? 该假定能通过设计研究使得参与者在任何情况下都不相互影响得到满足(参 与者们共同合作确定经济重要性等级是违反独立假定的一个例子)。 ? 违反组内独立性假定将严重损坏相依样本t检验的准确性; ? 如果有理由相信已经违反了独立性假定,就不应该再用相依样本t检验了; ? 重要的是,组间的独立性不是相依样本t检验的假定(我们期望同一个人的两 个分数存在相依性,这是在开始我们使用相依样本t检验的原因) ? 因变量总体服从正态分布 ? 这个假定意味着等级差的总体应该服从正态分布。 ? 对于中等到较大的样本量,绝大部分的非正态分布趋向于对t检验的精确性没 有多少影响,尽管一些非正态分布可能对t检验的功效有不利影响; 第二个假定是涉及分数差而不是原始分数。分数差等于每个参与者的两 个度量之间的差(每个人对经济和国家安全等级评分的差)第8章 一维组间方差分析? ? ? ? ? ? ? ? 例子 一维组间方差分析的目标和数据要求 原假设和对立假设 研究问题 在SPSS中输入数据及分析 效应量 APA格式的结果表达 一维组间方差分析的假定? ?当对感兴趣的因变量在两个或者更多独立组中的均值进行比较时,我们可以 使用一维组间方差分析(ANOVA). 在一维组间方差分析中,自变量是组间因素,每个参与者都仅得到因素的一 个水平(就是说,每个人都在一个单独的组内)例子? ? ? 作为班级需要的研究项目的一部分,一个学生想调查三种学习策略(策略A ,B和C)在单词记忆方面有没有差异。 30个学生同意参与这个研究,每个人都随机分配接受三种策略中的一种(每 10个学生在一个策略组)。 在学习了感兴趣的新策略后,给每个学生15个单词看5分钟,要求使用新策 略记住尽可能多的单词。 片刻之后,每个学生要尽量可能写出他能够记住的单词,同时研究者记录下 每个参与者回忆起的正确单词的数量。 在这项研究中,自变量是学习策略类型(A,B和C),因变量是回忆起的正确 单词的数量??一维组间方差分析的目标和数据要求目标 检验感兴趣的因变量在两 个或者更多的组的均值是 否有显著差异 数据要求 自变量 ?组间因素有两个或更多 单独的组或类别 因变量 ?连续 例子 自变量 ?学习策略(策略A,B和 C) 因变量 ?正确回忆的单词数量原假设和对立假设??原假设是三个组回忆起的单词数量的总体均值相等 H0:?策略A= ?策略B=?策略C 为了说明原假设是错误的,没有必要要求所有组之间彼此互不相同(即使这是一种可 能性)所需要满足的是原假设在某些方面错误(某些组间会存在不同)。 因此不需要产生所有组有可能引起原假设错误的可能性(这将会随组数的 增加而变得乏味),常用的陈述是均值在某些方面有不同。 H0:其中至少一个均值与其他均值不同原假设评价 一维组间方差分析对三个组的总体均值相等的原假设进行了检验。 ? 如果检验产生的结果在原假设正确时看起来不可能(结果发生的可能性小于5%),那 么拒绝原假设 ? 如果检验产生的结果在原假设正确时看起来正确(结果发生的可能性大于5%),那么 不拒绝原假设研究问题? ? 在研究中基本感兴趣的问题也可以用研究问题的方式表示,例如 “回忆起来的单词数量是否依赖于学习策略的类型?”在SPSS中输入数据及分析? 数据word recall.sav步骤摘要: ?在SPSS中生成两个变量(一个是自变量,另一个是因变量) ?输入数据 ?为自变量创建变量值标签。在Value Labels对话框,适当输入数值和标签。 点击“OK” ?从菜单栏中选择Analyze>Compare Means>One-Way ANOVA… ?把因变量移到Dependent List框中,将自变量移动到Factor框中。 ?点击“Options”,选择Descriptive和Homogeneous of Variance Test,点击 &Continue& ?点击“Post Hoc”,选择Tukey,点击&Continue& ?点击“OK”
Viewer窗口输出结果Viewer窗口输出结果Viewer窗口输出结果Viewer窗口输出结果解释结果? 描述统计(Descriptives)? 输出的第一个表格Descriptives为每一组(和全部样本)列出了描述统计量。 ? 检查不同策略的回忆单词的均值可以发现,策略B的均值最高(均值=10.20),其次是 策略A(均值=8.9),最低的是策略C(均值=4.70)。 ? 均值之间的差异是否大到足以具有统计显著性,我们很快将考虑这个问题? 方差齐性检验(Test of Homogeneity of Variances)? 表格Test of Homogeneity of Variances用以检验三组的方差是否相等,它是组间方差 分析的一个假设。SPSS使用Levene建立的程序来检验方差齐性检验 ? Levene检验的原假设和对立假设是: H0:σ2策略A=σ2策略B=σ2策略C(三组的总体方差相等) H1:其中至少一个方差与其他方差不相等 ? 方差齐性检验由表格Test of Homogeneity of Variances中输出的p-值来评定。 如果p≤0.05,拒绝原假设,表明总体方差不相等。 如果p>0.05,不拒绝原假设,假定三组的总体方差相等。 ? 对于我们的数据,Levene检验得到F=0.021(SPSS表中标记为Levene Statistic的值) 和p-值=0.980。由于0.980大于0.05,不拒绝原假设。 ? 因此基于Levene检验的结果,我们假定三组的总体方差不相等。评价方差齐性假设的规则Levene结果 p>0.05 p≤0.05 决策 不拒绝H0 拒绝H0 结论 总体方差相等 总体方差不相等对于我们的数据:p-值 不拒绝 =0.980,0.980>0.05总体方差相等? ANOVA:检验三中策略均值相等的原假设? 表格ANOVA给出了我们研究问题的答案,即三个策略组的单词准确回忆数是否 不同。ANOVA进行了F检验,即方差的比率,而且每个方差在输出结果中表示 为均方(MS)的形式: ? F=组间均方/组内均方。代入适当的值,得到F值为F=82.633/2.170=38.073。 这与ANOVA表中F列出的值一致 ? 该检验有两个自由度,组间自由度(组数目-1)和组内自由度(样本容量总数组的数目),由ANOVA表得到组间和组内自由度分别是2和27。 ? 在ANOVA表格“sig.”列下的p-值为0.000(读作“小于0.001”而不是“0” )。由于p-值小于0.05,拒绝均值相等的原假设,并得出结论,其中至少一个 均值与其他均值不相等。?? ? ? ? ? ?事后检验:评价哪些组不同尽管三组的均值相等的原假设被拒绝了,但是对立假设并不明确,仅仅说明均值在某些方面不同。为了找出这些组如何 不同,需要更深入的检验 一种常见的做法就是检验所有可能的成对的组,通常称为检验配对比较。 SPSS可以提供很多不同的配对比较的检验,最为常见的一种检验是Tukey's post hoc 方法(post hoc 表示“在此之后 ”;Tukey的检验一般在总体ANOVA得到显著结果之后进行解释,也就是说,在原假设被排除后) 在当前三个组的例子中,Tukey程序将进行三个独立检验:A和B,A和C,B和C。 SPSS默认为Tukey检验提供两个不同的输出表格,Multiple Comparisons 和Homogeneous Subsets。尽管其中任一 表格都可以用于解释配对比较的结果,但是通常使用后面的表格Homogeneous Subsets来描述结果。 表格Homogeneous Subsets中,给出了记为“1”和“2”的两个不同的列。在解释表格Homogeneous Subsets产, 生的结果时,共享同一列的组间没有显著差异。例如,策略A、策略B共享同一列(列2),它们之间没有显著差异(策 略A与策略B间的任何差异将被认为是抽样误差所致的)。因为策略C与策略A、策略B不共享同一列,策略C与策略A和 策略B之间有显著差异。 检查表格中给出的三组单词回忆数目均值可以看到,策略C(均值=4.7)低于策略A(均值=8.9)和策略B(均值=10.2 )。 下面表格概括了Homogeneous Subsets表中Tukey检验的结果。? ?检验 A和B A和C B 和C组间是否共享同一列 是 否 否结果 不显著;推测A与B相等 显著;A比C能回忆更多单词 显著;B比C能回忆更多单词? ? ? ?? ? ??作为选择,配对比较的结果可以用Multiple Comparisons表解释。 表格Multiple Comparisons中,在前两栏列出用于检验的两个组,随后是组间的均值 差,标准误差,p-值(sig.)和95%置信区间。 从该表的第一行读起,检验策略A与策略B,得到均值差为-1.3(策略A均值减策略B均 值)和p-值为0.138。因为p-值大于0.05,策略A与策略B之间无显著差异。 下一组配对比较(沿着对角线读)是策略A和策略C,得到均值差为4.2(策略A均值减 策略C均值)和小于0.001的p-值(SPSS中由舍入而表示成0.000)。由于p-值小于0.05 ,策略A和策略C显著不同。检查图表Descriptives中的均值,显示用过策略A(均值 =8.9)的人平均比用过策略C(均值=4.7)的人能回忆起更多单词。 Multiple Comparisons中潜在的混淆部分在于每一个配对比较出现了两次。在A与C的 检验之后,A与B的检验又一次出现,唯一的不同之处在于B出现在前面。 由于B和A的检验与A和B的完全相同(注意到两个检验中p-值完全相等,为0.138),给 出的两个检验没有差别。表格Multiple Comparisons总会产生这种冗余,每次配对比 较的结果出现两次。因此,在解释结果是,请确认对每一配对比较只报告一次。 概述目前的结果,我们报告了A和B与A和C间的检验结果,还剩B和C的检验。沿下一行 的对角线看,我们发现B和C显著不同,p-值小于0.001(依然由于SPSS中舍入关系报告 为0.000)。表格Descriptives中的均值显示出策略B(均值=10.2)显著高于策略C( 均值=4.7)。 总的来说,两种表格的结果相同:A和B之间无显著差异,A和B都显著高于C。效应量? ? ? ANOVA中的效应量通常使用?2 =组间平方和/总平方和。 组间平方和与总平方和可以从ANOVA表格中找到。代入适当的值得到?2 =165.267/223.867=0.74 科恩约定小、中和大的效应量的?2 值分别对应着0.01,0.06和0.14。效应量?2 可以用 因变量的方差被自变量解释的百分比的方式来表示。在实践中效应量0.74被认为对应 一个非常大的效应,表明学习策略解释了单词回忆的方差的74%。APA格式的结果表达? 写结果时,除了报告三个策略组的均值和标准差(如果需要,均值和标准差可以单独 成一张表),还要报告一维组间方差分析的假设检验的结论、自由度(df),F值、p值和效应量。 APA格式的简单书面例子 由于学习策略的使用引起单词回忆数量的变化,F(2,27)=38.07,p<0.05,?2 =0.74 。Tukey的事后检验程序表明使用策略A的人(M=8.90,SD=1.52)和使用策略B的人 (M=10.20,SD=1.40)能够比使用策略C的人(M=4.70,SD=1.49)回忆更多的词。 使用策略A与使用策略B之间在单词回忆数量上没有显著差异。? ?一维组间方差分析的假定? 观测是独立的 ? 该假定能通过设计你的研究使所有参与者不会以任何方式相互影响得到满足。(参与 者们在一起讨论单词表是违反独立假定的一个例子) ? 违反这个假定将严重影响ANOVA检验的正确性; ? 如果有理由相信已经违反了独立性假定,就不应该再用组间方差分析; ? 每组因变量总体服从正态分布 ? 这个假定意味着每个策略组的单词回忆数量的总体应服从正态分布 ? 对于中等到较大的样本量,绝大部分的非正态分布趋向于对ANOVA检验的精确性没有多 少影响,尽管一些非正态分布可能对ANOVA检验的功效有不利影响; ? 每组的总体方差相等 ? 违反方差齐性假定将影响到ANOVA检验的准确度,特别是当各组的样本量不相等时。 ? 解释SPSS中Levene的检验结果,如果方差不相等(需要的话接下来要进行合适的事后 检验,例如Dunnett's T3),选择并报告另一种程序(Brown-Forsythe检验或Welch检 验)来满足该假定。结果解释? ? ? ? ? 1.检验方差齐性的Levene检验 a.如果Levene检验中p>0.05,总体方差相等。解释ANOVA F。 如果ANOVA显著(p≤0.05),解释Tukey事后程序的结果 如果ANOVA不显著(p>0.05),则立即停止,写出组间无显著差异的结果 b.如果Levene检验中p≤0.05,总体方差不相等。选择Brown-forsythe或者Welch程 序(点击Options)来重新分析,并通过点击“Post Hoc”选择其中一个不假设组间 方差相等的事后检验(例如,Dunnett's T3)。与ANOVA和Tukey检验不同,这些检 验不需要方差齐性假设。 如果全部检验(Brown-forsythe或者Welch)显著(p≤0.05),解释事后程序给出的 结果。 如果全部检验(Brown-forsythe或者Welch)不显著(p>0.05),停止。写出组间 无显著差异的结果。? ?如果Levene检验中p≤0.05,总体方差 不相等
第 9 章 二维组间方差分析? ? ? ? ? ? ? ? ? 例子 二维组间方差分析的目标和数据要求 原假设和对立假设 研究问题 在SPSS中输入数据及分析 当交互效应显著时分析主效应 效应量 APA格式的结果表达 二维组间方差分析的假定?二维组间方差分析应用于两个自变量估计一个连续因变量的情况。在二维组间方差 分析中,两个自变量都是包含两个或更多水平的组间因素,这里每个参与者只能接 受每个因素的一个水平。例子?? ????一个研究者想调查物理治疗和放松锻炼对治疗伤背的效果。来自一个当地外科整形 诊所的24名遭受严重背伤的病人被招募参加这次研究。 物理治疗和放松锻炼分别有两种不同方式。 对于物理治疗,一半的参与者(12名)使用拉伸锻炼,另一半的参与者(12名) 使用力量锻炼; 对于放松锻炼,一半的参与者(12名)使用肌肉放松(从头到脚的放松和松弛肌肉 ),另一半的参与者(12名)使用引导意象(一个结构化的可视技术用于放松); 研究计划就是一个物理治疗水平和放松锻炼水平之间的交叉图。这个研究设计导致 四种情形(每种情形分别有6名参与者):拉伸和肌肉放松(单元a),拉伸和引导 意象(单元b),力量和肌肉放松(单元c),力量和引导意象(单元d)。 由于物理治疗有两个水平,放松锻炼也有两个水平,于是得到四种情形,因此这种 设计通常被称作2*2方差分析。放松锻炼肌肉放松引导意象合计拉伸 治物 疗理 力量6名参与者(单元a) 6名参与者(单元c)6名参与者(单元b) 6名参与者(单元d)12 12??这个研究持续六周,每个参与者每周定期接受特定的训练。在六周结束时,每个参与 12 12 24 0表示没 合计 者完成一个评价他们目前疼痛水平的调查问卷(调查问卷分数为 0~60,其中 伤,60表示严重伤)。 在这个研究中,六周后的疼痛水平是因变量,物理治疗和放松锻炼是自变量二维组间方差分析的目标和数据要求目标1.检验主效应 拉伸和力量锻炼对背伤的影 响有差异吗? 肌肉放松和引导意象对背伤 的影响有差异吗? 2.检验交互效应 物理治疗对背伤的影响依赖 于放松锻炼的类型吗?数据要求自变量 两个及以上水平的组间因素例子自变量 ?物理治疗(拉伸和力量) ?放松锻炼(肌肉放松和引导 意象) 因变量 ?六周后的疼痛水平因变量 ?连续原假设和对立假设? 在二维组间方差分析中将检验三个不同的原假设。一个原假设被用来检验每个自变量 (主效应检验),一个原假设用来检验两个自变量的混合效应(交互效应检验)。假 设描述如下: 假设1.物理治疗检验:拉伸和力量锻炼 物理治疗的原假设指出拉伸和力量锻炼带来的平均疼痛水平在总体上是一样的: H0:? 拉伸= ? 力量 对立假设指出两个总体均值不相等: H1:? 拉伸≠ ? 力 假设2.放松锻炼检验:肌肉放松和引导意象 放松锻炼的原假设指出肌肉放松和引导意象带来的平均疼痛水平在总体上是一样的: H0:? 肌肉放松= ? 引导意象 对立假设指出两个总体均值不相等: H1:? 肌肉放松≠ ? 引导意象 假设3.物理治疗和放松锻炼交互效应的检验 原假设指出这两个自变量没有交互效应 H0:没有物理治疗*放松锻炼的交互效应 对立假设指出两者有交互效应 H1:有物理治疗*放松锻炼的交互效应? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? ?原假设评价 二维组间方差分析对上面的三个原假设进行了检验。如果检验产生的结果在原假设正 确时看起来不可能(结果发生的可能性小于5%),那么拒绝原假设。如果检验产生的 结果在原假设正确时看起来正确(结果发生的可能性大于5%),那么不拒绝原假设。研究问题? ? ? ? 在二维方差分析研究中基本的兴趣问题也可以用研究问题的方式表示。 back pai n.sav 对于物理治疗“使用拉伸锻炼和力量锻炼的人们的疼痛水平是否不同?” 对于放松锻炼“使用肌肉放松和引导意象的人们的疼痛水平是否不同?” 对于物理治疗和放松锻炼的交互效应“物理治疗对于背伤的影响是否依赖于肌肉放松 或者引导意象?”数据在SPSS中输入数据及分析数据步骤摘要:?在SPSS中生成三个变量(对应于自变量和因变量) ?输入数据 ?为自变量创建变量值标签。在Value Labels对话框,适当输入数值和标签。点击 “OK” ?从菜单栏中选择Analyze>General Linear Model>Univariate… ?把因变量移到Dependent Variable框中,将自变量移动到Fixed Factor(s)框中。 ?点击“Options”,把因素和交互效应移到Display Means for框中。选择Descriptive statistics,Estimates of effect size和Homogeneity tests,点击&Continue& ?点击Plots”。把有最大水平数的因素(如果有关)移到Horizontal Axis框中,其它因 素移到Separate Lines框中,点击“Add”,点击“Continue”,可以生成一个条形图。 ?如果哪个因素有三个或三个以上的水平,点击“Post Hoc”,把这个变量移到Post Hoc Test for框中。选择Tukey(不是Tukey’s-b)。点击“Continue”。 ?点击“OK”
生成条形图步骤:? ? ? ? ? ? ? ? ? 打开菜单,选择Graphs>Legacy Dialogs>Bar… 打开Bar Charts对话框 选择“Clustered” 在Data in Chart are下确保Summaries as group of cases被选中 点击”Define” 把phyther移到Category Axis框中 把relax移到Define Clusters by框中 在Bars Represent 下,选择Other statistics(例如,均值),然后把pain移到 Variable框中。 点击“OK”
解释结果:? 组间因素(Between-subjects Factors) Between-subjects Factors表显示研究的所有因素(自变量),每个因素的水平数目,变量值标 签,变量每个水平的样本量。注意到phyther和relax因素的每个水平有12名参与者,这与我们的 研究是一致的。 描述统计量(Descriptive Statistics) Descriptive Statistics表显示研究中每种情况(和每个因素的每个水平)的均值、标准差和样本量 。我们以后将集中注意Estimated Marginal Means(估计边际均值)表的结果来解释输出结果中 的组间均值差。在写出结果时,我们将使用该表中的标准差。 误差方差齐性Levene检验(Levene’s Test of Equality of Error Variances) 表Levene’s Test of Equality of Error Variances ,对我们研究中的四个单元(情况)的方差是 否相等提供了检验,这是二维方差分析的一个假设。 Levene检验的原假设和对立假设为:??H0:σ21.1=σ22.1=σ22.2(四个单元的方差总体相等) H1:其中至少一个方差与其他方差不相等通过检查输出结果中表格Levene’s Test of Equality of Error Variances中的p-值(sig.)来评 价方差相等假设。如果p≤0.05,拒绝原假设,认为总体方差不等。若p>0.05,不能拒绝原假设, 假设研究中的四个单元方差相等。 Levene检验得到F值为1.248,p-值为0.322.。由于0.322远大于0.05,不能拒绝方差相等的假 设,假设研究中的四个单元方差相等。? 组间效应检验(Test of Between-Subjects Effects) ? 表Test of Between-Subjects Effects显示了主效应(phyther和relax)和交互效应 (phyther*relax)的结果。在二维方差分析中,对每个主效应和交互效应进行了独立 F检验。F检验是两个方差的比值,每个方差在输出中表示为均方(MS): ? F=MS Effect/MS Error式中MS Effect表示感兴趣检验的均方,MS Error表示Test of Between-Subjects Effects表中的均方误差值。为计算感兴趣检验的F值,在式中代入 具体的MS值。例如:phyther的MS值为,MS Error为30.992,则phyther的F值 为:F=.992=41.174。这个检验产生了phyther的p-值是0.000(应读做小 于0.001).由于p-值小于0.05,拒绝原假设,而且可知拉伸和力量锻炼对背伤的影响 是显著不同的。 ? 在Test of Between-Subjects Effects表中给出的下一个检验是关于relax的,对 relax的检验产生自由度为1(relax的水平数-1)和20(误差自由度)上的F值为17.78 (551.042/30.992)。在方差分析表关于relax的p-值是0.000。由于p-值小于0.05, 拒绝原假设,而且可以得知肌肉放松和引导意向对背伤的影响是显著不同的。 ? 最后一个感兴趣的检验是对phyther*relax的检验,在自由度为1((phyther的水平数 -1)*(relax的水平数-1))和20(误差自由度)上的F值为9.714(301.042/30.992 ).交互检验的p-值为0.005,由于其低于0.005,我们拒绝原假设,可以得知phyther 和relax有显著的交互效应。? 估计边际均值(Estimated Marginal Means) ? Estimated Marginal Means产生一系列表格,分别对应每个因素和交互效应。均值边 际表对显著结果的方向性有好的解释。由于三个检验都是显著的,下面每个均值边际 表都将被讨论(在一个检验不是显著的情况下,任何边际均值之间的差别将被认为是 出于样本误差,而且将不被描述)。 ? 第一个表phyther显示了两种物理锻炼方法的边际均值。由于phyther是显著的,我们 将考察平均值去看看哪一组有较低的疼痛水平。边际均值表显示拉伸情况报告的疼痛 水平(32.5)显著低于力量锻炼情况(47.08)。 ? 第二个表relax显示了两种放松锻炼方法的边际均值。由于relax是显著的,我们将考 察平均值去看看哪一组有较低的疼痛水平。边际均值表显示肌肉放松情况报告的疼痛 水平(35.0)显著低于引导意向情况(44.58)。 ? 边际均值的最后一个表phyther*relax显示了显著交互效应的均值。研究中的四个单元 均值均被显示,每组的均值代表感兴趣的单元的六个参与者的平均疼痛水平。为了更 准确地确定交互效应,这个表被稍加修改,如下表:拉伸 肌肉放松 引导意象 均值差 24.167 40.833 16.666力量 45.833 48.333 2.500放松锻炼的边际均值 35.000 44.583 9.583? 上表中第一列的值表明对那些处于拉伸锻炼的人来说,肌肉放松带来的疼痛水平( 24.167)平均比引导意象(40.833)低16.666分。下一列给出力量锻炼情况的均值, 表明肌肉放松带来的疼痛水平仅仅比引导意象低2.50分(45.833对48.333)。这些均 值差说明存在交互效应:对于拉伸锻炼,肌肉放松和引导意象之间的差距很大( 16.666),而对于力量锻炼,肌肉放松和引导意象之间的差距较小(2.50)。一个明 显的交互效应指出这些差距(16.666对2.50)说明它们之间存在显著不同。比较这四 种情况下的相对平均疼痛水平,可以看出肌肉放松和拉伸锻炼一起进行的患者有较低 的疼痛水平(24.167是所有参与者中最低的疼痛水平)。 ? 交互效应的图像显示 轮廓图(Profile Plots) ? 轮廓图在研究中展示四种情况的单元均值。在图像中,Phyther的水平在x轴上,拉伸 在左,力量在右。图中的线表示relax的不同水平,实线代表引导意象,须线代表肌肉 放松。 ? 在图的左侧,两点的差值表示在拉伸锻炼下肌肉放松换个引导意象的差异(差值是 16.666分)。在图的右侧,两点的差值表示在力量锻炼下肌肉放松和引导意象的差异 (差值是2.50分)。回忆交互效应,表明这两个差异(16.666对2.50)显著不相等。 当对均值作图时,这个差异导致(明显)不平行的两条线,这是交互的另一种表现形 式。条形图 ? 条形图和轮廓图描述同样的信息――研究中的四种情况的单元均值。 ? 条形图中,phyther在横轴(x轴),relax的各个水平被画成不同的条形。四种情况 中的每一种的平均疼痛水平等于纵轴(y轴)上的条形的高度。 ? 在左边的前两个条形表明在拉伸情况下肌肉放松的疼痛得分低于引导意象的得分(差 值是16.666分)。结果表现为对拉伸情况而言,图中相邻条形的在高度上有显著差异 。 ? 右边两个条形是关于力量锻炼的。注意到这两个条形在高度上非常接近,肌肉放松稍 低于引导意象,在两种情况下疼痛的差距非常小(2.50分)。 ? 从条形图上看,一个显著的交互效应表明x轴上所有水平的相邻条形的高度是不一样的 (这是表示16.666明显不同于2.50的另一种方式)。那么使用哪一种图像呢? ? 当至少有一个自变量是区间或比例变量(即使在研究中该变量已被分类)时,我们使 用轮廓图, ? 当两个自变量是名义变量或有序变量时使用条形图。 因为我们的两个自变量是名义变量(它们没有内在的顺序),所以我们使用条形图。当交互效应显著时分析主效应? 当交互效应显著时,显著的主效应可能被误解(取决于结果的性质),因此应当小心 解释结果。relax的显著主效应说明肌肉放松和引导意象是显著不同的,肌肉放松的疼 痛水平比引导意象低9.583分(35.000对44.583).这是relax主效应预测的差,可以 通过把拉伸和力量两种情况下的均值差进行平均得到((16.666+2.50)/2=9.583) 。然而,显著的交互效应说明放松锻炼的差异依赖于物理治疗类型:对于拉伸锻炼, 这个差异其主效应的预测值(16.666对预测值9.583),然而对于力量锻炼,差异较 小(2.500对预值9.583)。因此,使用主效应描述放松锻炼的差异错误地表示两个值 ,低估了拉伸锻炼的差异,高估了力量锻炼的差异。 然而如果没有显著交互效应,主效应将恰当地表现组之间的差异。?? 简单效应 ? 当出现显著的交互效应时,接下来可能使用简单效应分析进行进一步的效应检验。 ? 简单效应分析是在其他因素处于某个单一水平时比较一个因素的效应(例如在引导意 象情形下研究拉伸和力量锻炼的差异)。 ? 简单效应分析可以在SPSS中使用LMATRIX命令来执行,或者对感兴趣的检验进行独 立样本t检验。效应量? 二维组间方差分析的效应量通常使用偏?2度量。为了计算偏?2,使Test of BetweenSubjects Effects表中的平方和(SS)(在输出结果中以Type III sum of Squares形 式表示)。偏?2的计算公式如下:偏?2=SSEffect/(SSEffect+SSError) SSEffect对应感兴趣效应的平方和,SSError对应误差的平方和。为了计算给定的感兴趣 的偏?2,代入合适的SS值,例如phyther的SS值为1276.04,SSError为619.83。把这 些值代入公式得到偏?2:偏?2=1276.04/(.83)=0.67 偏?2的取值范围为0~1,偏?2值越大,表示因变量的方差被效应解释的越多。??APA格式的结果表达? 在写二维组间方差的结果时,除了报告均值和标准差,还要报告假设检验的结论、自 由度(df)、F值、p-值和效应量。如果交互效应显著,通常还需要提供一个条形图或 者轮廓图。 APA格式的书面例子 执行了2*2组间方差分析,背伤为因变量,物理治疗(拉伸/力量)和放松锻炼(肌肉 放松/引导意象)为自变量。结果显示为物理治疗有显著效应,F(1,20)=41.17,p< 0.67,偏?2=0.67,那么进行拉伸锻炼(M=32.5,SD=10.41)的人疼痛显著小于那些进 行力量锻炼的人(M=47.08,SD=5.04)。对于放松锻炼也有显著的主效应,F(1,20) =17.78,p<0.05,偏?2=0.47,那些进行肌肉放松(M=35.0,SD=12.31)的人的疼痛 显著小于那些使用引导意象的人(M=44.58,SD=6.95).还有一个显著的物理治疗和放 松锻炼的交互效应,F(1,20)=9.71,p<0.05,偏?2=0.33。对于力量锻炼,肌肉放 松和引导意象在背伤方面的影响没有多大区别,而对于拉伸锻炼,肌肉放松和引导意 象在背伤方面的影响有着很大的区别,其中肌肉放松和拉伸锻炼一起大大减小背伤疼 痛。总之,接受肌肉放松和拉伸锻炼的参与者报告的疼痛要比其他情况少很多。? ?二维组间方差分析的假定? 观测是独立的 ? 该假定能通过设计你的研究使所有参与者不会以任何方式相互影响得到满足。违反这 个假定将严重影响方差分析结果的正确性; ? 如果有理由相信已经违反了独立性假定,就不应该再用组间方差分析; ? 每个单元的因变量总体服从正态分布 ? 这个假定意味着每个单元的因变量总体应该服从正态分布 ? 对于中等到较大的样本量,绝大部分的非正态分布趋向于对于结果的准确性没有多少 影响,尽管一些非正态分布可能影响方差分析的功效; ? 每个单元的总体方差相等 ? 这个假定意味着每个单元的总体方差应该相等; ? 违反方差齐性假定将影响到方差分析结果的准确性,特别是当每组的样本量不相等时。 ? SPSS中的Levene检验结果的解释满足了这个假定。如果违反了方差相等的假定,而且 每个单元的样本量也不相等,那么不能使用二维方差分析(SPSS目前还没有内置程序 可以运行方差不等的二维方差分析)。第 10 章 一维组内方差分析? 一维组内方差分析应用于一个自变量估计一个连续因变量的情况。在一维组内方差分 析中,自变量是一个包含两个或更多水平的组内因素,而且每个参与者接受自变量的 所有水平。例子? ? 一位学校心理学者想评估一个全新的社交能力训练计划的潜在效果。 这个计划旨在教孩子们与其伙伴建立良好的朋友关系。25名有交友障碍的四年级学生 参加这次为期16周的训练。在社交能力训练之前,第8周时和结束时测量这25名孩子 的社交能力(由老师排名)。社交等级被用来表达学生的交友能力。这个等级分数为 6~60分不等,当然分数越高,表示社交能力越强。在该研究中,自变量是时间(开始 时,第8周、第16周),因变量是社交能力得分。一维组内方差分析的目标和数据要求目标检验两个及更多相关组的均 值关于同一个因变量是否差 异显著数据要求自变量 两个及更多水平的组内因素 因变量 ?连续例子自变量 ?时间(开始,8周,以后) 因变量 ?社交能力得分原假设和对立假设? ? ? 原假设指出在各个时刻的平均社交能力得分在总体上是一样: H0:? 之前= ? 8周= ? 之后 H1:至少有一个均值与其他两个均值不同原假设评价: ? 如果检验产生的结果在原假设正确时看起来不可能(结果发生的可能性小于5%),那 么拒绝原假设。 ? 如果检验产生的结果在原假设正确时看起来正确(结果发生的可能性大于5%),那么 不拒绝原假设。研究问题? ? 在研究中基本的感兴趣问题也可以用研究问题的方式表示,例如 “在16周社交能力训练之前,之中和之后的社交能力有差异吗?”在SPSS中输入数据及分析数据步骤摘要 ? 在SPSS中生成数量等于组内因素水平数的变量。 ? 输入数据 ? 从菜单栏中选择Analyze>General Linear Model>Repeated Measures… ? 在Within-Subject Factor Name 中输入组内因素的名称,然后在Number of Levels框 中输入水平数。点击“Define”。 ? 把变量(组内因素的所有水平)移到Within-Subjects Variables框中。 ? 把因变量移到Dependent Variable框中,将自变量移动到Fixed Factor(s)框中。 ? 点击“Options”,把组内因素移到Display Means for框中。在Display下选择 Descriptive statistics,Estimates of effect size,点击&Continue& ? 点击“OK”
结果解释组内因素(Within-Subjects Factors) ? 表Within-Subjects Factors显示了度量参与者的三个时刻,包括训练之前(before) ,训练8周(week8)和训练结束时(after) 描述统计量(Descriptive Statistics) ? 表Descriptive Statistics显示三个时刻中的每一时刻的均值和标准差。注意到社交得 分最低的是before的22.48分,其次是对应week8的22.72分,对应after的24.88分。 多元检验(Multivariate Tests) ? 三个时刻的均值在总体上相等的原假设可以使用单变量检验(ANOVA)或者多变量检 验( MANOVA )。 Multivariate Tests表提供了四种不同的多变量检验的结果。因为 多元检验的结果可以自动给出,而且多元检验的程序已经超出本章研究内容,所以我 们这里不讨论。感兴趣的读者可以参考Maxwell and Delancey(2004)或者 Stevens(2002)以了解详细信息。Mauchly球形检验(Mauchly’s Test of Sphericity) ? 表格Mauchly’s Test of Sphericity提供了对球形假设的检验,当组内因素有三个或更 多水平时,这是组内方差分析的一个假设。该假设的检验是由Mauchly’s Test of Sphericity表提供(检验的p-值是0.056)。这个检验是不精确的(详细信息可以参考 Howell(2007)或者Maxwell and Delaney(2004)),因此不必考虑(将提供一个替代 的方法来检验球形假设)。 ? 如果球形假设不满足,则标准方差分析F检验(在Test of Within-Subjects Effects 表中记为Sphericity Assumed)将不准确,产生的结果将比保证的更多地拒绝一个真 实的原假设。 ? 当违反球形假设时,由于F检验的不精确性,有几个替代的F检验被调整适用于缺乏球 形假设的情况。在Test of Within-Subjects Effects表中提供了三个替代程序: Greenhouse-Geisser,Huynh-Feldt和Lower-bound。 ? 在违反球形假设时,每个方法都试图调整标准方差分析F检验的不精确性。由于 Mauchly球形检验不精确,我们绕过这个方法,在SPSS中小心的选择一个调整方法来 得到结果(也就是说,我们假设球形假设被违背,所以这样做),在这三种方法中, Lower-bound方法由于很少拒绝原假设,显得过于谨慎(称之为保守),因此不推荐 这种方法,只有在剩下的两种方中选择。两者都可以提供相对精确的效果,但 Greenhouse-Geisser方法略显保守(它经常比确保的要较少拒绝原假设),而 Huynh-feldt方法稍微自由些(经常拒绝原假设)。我们将采用更严谨的方法并且解释 Greenhouse-Geisser调整方法(尽管这将在功效上有点损失)。 ? 当违反球形假设时,Greenhouse-Geisser调整方法提供了一个比标准F值检验更精确 的结果,由于手算比较烦琐,只有依靠计算机帮助。因此,那些想用SPSS确认手算结 果的人将使用球形假设(Sphericity Assumed)值。组内效应检验(Test of Within-Subjects Effects) ? 表格Test of Within-Subjects Effects给我们研究的问题提供了答案,即三个时刻的社 交能力得分是否不同。方差分析产生一个F检验,F检验是两个方差的比值,每个方差 在输出中表示为均方(MS):F=MS Time/MS Error(time),把表Test of WithinSubjects Effects中在Greenhouse-Geisser行的值代入公式得到F值为: F=53.343/3.731=14.298。这与方差分析表中对于Greenhouse-Geisser解释的F值 一致(球形假设F值(Sphericity Assumed F)也为14.928;作为一个提醒,如果你 想把这个结果与手算的比较,将使用球形假设值)。 ? 对于Sphericity Assumed值,方差检验产生了time 的自由度(df=水平数-1)和误差 自由度(df=(总样本量-1)×(水平数-1)),自由度分别为2和48。为获得 Greenhouse-Geisser自由度,一个调整的方法是应用球形假设自由度来补偿数据中 球形的缺失。事实上,如果你看前面的表Mauchly's Test of Sphericity,你将会看到 Greenhouse-Geisser的epsilon统计值为0.819。这个值再乘以自由度(2,48)将 产生(有舍入误差的)自由度1.638和39.305,这些在Greenhouse-Geisser检验中 有记录。 ? 在&sig.&列中的Greenhouse-Geisser的p-值是0.000(应读作小于0.001)。由于p值小于0.05,则拒绝三个时刻均值相等的原假设(使用球形假设也可以拒绝原假设) 。 ? 在讨论输出结果的其他三个表之后,将进行其他检验来检查这三个时刻差异的本质。组内对照检验(Test of Within-Subjects Contrasts)和组间效应检验(Test of Between-Subjects Effects) ? 接下来的这两张表Test of Within-Subjects Contrasts和Test of Between-Subjects Effects将不会出现在一维组内方差分析的讨论中,然而Test of Within-Subjects Contrasts表可以用于对time的某些进一步检验中,我们将进行相依样本t检验,因为 它们不需要球形假设。 ? Test of Between-Subjects Effects表给出了研究中任一组间因素的结果。因为我们 在研究中不使用组间因素,所以这个表在这里不相关(将在11章讨论该表)。 估计边际均值(Estimated Marginal Means) ? Estimated Marginal Means表对于三个时刻分别提供了均值、标准误差和95%置信区 间。虽然前面的Descriptive Statistics 表也提供了每组的均值,两个表之间的区别是 Estimated Marginal Means表还提供了每个组的标准误差和95%置信区间,而 Descriptive Statistics 表则提供标准差和样本大小。在总体方差分析得到显著性结果之后的进一步检验? 由于time的检验是显著的(复习一下Test of Within-Subjects Effects部分),关于 三个时刻的社交能力得分相等的原假设被拒绝。然而由于对立假设不明确,仅仅说明 均值在某些程度上不一致,需要进一步检验来确定哪个时刻显著不同于其他时刻。我 们进一步检验采取的方法类似于第8章的一维组间方差分析。回想一下组间方差分析, 如果全部检验是显著的,所有配对比较将使用Tucky检验法来检验。 ? 对于组内方差分析,所有的配对比较将使用相依样本t检验,这是组内方差分析的一个 合适的进一步程序。这将导致3个配对t检验,before对week8,before对after和 week8对after。在SPSS中进行相依样本t检验的命令总结如下(相依样本t检验的详细 内容见第7章) 进行三个相依样本t检验操作步骤: ? 从菜单栏中选择Analyze>Compare Means>Paired-samples T Test... ? 打开Paired-Samples T Test对话框,选择变量before和week8,点击向右按键使它们 移到Paired Variables框中。 ? 对于before和after、week8和after重复这个操作,所有三对变量应当出现在Paired Variables框中 ? 点击“OK”
T检验:三个时刻的配对比较? 在对所有可能的配对比较进行t检验时,检验下面的三个原假设: H0:μ之前=μ8周 H0:μ之前=μ之后 H0:μ8周=μ之后 ? 在进行进一步检验时,一个习惯做法是调整每个检验的α水平使得整个进一步检验α值 不超过0.05(每次检验使用的α值被当做每次比较的α水平)。为了求出每次检验的α水 平,设置整个检验的总体水平(0.05),然后再除以进一步检验执行的次数。对于三 次检验以及α水平为0.05,每次比较的α水平是0.05/3=0.016(只舍不入是为了保证三个 检验的总和不超过0.05)。这就意味着代替了每次用α水平0.05来评价检验,而是用每次 检验的p-值与α水平0.016相比较。如果p-值小于或等于0.016,则拒绝感兴趣比较的原 假设;如果p-值大于0.016,则不能拒绝原假设。这样将保证整个进一步检验犯第一类 错误的概率不超过0.05(如果不这样调整,每个进一步检验都用0.05来执行,那么一系 列检验的总体α水平将接近三个检验的水平之和,即0.15)。 三个配对比较的结果在Paired Samples Test表中显示。这些结果指出第一个检验 before和week8之间不显著,这是由于其p-值为0.622,大于0.016。其余两个检验 before和after以及week8和afrer都是显著的,p-值为0.000(p<0.001)。由于后两者 差异显著,我们考察在Paired-Samples Statistics表显示after时刻的社交能力得分( 24.88)明显高于before时刻(22.48)和week8时刻(22.72)。?效应量? 一维组内方差分析的效应量通常使用偏?2度量。为了计算偏?2,使 Test of Within-Subjects Effects表中的平方和(在输出结果中以 Type III sum of Squares形式表示)。偏?2的计算公式如下:偏 ?2=SSEffect/(SSEffect+SSError) ? SSEffect对应感兴趣效应的平方和,SSError对应误差的平方和。对于 time,SSEffect和SSError值在Test of Within-Subjects Effects表中为 SStime和SSError(time),代入合适的SS值,得到偏?2:偏?2=87.360/ (87.360+146.640)=0.373 ? 这个结果与Test of Within-Subjects Effects中对time报告的值是一 致的 ? 还没有提供常规的对偏?2的小、中和大效应的度量方法。偏?2值越大 ,表示因变量的方差被效应解释的越多。APA格式的表达结果? 在写一维组内方差分析的结果时,除了报告每个时刻社交能力得分的均值和标准差, 还要报告假设检验的结论,自由度(df),F值,p-值,效应量和配对比较结果(假定 总体方差是显著的)。 简单的APA格式的书面例子 儿童社交能力的得分在各个时刻是显著不同的,Greenhouse-Geisser调整F( 1.64,39.31)=14.30,p<0.05,偏?2=0.37。独立样本t检验用来说明哪个时刻是不同于 其他的,每个检验的水平为0.016。结果表明在训练结束时的社交能力得分( M=22.88,SD=7.20)明显高于训练8周的得分(M=22.72,SD=7.35),t(24)=5.54,p<0.016,而且比较了训练结束时的得分与训练开始时的得分(M=22.48, SD=8.10),t(24)=-4.06,p<0.016,但是在训练开始和训练8周时没有显著差异, t(24)=-0.50,p<0.016。 (注意:如果你正在使用球形假设值,用值(2,48)替换Greenhouse-Geisser的自 由度(1.64,39.31),并且从结果中删去“Greenhouse-Geisser调整”,其他所有 结果仍然保持不变)。? ??一维组内方差分析的假定? ? 参与者间的观测是独立的 违反这个假定将严重影响组内方差分析结果的正确性(教师一起工作确定学生的社交能力得分的排 名是违反独立假定的一个例子); 如果有理由相信已经违反了独立性假定,就不应该再用组内方差分析; 在自变量每个水平上的因变量总体服从正态分布 这个假定意味着社交能力对每个研究的单元在总体上要服从正态分布(例如,社交能力得分应该在 before,week8和after时刻服从正态分布) 对于中等到较大的样本量,绝大部分的非正态分布趋向于对于方差分析检验的结果的准确性没有多 少影响,尽管一些非正态分布可能影响方差分析的功效; 球形假定 球形假定要求组内因素的所有配对水平上的差值得分的总体方差都是相等的,例如,如果你计算每 个参与者组内因素的头两个水平的差异(before-week8),然后计算这些得分的方差(方差为标准 差的平方),对所有水平组合再重复这个程序(before-after和week8-after),球形假定要求者三 者的方差一致 :σ 2before-week8=σ 2before-after=σ 2week8-after 违反这个假定将影响方差分析的精确性,导致原假设较多的被拒绝。使用一个替代的方法(如 Greenhouse-Geisser)适用于球形存在的情况,这强调了对这个假定的违反。由于多元方差分析 (MANOVA)不需要球形假定,这是个可行的选择,即使讨论它已经超出我们这节的内容。? ? ?? ? ??第11章 组间组内方差分析? 组间组内方差分析应用于两个自变量估计一个感兴趣的因变量的情况。在组间组内方 差分析中,其中一个自变量是组间因素,另一个自变量是组内因素。组间因素包含两 个或更多的水平,每个参与者只接受一个处理的水平。组内因素也包含两个或更多水 平,每个参与者接受处理的所有水平。例子? 一个研究者想调查为新中学老师设计的导师计划是否可以有效的减轻压力。20名新老 师参加了这次研究,其中10名老师接受导师计划,另外10名 为控制组(也就是不接受 任何导师指导)。这个导师计划中,这些新老师被指派了一名导师来讨论他们在刚开 做老师时遇到的一些困难(如教师管理等)。在同意参加这次研究后,这些新老师分 别在正式执教之前1周,执教4周和执教8周后记录一个压力评分。压力评分为20~80分 ,分数 越高表示相应的执教压力越大。在这个研究中,指导(support,两个水平-有 导师或者没有导师)是组间因素,时间(time,三水平-计划开始前,进行4周后和进行8 周后)是组内因素,而因变量时这些老师的压力评分。组间组内方差分析的目标和数据要求目标检验主效应 ?有导师和没有导师的老师 压力水平有差异吗? ?计划开始前,进行4周后和 进行8周后的压力水平有差 异吗? 检验交互效应 ?指导(有导师,没有导师) 的影响依赖于时间(计划开 始前,进行4周后和进行8周 后)吗?数据要求自变量 ?一个组间因素(有两个或 更多水平) ?一个组内因素(有两个或 更多水平)例子自变量 ?指导(有导师,没有导师) ?时间(计划开始前,进行4 周后和进行8周后) 因变量 ?教学压力得分因变量 ?连续原假设和对立假设? 在一维组间组内方差分析中,使用了三个不同的原假设。一个原假设用来检验每个变量(常说的主 效应检验),一个原假设用来检验两个自变量的混合效应(常说的交互效应检验)。这些假设如下 面描述: 假设1:对指导进行检验:有导师对没有导师 ? 指导的原假设指出有导师和没有导师的老师的评价压力在总体上是一样的: H0:μ有导师=μ无导师 ? 对立假设指出有导师和没有导师的老师的平均压力在总体上是不一样的。 H1:μ有导师≠μ无导师 假设2:对时间进行检验:计划开始前,进行4周后和进行8周后。 ? 时间的原假设指出计划开始前,进行4周后和进行8周后的平均压力总体上是一样的:H0:μ指导前=μ4周=μ8周 ? 当一个因素有三个或更多水平时,对立假设指出因素的不同水平之间有差异。 H1:至少有一个总体均值与其他均值不同假设3:指导和时间的交互效应检验 ? 原假设指出指导和时间之间没有交互效应 H0:没有指导×时间的交互效应 ? 对立假设指出两个变量之间有交互效应 H1:有指导×时间的交互效应 原假设评价 ? 组间组内方差分析对上面三个原假设进行了检验。如果检验产生的结果在原假设正确时看起来不可 能(结果发生的可能性小于5%),那么拒绝原假设。如果检验产生的结果在原假设正确时看起来 正确(结果发生的可能性大于5%),那么不拒绝原假设。研究问题? 在组间组内方差分析研究中基本感兴趣的问题也可以用研究问题的方式表示, 例如 ? 对于指导 “有导师指导和没有导师指导的老师报告的压力水平是否不同?” ? 对于时间 “计划开始前,进行4周和进行8周后报告的压力水平是否不同?” ? 对于指导和时间的交互效应 “报告的压力水平随时间变化是否依赖于接受导师的指导?”在SPSS中输入数据及分析? 数据teaching stress.sav步骤摘要? ? ? ? ? 对组间因素生成一个变量,对组内因素的每个水平生成一个独立的变量。 给每个组间变量建立变量值标签。在Value Labels对话框中,输入适当的数值类型, 点击“OK”。 输入数据 选择Analyze>General Linear Model>Repeated Measures... 在Repeated Measures Define Factor(s)对话框中,在Within -Subjects Factor Name框中输入组内因素的名字,然后在Number of Levels框中输入水平数目。点击 “Define”。 在Repeated Measures对话框中,把组间因素移到Between-Subjects Factor(s)框 中。把组内因素的使用水平移到Within -Subjects Variables框中。 点击“Options”。把所有因素和交互效应变量移到Display Means for框中。在 Display下选择Descriptive statistics 和Estimates of effect size,点击 “Continue”。 点击“OK”? ??
结果解释? ? ? ? ? ? 组内因素(Within-Subjects Factors) Within-Subjects Factors列出了度量参与者的三个时刻,包括计划开始前(before) ,进行4周后(week4)和进行8周后(week8)。 组间因素(Between-Subjects Factors) Between-Subjects Factors表格显示了组间因素support,support的变量值标签和 每组的样本量。 描述统计量 表格Descriptive Statistics显示了研究中每种情况的平均值、标准差和样本量(time 的水平显示在表中的Total栏下)。我们将以后聚焦于输出结果中的表格Estimated Marginal Means(估计边际均值)解释均值差,而且我们将在写结果中使用表中的标 准差。 多元检验 对于time和交互项time×support的原假设可以使用单变量检验或者多变量检验。表 格Multivariate Tests对于time和time×support提供了四种不同的检验方法。因为多 元检验的结果可以自动给出,而且多元检验的程序已经超出本章研究内容,所以我们 这里不讨论。感兴趣的读者可以参考Maxwell and Delancey(2004)或者 Stevens(2002)以了解详细信息。? ?Mauchly球形检验(Mauchly’s Test of Sphericity) ? 表格Mauchly’s Test of Sphericity提供了对球形假设的检验,当组内因素有三个或更 多水平时,这是组内方差分析的一个假设。该假设的检验是由Mauchly’s Test of Sphericity表提供(检验的p-值是0.006)。这个检验是不精确的(详细信息可以参考 Howell(2007)或者Maxwell and Delaney(2004)),因此不必考虑(将提供一个替代 的方法来检验球形假设)。 ? 如果球形假设不满足,则方差分析F检验(在Test of Within-Subjects Effects 表中 记为Sphericity Assumed)将不准确,产生的结果将比保证的更多地拒绝一个真实的 原假设。 ? 当违反球形假设时,由于F检验的不精确性,有几个替代的F检验被调整适用于缺乏球 形假设的情况。在Test of Within-Subjects Effects表中提供了三个替代程序: Greenhouse-Geisser,Huynh-Feldt和Lower-bound。 ? 在违反球形假设时,每个方法都试图调整标准方差分析F检验的不精确性。由于 Mauchly球形检验不精确,我们绕过这个方法,在SPSS中小心的选择一个调整方法来 得到结果(也就是说,我们假设球形假设被违背,所以这样做),在这三种方法中, Lower-bound方法由于很少拒绝原假设,显得过于谨慎(称之为保守),因此不推荐 这种方法,只有在剩下的两种方中选择。两者都可以提供相对精确的效果,但 Greenhouse-Geisser方法略显保守(它经常比确保的要较少拒绝原假设),而 Huynh-feldt方法稍微自由些(经常拒绝原假设)。我们将采用更严谨的方法并且解释 Greenhouse-Geisser调整方法(尽管这将在功效上有点损失)。 }