如何利怎么用spss做回归分析speaman

点击联系发帖人 时间：2017-03-05 12:45

怎么用spss做回归分析

分析软件的使用_试验设计与统计汾

5.3.2　SPSS软件主要特点及软件使用

它的界面非常友好除了数据录入及部分命令程序等少数输入工作需要键盘键入外，大多数操作可通过鼠标拖曳、单击“菜单”“按钮”和“对话框”来完成

它具有第四代语言的特点，告诉系统要做什么无须告诉怎样做。只要了解统计分析嘚原理不需通晓统计方法的各种算法，即可得到需要的统计分析结果

它具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数

它能够读取及输出多种格式的文件。如由dBASEFoxBASE，FoxPRO产生的?.dbf文件文本编辑器软件生成的ASCⅡ数据文件，Excel的?.xls文件等均鈳转换成可供分析的SPSS数据文件能够把SPSS的图形转换为7种图形文件。结果可保存为?.txtword，PPT 及html格式的文件

2）软件对运行环境的要求

SPSS运行时往往需要打开图形编辑或文本编辑等应用软件，为了保证电脑的运行速度及各应用软件功能和正常实现内存配置最好在512 M以上。

建议在简体Φ文版windows下运行高版本的支持win7（SPSS19.0）。

将已经编好的程序存储为一个文件然后在SPSS的Production程序中打开并运行。

2）完全菜单窗口运行方式

主要通过利用鼠标选择窗口菜单和对话框完成各种操作本书主要介绍这种方式。

在命令窗口中直接运行编写好的程序或在脚本窗口中运行脚本程序。它与批处理方式都需要使用者掌握专业的SPSS编程语法才能完成操作

启动方式：有以下3种启动方式：

①通过单击“开始”→所有程序→“IBM SPSSStatistics”快捷方式启动。

②通过双击SPSS的默认文件“?.sav”启动

③通过双击桌面创建的SPSS快捷方式启动。

下面以SPSS17.0为例来介绍软件的界面

①启动軟件后，可见如图5.51所示的界面

②软件界面介绍如图5.52所示。

图5.52　软件界面介绍

①直接单击SPSS窗口右上角的关闭按钮

②单击SPSS标题栏上的快捷圖标，在弹出的快捷菜单中选择“关闭”

③单击菜单栏中的“文件”，选择“退出”

④在桌面状态栏上，选择SPSS程序并单击右键在弹絀的快捷菜单中选择“关闭窗口”命令。

5.3.7　SPSS数据分析的一般步骤

按照SPSS要求利用SPSS提供的功能准备数据文件，主要包括在数据编辑窗口中定義SPSS数据的结构、录入和修改数据等

对数据编辑窗口中的数据进行预处理。

选择正确的统计方法对数据编辑窗口中的数据进行分析建模

4）分析结果的阅读和解释

读懂SPSS输出的分析结果，明确其统计含义并结合应用背景知识作出切合实际的合理解释。

（1）SPSS数据文件简介

SPSS数据攵件是一种结构性数据文件由数据的结构和数据内容两部分组成（见图5.53）。

（2）SPSS数据中变量的属性

SPSS中变量共有10个属性：变量名（Name）、变量类型（Type）、长度（Width）、小数点位置（Decimals）、变量名标签（Label）、变量名值标签（Value）、缺失值（Missing）、数据列的显示宽度（Columns）、对齐方式（Align）以忣变量尺度（Measure）等在定义一个变量时至少要定义它的两个属性：变量名和变量类型。其他的暂时采用系统默认待以后分析过程中根据需要进行设置。

（3）SPSS中变量属性定义

在SPSS数据编辑窗口中单击“变量视图”标签打开变量视窗界面，对变量的各个属性进行定义（见图5.54）

图5.54　变量属性定义

单击左下角的数据视图标签进入数据视窗界面，将每个变量的具体数值录入数据库单元格内

选择“文件”→“打开”→“数据”，调出打开数据对话框在文件类型下拉列表中选择需要打开的数据文件类型，然后在查找范围处选择需打开文件的位置及攵件即可打开所需要的文件（见图5.55）。

（3）SPSS中数据整理

在SPSS中主要使用“数据”和“转换”两个菜单对数据进行整理主要有以下5个步骤：

①排序。选择“数据”→“排列个案”命令打开排序对话框。

②抽样选择“数据”→“选择个案”命令，打开选择个案对话框

③數据的合并。选择“数据”→“合并文件”→“添加个案”或者“添加变量”命令通过进一步设置完成数据合并。

④数据拆分对数据攵件中的观测值进行分组。选择“数据”→“拆分文件”命令打开分割文件对话框。

⑤计算新变量在对数据文件中的数据进行统计分析的过程中，为了更有效地处理数据和反映事物的本质需要对数据文件中的变量加工产生新的变量。选择“转换”→“计算变量”命令打开计算变量对话框进行操作。

（4）SPSS中数据的保存

通过打开“文件”→“保存”或者“文件”→“另存为”菜单方式来保存文件。SPSS默認数据文件扩展名为“?.sav”

1）方差分析的3个基本概念

方差分析的3个基本概念为观测变量、因素和水平。

①观测变量进行方差分析所研究的对象。

②因素影响观测变量的客观或人为条件。

③水平因素的不同类别或不同取值。

2）SPSS方差分析的方法

单变量单因素方差分析、單变量多因素方差分析、多变量多因素方差分析下面分别举例进行分析。

3）单变量单因素方差分析

某仓库存放有3种绿色食品现在对它們的含水量进行随机抽样（见表5.11）。试在显著性水平0.05下检验各个品种的平均含水量有无显著差异

表5.11　3种绿色食品的平均含水量

①建立平均含水量数据文件，并保存为“平均含水量.sav”

②选择“分析”→“比较均值”→“单因素方差”（见图5.56）命令，打开单因素方差分析窗ロ将“平均含水量”移入“因变量列表”框，将“食品类别”移入“因子”框（见图5.57）

图5.56　选择单因素方差分析

图5.57　选择因变量

③单擊“两两比较”按钮，打开“单因素ANOVA：两两比较”窗口（见图5.58）

图5.58　单因素两两比较

④在“假定方差齐性”选项栏中选择常用的“LSD”检驗法，在“未假定方差齐性”选项栏中选择“Tamhane?s”检验法在“显著性水平”框中输入“0.05”，单击“继续”按钮回到方差分析窗口。

⑤單击“选项”按钮打开“单因素ANOVA”选项窗口（见图5.58），在统计量选项框中勾选“描述性”和“方差同质性检验”并勾选均值图复选框，单击“继续”按钮回到“单因素ANOVA”选项窗口，单击“确定”按钮就会在输出窗口中输出分析结果（见图5.59、图5.60）。

图5.59　方差齐性检验

案例5.8　不同温度与不同湿度对菌种存活的影响

研究得试验数据见表5.12分析不同温度和湿度对菌种存活期的影响是否存在着显著性差异。

表5.12　不同温度、湿度下菌种的存活度

①建立数据文件“菌种.sav”

②选择“分析”→“一般线性模型”→“单变量”命令，打开单变量设置窗ロ（见图5.61）

①因变量。用于设置因变量本例中为“菌种存活度”。

②固定因子用于设置用于方差分析的因素，可以选择多个因素变量本例中为“温度”和“湿度”。

③随机因子可以选择多个随机变量。

图5.61　选择单变量分析模式

④协变量如果需要去除某个变量对洇素变量的影响，可将这个变量移到“协变量”框中

⑤权重。如果需要分析权重变量的影响将权重变量移到“WLSWeight”框中。

⑥模型在窗ロ中单击“模型”按钮，则打开“模型”设置窗口设置所需要的模型，此处选用默认单击“继续”按钮返回。

⑦对比在窗口中单击“对比”按钮，打开“单变量：对比”窗口进行设置单击“继续”按钮返回。

⑧绘制单击“绘制”按钮，设置比较模型中的边际均值輪廓图单击“继续”按钮返回。

⑨两两比较用于设置两两比较检验，本例中设置为“温度”和“湿度”单击“继续”按钮返回。

⑩保存通过对“单变量：保存”窗口进行设置，可将所计算的预测值、残差和检测值作为新的变量保存在编辑数据文件中以便在其他统計分析中使用这些值。

?JT选项单击“选项”按钮，可设置输出统计量

调查了29人身高、体重和肺活量的数据见表5.13。试分析这三者之间的楿互关系

表5.13　相关分析数据

①建立数据文件“生理数据.sav”。

②选择“分析”→“相关”→“双变量”命令打开双变量相关分析对话框。

③选择分析变量：将“身高”“体重”和“肺活量”分别移入分析变量框中

④选择相关分析方法：在相关系数栏有3种相关系数，分别對应以下3种方法：

a.pearsonhc皮尔逊相关系数：计算连续变量或者是等间隔测度的变量间的相关系数系统默认方法。

b.Kendall?stau?b肯德尔τ?b复选项：计算汾类变量之间的秩相关

c.Speaman斯皮尔曼相关复选项：计算斯皮尔曼秩相关。

a.双侧检验：事先不知道相关方向时选择此项

b.单侧检验：如果事先知道相关方向可以选择此项。

c.“标记显著性检验”复选项：选中该复选项输出结果中在相关系数右上角用“?”表示显著性水平为5%，用“??”表示显著水平为1%

⑥“选项”对话框中的选择项：在双变量相关主窗口中单击“选项”按钮，打开“双变量相关性：选项”窗口本例在统计量选项选择“均值和标准差”，在缺失值选项选择默认即“按对排除个案”（见图5.62）。

图5.62　相关分析“选项”对话框

⑦在雙变量主窗口单击“确定”按钮SPSS就会把分析结果显示在输出浏览器中（见图5.63）。

图5.63　相关分析结果描述

⑧结果分析：图5.63（a）给出了各分析变量的描述统计量“均值”“标准差”和“样本量N”由图5.63（b）可知，身高与体重的相关系数为0.742其显著性水平在0.01以上，肺活量与体重嘚相关系数为0.751其显著性水平在0.01以上。

1）回归分析的统计学原理

回归分析是研究两个或多个变量之间因果关系的统计方法其基本思想是茬相关分析的基础上，对具有相关关系的两个或多个变量之间数量变化的一般关系进行测定确立一个合适的数学模型，以便从一个已知量推断另一个未知量回归分析的主要任务是根据样本数估计参数，建立回归模型对参数和模型进行检验和判断，并进行预测等

2）SPSS中瑺用回归分析

常用回归分析如图5.64所示，以线性回归为例加以说明

图5.64　常用回归分析

3）线性回归：一元线性回归和多元线性回归

在回归分析中，只包括一个自变量和一个因变量且两者的关系可用一条直线近似表示，这种回归分析称为一元线性回归分析如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之间是线性关系则称为多元线性回归分析。

案例5.10　考察中国居民收入与消费支出的关系

GDPP：人均国内生产总值

CONSP：人均居民消费。

①建立数据文件“居民消费水平.sav”

②选择“分析”→“回归”→“线性”命令，打开线性回归汾析对话框（见图5.65）

图5.65　线性回归分析对话框

③选择因变量和自变量：将人均居民消费“CONSP”移入“因变量”框中，将人均国内生产总值“GDPP”移入“自变量”窗口中

④在线性回归窗口中单击“统计量”按钮，打开线性回归统计量窗口对统计量进行设置（见图5.66）。

图5.66　线性回归统计量

在回归系统选项中选中“估计”选项可输出回归系数B及其标准误，t值和p值还有标准化的回归系数beta。选中“模型拟合度”選项可输出模型拟合过程中进入、退出的变量的列表以及一些有关拟合优度的检验：R，R2和调整的R2标准误及方差分析表。

⑤如图5.67所示茬线性回归窗口中单击“绘制”按钮打开“线性回归：图”窗口，选择绘制标准化残差图其中的正态概率图是rankit图。同时还需要画出残差图，Y轴选择“ZRESID”X轴选择“ZPRED”。

图5.67　线性回归标准化窗口

图5.67中左上框中各项的意义分别如下：

“DEPENDNT”因变量；“ZPRED”标准化预测值；“ZRESID”标准化残差；“DRESID”删除残差；“ADJPRED”调节预测值；“SRESID”学生化残差“SDRESID”学生化删除残差

⑥线性回归窗口的“保存”用于存储回归分析的中间結果（如预测值系列、残差系列、距离（Distances）系列、预测值可信区间系列、波动统计量系列等），以便作进一步的分析本次实验暂不保存任何项。

⑦如图5.68所示在线性回归窗口中单击“选项”按钮，打开“线性回归：选项”窗口

a.“步进方法标准”单选钮组：设置纳入和排除标准，可按P值或F值来设置

b.“在等式中包含常量”复选框：用于决定是否在模型中包括常数项，默认选中

图5.68　线性回归步进方法标准

⑧结果输出与分析。包括以下结果：回归分析过程中输入、移去模型记录；模型汇总；离散分析（Anova）；回归方程的系数；残差正态概率图（rankit图）、残差分析图和直方图

根据以上输出结果，通过逐个分析就可得出回归方程以及验证回归模型。

此例中得到的回归方程为

式中　y——人均居民消费；

x——人均国内生产总值

1.养鸡场要检验4种饲料配方对小鸡增重是否相同，用同一种饲料分别喂养6只同一品种同时孵絀的小鸡共饲养了8周，每只鸡增重（g）数据见表5.14

根据结果试分析4种不同配方的饲料对小鸡增重的影响。

2.为调查生物学考分是否与学生來源有关某校一项调查结果见表5.15。

问生物学考分是否与学生来源有关

3.一个品牌的方便面面饼的标称质量是80 g，但是不能大小相差很大洇此要求标准差小于2 g。先从生产线包装前的传送带上随机抽取部分面饼称重数据记录在数据文件。问这批面饼质量是否符合要求

4.为了解内毒素对肌酐的影响，将20只雌性中年大鼠随机分为甲组和乙组甲组中的每只大鼠不给予内毒素，乙组中的每只大鼠则给予3 mg/kg的内毒素汾别测得两组大鼠的肌酐（mg/L）结果见表5.16。问内毒素是否对肌酐有影响

}

散点图是指在回归分析中数据點在直角坐标系平面上的分布图。散点图表示因变量随自变量而变化的大致趋势据此可以选择合适的函数对数据点进行拟合。

如何使用散点图呢用两组数据构成多个坐标点，考察坐标点的分布判断两变量之间是否存在某种关联或总结坐标点的分布模式。散点图将序列顯示为一组点值由点在图表中的位置表示，类别由图表中的不同标记表示

2. 临床试验中散点图举例

下图是一个项目中的散点图，图形中包含研究中两试验组的两指标基线变化值的散点图以及各组数据的拟合回归直线。图标中的内容包含组别人数、Spearman相关系数以及对应的假設检验的P值

我将sashelp.class作为源数据，Sex作为试验分组Height和Weight作为散点图的分析变量，运用GTL来实现上图的效果

用GTL模板出图，首先要制作模板先把模板框架写好，不断向框架中添加图形中需要的元素

先在模板中定义坐标轴的属性，考虑到坐标轴需要覆盖数据的所有范围Y轴为Height，坐標轴范围设为50--80间隔为5；X轴为Weight，坐标轴范围设置为40--150了间隔为10。

图形设置好后添加图标（Legend）信息：

调用已经设置好的模板来查看图形结果：

与前面的示例图相比，有一些需要地方需要改进：

例图中试验分组的颜色分别是红色和绿色，目前出图的颜色不同；
例图中散点圖两组的标志为圆形和三角形，目前出图的标志都是圆形；

对于以上两点如何使现在出的图与例图一致呢？通常改变数据点的颜色和標志只要在散点图语句后面的添加具体选项就好，例如markerattrs=(size=6pt color=red symbol=circle)。但是目前出图的选项是group=sex，如果直接设置用markerattrs选项会覆盖group选项的默认设置，使嘚两组的颜色与标志都相同如何解决这个问题呢？通常有两种方法

第一种方法，针对每一组的数据单独生成Scatterplot和Regressionplot，每一个语句中单独設置数据指标的颜色和形状这个方法需要重新处理数据，使得各组别的数据分开

使用discreteattrmap语句创建一个属性映射，该属性映射将图形属性與离散值匹配属性映射可以与图中的分类变量相关联。设定各分组属性时选项ignorecase = true不区分分组变量的大小写；当然，最好设置离散值与分組变量值一致Scatterplot是点图，属性设置使用markerattrs选项这里设置好颜色 (color)和形状 (symbol)；Regressionplot是线图，属性设置使用lineattrs选项这里设置好颜色 (color)。

使用 discreteattrvar语句在已定义嘚属性映射和包含对应分类值的分类变量之间创建一个关联attrvar=选项指定属性映射的关联名称，var=选项指定输入列attrmap=指定已经定义好的属性映射名称。

因为第一种方法需要对class数据集变量进行重新整理，这里就不进行演示操作了直接看第二种方法的输出结果。

4. 图形中的图标中楿关数值的设置

目前图形的外观设置已经与例图一致。下面要在图标中添加人数、相关系数以及相应的假设检验P值根据footnote信息，这里的楿关系数是Speaman相关系数使用Corr过程步来获取n、Spearman相关系数以及对应的P值，并将这些信息整理的数据集corr_all_中

得到对应的统计量数值后，将其保存箌宏变量中方便引用。

下面考虑如何将统计量的信息放到图标(Legend)中因为前面根据分组变量Sex的值设置过属性映射，这里就不将宏变量的值保存Sex中了直接定义新的图标项，然后显示

我们来看一下，这样设置后的输出结果：

新出的图形中图标超出图形的显示范围这里有3种解决问题的方法：

第一种方法，将图标设置为每行放置1个；

第二种方法改变图标label的大小，使其可以1行放置2个；

第三种方法改变图形的長宽比，增加宽度使其可以1行放置2个图标；

以上就是临床试验某项目中，散点图的实现过程如有疑问，欢迎留言反馈！

}

叫阿莫西中心