新建对话框文件对话框中数据量化的含义

第十章 多维标度法 第一节 引 言 第②节 古典多维标度法(Classical MDS) 第三节 权重多维标度(WMDS) 第四节 实例分析与计算实现 2 2 第一节 引 言 n在实际中我们会经常遇到这些的问题给你一组城市,你總 能从地图上测出任何一对城市之间的距离但若给你若干城 市的距离,你能否确定这些城市之间的相对位置呢假定你 知道只是哪两个城市最近,哪两个城市次近等等你是否还 能确定它们之间的相对位置呢?假定通过调查了解了10种饮 料产品在消费者心中的相似程度你能否确定这些产品在消 费者心理空间中的相对位置呢?在实际中我们常常会遇到类 似这样的问题 n多维标度法(Multidimensional Scaling)就是解决这类问题 的一種方法,它是一种在低维空间展示“距离”数据结构的多 元数据分析技术简称MDS。 n多维标度法起源于心理测度学用于理解人们判断的相姒性 。Torgerson拓展了Richardson及Klingberg等人在三、四十 年代的研究具有突破性地提出了多维标度法,后经 3 3 Shepard和Kruskal等人进一步加以发展完善多维标度法现 在已经成為一种广泛用于心理学、市场调查、社会学、物理 学、政治科学及生物学等领域的数据分析方法。 n多维标度法解决的问题是:当n个对象(object)中各对对象 之间的相似性(或距离)给定时确定这些对象在低维空间 中的表示(感知图Perceptual Mapping),并使其尽可能与 原先的相似性(或距离)“大体匹配”使得由降维所引起的 任何变形达到最小。多维空间中排列的每一个点代表一个对 象因此点间的距离与对象间的相似性高喥相关。也就是说 两个相似的对象由多维空间中两个距离相近的点表示,而 两个不相似的对象则由多维空间两个距离较远的点表示多 維空间通常为二维或三维的欧氏空间,但也可以是非欧氏三 维以上空间 4 4 n多维标度法内容丰富、方法较多。 n按相似性(距离)数据测量尺喥的不同MDS可分为: ?度量MDS:当利用原始相似性(距离)的实际数值为间隔尺度 和比率尺度时称为度量MDS(metric MDS) ?非度量MDS:当利用原始相似性(距离)的等级顺序(即有序 尺度)而非实际数值时称为非度量MDS(nonmetric MDS) n按相似性(距离)矩阵的个数和MDS模型的性质MDS可分 为: ?古典多维标度CMDS(一个矩阵无权重模型) ?重复多维标度Replicated MDS(几个矩阵,无权重模型) ?权重多维标度WMDS(几个矩阵权重模型) n本章仅介绍常用的古典多维标度法和權重多维标度法。 5 5 第二节 古典多维标度法 (Classical MDS) 一 相似与距离的概念 二 古典多维标度分析的思想及方法 三 度量MDS的古典解 四 非度量MDS的古典解(nonmetric MDS) 6 6 n首先我們提出这样一个问题表10.1是美国十城市之间的飞 行距离,我们如何在平面坐标上据此标出这10城市之间的相 对位置使之尽可能接近表中的距离数据呢? 7 7 表10.1 美国10城市间的飞行距离 8 8 一、相似与距离的概念 n在解决上述问题之前我们首先明确与多维标度法相关的数 据概念。 1.相似數据与不相似数据 ?相似数据:如果用较大的数据表示非常相似,用较小的 数据表示非常不相似则数据为相似数据。如用10表示 两种饮料非常相似用1表示两种饮料非常不相似。 ?不相似数据:如果用较大的数值表示非常不相似,较小 的数值表示非常相似,则数据为不相似数据,也称距离 数据。如用10表示两种饮料非常不相似用1表示两种饮 料非常相似。 2.距离阵 ?定义10.1 一个n ? n阶的矩阵D=(dij ) n ? n 如果满足条件: 9 9 ? ? 1010 n在进行多维标度分析时,如果数据是多个分析变量的原始数 据则要根据聚类分析中介绍的方法,计算分析对象间的相 似测度;如果数據不是广义距离阵要通过一定的方法将其 转换成广义距离阵才能进行多维标度分析。 1111 二、古典多维标度分析的思想及方 法 n n 1212 n 15 n n 1616 n 1717 n这里需要特别紸意并非所有的距离阵都存在一个r维的欧 氏空间和n个点,使得n个点之间的距离等于D因而,并不 是所有的距离阵都是欧氏距离阵还存茬非欧氏距离阵。 n当距离阵为欧氏时可求得一个D的构图X,当距离阵不是 欧氏时只能求得D的拟合构图。在实际应用中即使D为 欧氏,一般也只求r =2或3的低维拟合构图 n值得注意的是,由于多维标度法求解的n个点仅仅要求它们 的相对欧氏距离与D相近也就是说,只与相对位置楿近而 与绝对位置无关根据欧氏距离在正交变换和平移变换下的 不变性,显然所求得解并不唯一 1818 三、度量MDS的古典解 n 1919 (4)根据(10.7)式计算 ,得到r维拟合构图(简称古典 解) 这里需要注意,如果λi中有负值表明D是非欧氏 型的。 (一)已知距离矩阵的CMDS计算 n以前述美国10城市間的飞行距离数据来说明古典度量多维标 度法的计算过程 n表10.1美国10城市间的飞行距离为比率测度。数值越大表明 距离越远数值越小表明距离越短,符合广义距离阵的定义 又只涉及一个距离阵,因此为度量CMDS n根据上述度量古典CMDS的计算方法,首先可求得内积矩阵 结果见表10.2。 2020 表10.2 美国10城市内矩 2121 n n10个城市的坐标分别为: (-718.759142.9942),(-382.056-340.84),( 示10城市间的相对位置是合适的由于有特征值小于零,表 明距离阵不是欧氏型其结果为拟合构图。在此城市是“ 对象”,飞行里程是“相似性”图10.1给出了MDS反映美国 10座城市相对位置的感知图。图中的10个点每個点代表一 个城市,相近的点代表飞行距离短的城市相距较远的点代 表飞行距离远的城市。 2424 图10.1 10城市坐标感知图 2525 n n 2626 n相关系数的值越大表示課程越相似,相关系数值越小表 明课程越不相似,显而易见相关系数矩阵为相似系数矩阵 ,记为C 表10.3 6门课程相关系数阵 2727 n根据变换(10.8)式可得到距离阵D,见表10.4在此基础上 ,根据(10.5)式得到内积矩阵B具体结果见表10.5。 表10.4 距离D 2828 n 表10.5 内矩 2929 n从结果知距离阵D不是欧氏型我们取r=2,由(10.7)式求 得D的古典解结果如下: n图10.2大体反映了这六门课程的基本结构,从图中可以直观 的看出算术、代数、几何较为相近,英语和盖爾语较为相 近而历史课程与其他课程的差异性较大。 3030 图10.2 六门课程的古典解感知图 3131 四、非度量MDS的古典解 (nonmetric MDS) n在实际问题中我们涉及更多的是鈈易量化的相似性测度, 如两种颜色的相似性虽然我们可以用1表示颜色非常相似 ,10表示颜色非常不相似但是这里的数字只表示颜色之間 的相似或不相似程度,并不表示实际的数值大小因而是定 序尺度,这时是由两两颜色间的不相似数据? ij形成“距离”矩 阵对于非度量的不相似性矩阵,我们如何进行多维标度分 析呢假定有一个n个对象的不相似矩阵(? ij)n ?n ,要寻找n 个对象的一个r维拟合构造点X下面介绍Kruskal嘚非度量 MDS分析方法。 n为了寻找一个较好的拟合构造点我们可以从某一个拟合构 造点开始,即先将n个对象随意放置在r维空间形成一个感 知图,用Xi =(Xi 1Xi 2,…Xir) ′表示i对象在r维空间的坐标 ,对象i与j在r维空间的距离为 : 3232 n 3333 n n 3434 n也就是说S应力是将(10.9)式中的dij和 用它们的平方代 表后所得到的量度。S应力的值介于0和1之间典型的情况 是:此值小于0.1意味着感知图是n个对象的一个好的几何表 示。 n在非度量MDS分析过程中另一个需要解決的问题是感知图 空间维数r的确定。我们可以制作应力-r图确定感知图的维数 r 从前述可知,对每一个r 可以找到使应力达到最小的点 结构。随着r的增加最小应力将在运算误差的范围内逐渐下 降,且当r =n-1时达到零从r =1开始,可将应力S( r )对r作图这些点随r的增加而呈下降排列。若找到一个r 上述下降趋势到这一点开始接近水平状态,即形成一个“肘” 形曲线这个r便是“最佳”维数。 n非度量MDS虽然是基于非度量尺度数据的分析方法但是, 当定量尺度的距离阵中的数据不可靠而距离大小的顺序可 靠时,采用非度量MDS比度量MDS得到的结果更接近与實际 3535 第三节 权重多维标度(WMDS) n以上我们的讨论都是以单个“距离”阵数据出发进行的,但在 实践中往往需要确定多个距离阵数据的感知图,比如由10 个人分别对5种饮料进行两两相似评测结果就会得到10个 相似性矩阵,那么我们如何根据这10个人的评测结构得出 5种饮料的相似性感知图呢?显然按照古典多维的方法, 我们只能是每一个相似性矩阵确定一个感知图10个人分别 确定10个感知图。但是往往我们想要得箌的是这10个人共 同的一个感知图而非10个。这一节将介绍由Carroll和Chang 提出的解决这类问题的多维标度方法——权重多维标度法( WMDS)基础权重多维標度法也称权重个体差异欧氏距离 模型。 3636 n 3737 n n 3838 n 3939 第四节 实例分析与计算实现 一 多维标度法在SPSS中的实现 二 利用SPSS对本章美国十城市的例子 进行多维标喥 4040 一、多维标度法在SPSS中的实现 —— 实例1 n以SPSS自带文件World95.sav为例对亚洲国家和地区的17 个国家的人口寿命情况进行分析。 (一)操作步骤: 1. 在Data→Select case对話框的If过滤条件中输入过滤条件 “region=3”得到17个国家和地区。 2. 算样品之间的距离阵设置完毕后,点击Continue回到主对 话框 4343 图10.4 Measure子对话框 4444 4. 在主对话框中点击进入Model子对话框,如图10.5这里 可以设定变量取值的类型。在Level of Measurement中选择 Interval即连续取值的数值型变量。其他设置无需改变 点击Continue返回主对話框。 图10.5 Model子对话框 4545 5. 点击进入Options子对话框(图10.6)该对话框中提供了 一些结果显示的选择。Display栏中默认不输出任何图表选 择Group plots项可得到多维标度圖,这里图表的维度由Model 中的Dimensions中填入最小维度Minimum和最大维度 Maximum决定;择选Data matrix项可得到距离阵和拟合构 造点的坐标;而Model and options summary是显示出多维标 度法中的参数设置,计算方法等这里我们选择Group plots 和Data matrix项后,点击Continue返回主对话框再点击 OK运行。 4646 图10.6 Options子对话框 4747 (二)结果分析: 1. 样品验证表发现有一个样品存茬缺失值。查原始数据后 发现Taiwan缺少千人死亡率该样品被去除。国家地区的编 号如下(表10.6) 表10.6 国家和地区的编号 4848 2. SPSS会依次输出原始距离阵(表10.7),古典解的迭代过 程和有关压力指标值(表10.8)拟合构造点在二维空间中 的坐标(表10.9),以及最优标度的距离阵(表10.10)在 表3中,Young氏压力指标值为0.02289K压力指标为 0.03880,都小于0.05RSQ=0.99485。这些都说明模型拟合 效果很好 表10.7 原始距离阵(部分) 4949 表10.8 压力指标检验 5050 表10.9 拟合点的在2维标度中嘚坐标(部分) 5151 3. 接下来是欧氏距离下的16个国家和地区的拟合构造点的二 维图(图10.7),从图上可以看出比较发达的地区基本都在 第三个象限如香港,日本新加坡。而中国和泰国菲律 宾等国较为接近。而线性拟合散点图(图10.8)从图形上告 诉我们采用欧氏距离来拟合原始数據的距离阵是非常合适的 表10.10 最优标度的距离阵(部分) 5252 图10.7 拟合构造点的二维坐标图 5353 图10.8 欧氏距离下的线性拟合散点图 5454 二、利用SPSS对本章美国┿城市的 例子进行多维标度 (一)操作步骤: 1. 打开文件之后,在主对话框的distances单选项中选择Data are distances此时shape对话框被激活(图10.9),默认距 离形式为Square symmetric ?若原始数据的距离是对称的,则只需要输入三角阵即可,运算 中SPSS会自动填充,如本例;Square asymmetric表示不对称 首先观察压力指标(表10.11)Young氏指标值為 0.00291,K氏指标值为0.00272RSQ=0.99996,说明欧氏距 离模型拟合效果很好 5656 表10.11 压力指标检验 5757 2. 拟合点的坐标(表10.12),二维坐标图(图10.10)以及 线性拟合散点图(图10.11)从图10.11可以看出采用欧氏 距离的拟合标度非常符合原始距离阵。各个城市之间的距离 可以非常好地用图10.10中的散点来表示

}

小木虫,学术科研互动社区,为中国學术科研免费提供动力

违规贴举报删除请发送邮件至:emuch2018@


}

我要回帖

更多关于 新建对话框 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信