如何用sas或者spss做二维spss正态分布拟合参数估计

点击联系发帖人 时间：2014-10-31 03:22

spss判断正态分布

商品编号：
统计分析系统SAS与SPSS
该商品中，先到先得...价：?
商品评价：
送　　至：
&&运费说明
该商品暂时售完，
服　　务：
由发货并负责售后服务，国美提供保障监管。
购买数量：
延保服务：
所选地区该商品暂时无货，欢迎选购其他类似商品。
向好友提出心愿
发个心愿给亲爱的TA吧，让TA来帮你实现。
手机下单更优惠?0
扫一扫 &享专属低价
手机专享价：?0
距离活动结束还有0天0时0分
订单总金额满300元，支持信用卡分期付款：
支持信用卡分期银行如下
条件金额(元)
3%4%5%300-50000
3.18%4.18%6.49%100-50000
3.5%5%7.5%500-50000
3%4%5%500-50000
2.4%3.9%7.8%300-50000
0.9%1.5%3.5%500-50000
3.5%4.5%6.5%200-50000
分期流程：加入购物车去结算>提交订单>选择信用卡分期付款>完成支付
一旦该商品到货，我们会通过手机短信或邮件通知您
*&手机号码：
&&&邮箱地址：
同时加入收藏夹
添加成功！
购买了此商品的用户还购买了：
您可以免费给TA发短信
*我的手机号：
*短信验证码：
免费获取验证码
验证码已发送,请查收短信
*TA的手机号：
手机号码重复
给TA留言：
留言最多140个字
例如：我是Tina，我想要这款商品，你愿意送给我吗？
发送短信的内容包括：留言+您的手机号+商品标题+网址
打开手机微信客户端，点击“发现”使用“扫一扫”，选择您要发送的朋友，TA就能看到您提出心愿的商品啦~~
短信已发送成功!
你可以继续提出心愿
短信已发送失败!
你可以再试一次
更多发送愿望的方式：
微信扫一扫
成功复制到剪切板
在线支付时，订单金额超过网银支付额度，可使用（单笔支付最高可达3万）
服务评分：4.6分
评分明细与行业对比
商品描述：4.69
发货速度：4.52
服务质量：4.65
所在地：浙江&&杭州
客服电话：3
<span class="live800 live800Provider customerService"
lim:company=""
lim:page="0"
lim:shopId="3"
lim:shopName="%E7%BA%A2%E8%B1%86%E5%AE%98%E6%96%B9%E6%97%97%E8%88%B0%E5%BA%97"
lim:offLineTip="客服暂时不在线"
lim:innerHtm="在线客服"
lim:checkLogin="true">
温馨提示：
o&点击参与以旧换新
o&特例商品不支持蓝券
不满意此商品，
统计分析系统SAS与SPSS
商品名称：统计分析系统SAS与SPSS
店铺名称：博库网旗舰店
基本信息商品名称：统计分析系统SAS与SPSS开本：16开
作者：何宁//吴黎兵//滕冲页数：293定价：32出版时间：ISBN号：7
印刷时间：出版社：机械工业版次：1商品类型：图书印次：1 内容提要：
本书讲解了统计分析软件的基本用法，并以SAS和SPSS为例讲解了具体的数据分析和处理方法。主要内容包括SAS系统概述、SAS编程基础及数据集建立、描述性统计分析、统计绘图、相关分析、假设检验、回归分析、主成分分析和因子分析、时间序列分析和预测、判别分析、聚类分析、SPSS统计分析软件使用基础、SPSS常用统计分析方法及应用。&&&&
本书适用于理工科农林类、经济类、文科类院校的学生学习统计分析使用，也可供使用计算机进行数据统计分析与课题研究的教师和科研人员参考。&&&& 目录：前言第1章
SAS的组成与特点
SAS的启动退出及重要的系统文件
SAS的重要文件
SAS的主界面介绍
SAS的菜单栏
SAS的工具栏
资源管理器和输出结果窗口
SAS的四个基本视窗
SAS/ASSIST窗口介绍
启动SAS/ASSIST
ASSIST各菜单项介绍
数据分析示例
简单报表图形示例第2章
SAS编程基础及数据集的建立
SAS语言初步
用SAS数据步建立数据集
临时数据集的建立
永久数据集的建立
用VIEW/ABLE窗口建立数据集
生成新数据集
打开已有的数据集
改变数据显示
从外部文件导人数据
导出数据到其他数据格式文件
用SAS/INSIGHT模块建立数据集
数据集的建立
数据集的保存
数据集的打开第3章
描述性统计分析
描述性统计分析概述
基本统计概念
LINIVARIATE过程
用SAS/ASSIST进行描述性统计分析
确定工作任务
数据集的确定
变量的确定及统计参数的选择
任务的提交与统计结果
用SAS/INSIGHT进行分布检验
确定工作任务
进行分布检验
用分析家进行列联表分析
确定工作任务
关联分析第4章
用INSIGHT绘制图形
生成条形图和直方图
生成盒形图和马赛克图
生成散点图
生成连线图
用“分析家”绘制图形
散点(线)图
用编程方法绘制图形
用GCHART过程绘图
用GPLOT过程绘图
用G3D过程绘图第5章
相关分析的概念及数学模型
相关分析的概念
相关分析的数学模型
两个变量间的直线相关分析
用s相关分析
用分析家作直线相关分析
偏相关分析
用ASSIST作偏相关分析
用分析家作偏相关分析
用ASSIST作等级相关
用分析家作等级相关
通过编程计算相关系数第6章
假设检验的概念及数学模型
假设检验的概念
假设检验的数学模型
单样本t检验
用分析家作单样本均值检验
用程序中means过程做单样本的t检验
配对样本的t检验
用分析家来作t检验
用ASSIST作t检验
独立样本的z检验
用分析家来作独立样本的t检验
用ASSIST作参数检验
用程序中ttest过程做配对样本的t检验第7章
单因素方差分析
方差分析的问题与模型
编程作单因素方差分析
用Insight作单因素方差分析
用ASSIST作单因素方差分析
多因素方差分析
方差分析的问题与模型
编程作多因素方差分析
用Insight作多因素方差分析
用ASSIST作多因素方差分析第8章
回归分析概述.
回归方程的假设检验与自变量的选择
基本回归诊断
用编程拟合线性回归
用分析家拟合线性回归
用Insight拟合多项式回归
拟合多项式回归的方法
拟合多项式回归
用ASSIST拟合多元线性回归
Logistic回归
Logistic回归的模型
用分析家作Logistic回归
用程序的方法拟合Logistic回归第9章
主成分分析和因子分析
主成分分析
使用INSIGHT模块作主成分分析
使用“分析家”作主成分分析
使用PRINCOMP过程进行主成分分析
使用INSIGHT模块作因子分析
用FACTOR过程进行因子分析第10章
时间序列分析和预测
时间序列分析
建立时间序列数据集
季节性调整分析
时间序列预测
设置数据集及相关信息
选择预测模型
生成和查看预测结果
管理预测项目第11章
多类判别分析
判别分析的假设检验
鉴别错误分类的比率
DISCRIM过程
逐步判别过程分析过程STEPDISC
逐步判别分析方法
STEPDISC过程第12章
聚类分析概述
SAS聚类分析过程
CLUSTER聚类分析过程
FASTCLUS快速聚类过程
VARCLUs聚类过程
TREE聚类树型输出过程
应用举例第13章
SPSS统计分析软件使用基础
SPSS的发展简史
SPSS的主要特点
SPSS软件的安装、启动和退出
SPSS的帮助系统
SPSS使用基础
三种运行方式
SPSS的窗口及其设置
SPSS数据结构及其定义
SPSS数据的录入和编辑
SPSS数据的内容
SPSS数据的录入
SPSS数据的编辑
数据文件的操作
数据文件的保存
获取外部数据的方法
小结第14章
SPSS常用统计分析方法及应用
基本描述统计量
描述集中趋势的统计量
描述离散趋势的统计量
描述分布形态的统计量
正态分布的重要特征和经验法则
基本统计分析
采用Frequencies过程进行频数分析
采用Descriptives过程描述分析
采用Explore过程进行探索分析
假设检验和t检验
假设检验概述
单样本的t检验
两独立样本的t检验
两配对样本的t检验
方差分析概述
单因素方差分析的主要思想和步骤
SPSS中单因素方差分析的基本操作
多因素方差分析
非参数检验
二项分布检验
单样本K-S检验
两独立样本的非参数检验
小结参考文献
如果您发现商品信息不准确，
请参阅库巴网保修售后
【报价】查看
【评价】查看
国美在线商城服务承诺：
国美在线商城向您保证所售商品均为正品行货，国美在线商城自营商品自带机打发票，与商品一起寄送(部分商品，需在您收到货物之后，我司为您邮寄)。
凭质保证书及国美在线商城发票，可享受全国联保服务，与您亲临商场选购的商品享受相同的质量保证。
国美在线商城还为您提供具有竞争力的价格保护政策，请您放心购买！
因厂家会在没有任何提前通知的情况下更改产品包装、产地或者一些附件，本司不能确保客户收到的货物与商城图片、产地、附件说明完全一致。只能确保为原厂正货！并且保证与当时市场上同样主流新品一致。若本商城没有及时更新，请大家谅解！
我要发表咨询
咨询类型:&
回复方式:&
咨询内容:&
如何尽快找到咨询答案：1、使用本页面左侧的搜索功能2、仔细查看我们的提示信息及帮助，一般都能找到答案
咨询内容在10-200个字符之间
对比栏（0）
您还可以继续添加
您还可以继续添加
您还可以继续添加
您还可以继续添加
送达时间段
上午达10:00——14:00
下午达14:00——18:00
夜间达18:00——22:00
下单时间送达时间
00:00—12:00当日20:00前
12:00—14:00当日22:00前
14:00—24:00次日14:00前
回复 summer：
回复您还可以输入400字
28年专业品质
最国美最实惠
心服务新体验
我的浏览记录
扫描下载客户端
手机逛国美点击或扫描下载来自子话题：
&p&接到很多朋友的私信，想让我讲讲我自己学数据分析的路程。于是，今天给大家讲一个故事。&/p&&br&&p&我本科毕业于一个三流的二本院校，专业是三流中的三流---市场营销。大学前三年在各种游戏中度过，连兼职和实习的经历都没有。到大四的时候突然开始恐慌，觉得这样下去连工作都找不到了，于是立马开启了考研的节奏。可是突然发现已经三年没有学习的我再也难以重新捡起书本了，再加当时EX因为准备出国要和自己分手，我简直觉得自己到了穷途末路。 &/p&&br&&p&你以为这就是故事的全部吗？如果一个故事里面没有一点狗血的剧情，那还怎么能称之为故事呢？是的，我的故事也很狗血，我当时死了命的要出国去追我的EX，于是和父母百般商量，他们最终同意我出国（我家境还好，出国的钱不是问题）。
EX和我分了没多久，又立马找了个新对象，我简直就是TM$#@$&*@#@#%^（此处省略1万字）。心灰意冷啊，可是我还是抱有希望，觉得等到国外就好了。 &/p&&br&&p&于是在每个寂寞伤心的夜里，我睡不着觉都抱着厚厚的一本雅思口语书在学校的小池塘边上读英语。你能想象半夜两三点我一个人在那读英语的场景吗？不是因为我喜欢英语啊，只是我不能让自己停下来，要不然满脑子都是EX啊。最终的最终，我的雅思竟然拿了个7，最让人不可思议的是我竟然成功申请到了一所世界排名前100的名校。这算是逆袭吗？&/p&&br&&p&当时申请国外的专业是随便申请的，哪有心思去选专业啊，满脑子都是EX。可是就是没想到这个随便的选择，竟然给我带来如此大的影响，我甚至觉得这个选择会影响我的一生。在此，我说一句，如果你有钱，请一定要去国外学个一两年，你的人生观一定会被改变。如果你觉得我说的不对，尽情的喷我吧，但是我还是保持我的观点。出国改变一生！！！！&/p&&br&&p&我提着大包小包的行李一路奔向了大不列颠的领土，第一感觉就是空气真他妈的好。蓝白白云，鸟语花香，隔壁就是火车站和码头。去学校报道的时候惊讶的发现，我的这个专业竟然只有11个人，不可思议，教授都比学生多啊。隔壁的市场营销70个人啊，简直秒杀我们。&/p&&br&&p&我的专业叫市场分析，可是真的和市场打不着半毛子的关系。我们每天学的是数据，统计学，概率论，数据挖掘还有各种蛋疼的编程。我和我的小伙伴们都惊呆了！！从那时起，基本上就开启了熬夜战斗的模式，一熬就是一年多啊。每每夜里12点我们都会在机房被保安“赶出来”，空荡荡的校园只剩我们专业小伙伴的身影，那时候真的体会到什么叫“痛并快乐着”。虽然很苦，但是很充实，很开心。 &/p&&p&有段时间学SAS，因为从来没接触过编程和数据挖掘，课程难度很大。基本上在上完课后都会去图书馆编程，平均每天都要10个小时左右，一个星期后，我的眼睛被搞坏了，一看到荧光屏就开始疼痛，只能通过不断的点眼药水来减轻酸痛，虽然这样，自己还是坚持把SAS学完，依然每天学习10来个小时。等到SAS课程结束后，我真的是累到了，几个同学送我去医院做检查，医生让我不要再使用电脑，我的双眼已经严重疲劳，泪腺已经被堵住了。。。。。&/p&&p&于是我便抛下一切，去法国和西班牙玩了几天！&/p&&br&&p&我在英国的这一年，周一到周五基本上都是在图书馆呆着的，周六周日会出去喝酒，旅游。日子真的很惬意，现在每每想起都十分怀念。也是在英国这一年让我学会了独立，尤其是独立思考，养成了读书的习惯，懂得了追求进步以及享受到通过努力取得成功的那种快感。 &/p&&br&&p&上面讲得有点乱，没有什么干货，主要是讲一讲自己的经历。下面给大家将一些干货吧，主要关于是我如何在一年之内学完数据分析的。&/p&&br&&p&第一门课程叫做定量分析，其实就是统计学，总共6个课时，每个课时4个小时。讲课内容无非就是统计学的那点知识，国外的老师都是只讲一个框架，然后给一大堆参考文章和书籍自己回去阅读和思考。这些书和文章是一定要看的，而且要仔细的看，因为考试会考到。统计学是整个数据分析的基础，大家一定要学好。多阅读课本，最好有两本能够互相参考。&/p&&br&&p&接下来学的一门课是多元统计分析，用的时SPSS软件，3个课时，每课时4小时。自学时间大概是60个小时。这部分主要侧重应用，大家可以阅读Discovering Statistics by Using SPSS. 作者是大名鼎鼎的Andy Field，出了名的心理统计学家。书讲得很详细，既涉及到统计学知识，也涉及到如何使用SPSS进行数据分析。&/p&&br&&p&还有两门数据分析课程，一门是讲解卡方检验，方差检验等技术手段的，这个没有指定书籍，只有一大堆的参考文献，其实这些方法在统计学教材里都会有，只不过老师单独的列出来进行讲解了。这门课非常有用，让我们对常用的数据分析技术得到了更深一步的理解。另一门课程叫高级数据分析，是讲如何使用R进行多元数据分析的，这门课主要的教材就是 R in Action，这本书在我们的电子版教材里有提供给大家，绝对是学习R语言的最佳书籍，没有之一。 &/p&&p&接下来的这门课是使用SAS进行多元统计分析，学时3课时，每课时6个小时。讲课的是一个黑人教授，非常的有范，每次都逗我们一帮人笑翻天。虽然SAS只有三个课时，可是学的东西却非常多。从基础的数据管理，清洗，到高级的数据建模，诊断，都要在三个课时内学完并消化。 SAS的作业也是相当的变态的，需要我们自己去设计一个调查问券，然后自己出去发问卷进行调查，最后将数据导入到SAS中进行分析。这整套过程就像在做一个项目，非常的实用，也非常的锻炼人。现在工作了也觉得，当初老师那样做真的是让我们受益匪浅，我懂得了任何的数据分析都需要结合业务去开展。&br&&/p&&br&&p&还有一门课叫做信用风险评估和数据挖掘，这门课是和banking的学生一起上的。用的软件是SAS Enterprise Miner，这是SAS公司针对商业数据分析研发的专业软件，非常的好用，在我推荐的电子书籍里也有很多关于此软件的。 SAS EM是一个菜单化的界面，可以让你通过拖拽图表进行数据挖掘，简单易用。
我在英国花了很长时间研究这个软件，如今在公司里用起来得心应手，看到我的同事煞是羡慕。&/p&&br&&p&有一门课叫做定性分析，这是与定量分析相辅相成的一门学科，很锻炼人的思维。这门学科不涉及数据，是从文字的角度让我们去思考一个项目，通过收集到的文字资料进行文本分析，挖掘出资料当中潜在的有价值的信息，得出最初的结论。再结合定量分析，使用数据分析对自己的判断进行佐证。这个学科还有一个很出名的软件，叫做nvivo，大家百度一下便知道，我们当时也是使用该软件进行的定性分析。&/p&&br&&p&还有一门课叫做数据收集，就是学会如何去收集我们所需要的数据，收集完之后该如何保存，修改，清洗。收集数据是一门艺术，并不是简单的去网上下载或者去图书馆查找资料。我们需要将一个问题转化成可以量化的事件，然后根据此事件去收集数据。&/p&&br&&p&最后一门课叫做网页分析，使用的是谷歌分析。就是统计网站的IP量，用户数，点击数，用户路径等指标。当然谷歌分析的内容远远不止这些，我们可以通过谷歌分析研究用户行为，评估网站质量等。我想，只要是互联网公司，都会放大量的财力、人力、精力在网页分析上的。所以这门课的重要性不言而喻。&/p&&br&&br&&p&课程的学习差不多就这些，当然其中还有很多小课和讲座我没有列出来。希望这些能够帮助大家。&/p&&br&------------------------------------------------------------------------------------------------------&br&&br&我和我的几个英国同学创办了一个微信公众账号，会和大家分享我们自身学习数据分析的历程，还有一些有趣的学习数据分析方法。欢迎大家添加：soton2014sky&br&扫一下来添加：&br&&img src=&/681e63d6f4aa4ee72832_b.jpg& data-rawwidth=&258& data-rawheight=&258& class=&content_image& width=&258&&&br&_________________________________________________________________________&br&1月29号更新：&br&&br&这篇文章被很多网站转载了，着实让我大吃一惊。各位大V，小V，深V 帮忙进行了转载或者微信推送，还是很感谢的。&br&&br&很多朋友私信我说，能不能得到一份我文章张写到的教材和讲义。答案是：YES&br&鄙人与几个英国朋友开了一个淘宝店，专职于数据分析教材的售卖和数据分析服务。如果大家有兴趣，可以戳下面的链接前去观光一番，如果觉得厌恶，请屏蔽。&br&&br&&a href=&/item.htm?spm=23-.4.zIeTpy&id=& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&数据分析新手菜鸟
数据分析教材教程
指导 spss sas-淘宝网&i class=&icon-external&&&/i&&/a&
接到很多朋友的私信，想让我讲讲我自己学数据分析的路程。于是，今天给大家讲一个故事。我本科毕业于一个三流的二本院校，专业是三流中的三流---市场营销。大学前三年在各种游戏中度过，连兼职和实习的经历都没有。到大四的时候突然开始恐慌，觉得这样下去…
来自子话题：
python与R相比速度要快。python可以直接处理上G的数据；R不行，R分析数据时需要先通过数据库把大数据转化为小数据（通过groupby）才能交给R做分析，因此R不可能直接分析行为详单，只能分析统计结果。Python=R+SQL/Hive&br&&br&R的优势在于有包罗万象的统计函数可以调用，特别是在时间序列分析方面（主要用在金融分析与趋势预测）无论是经典还是前沿的方法都有相应的包直接使用；相比python在这方面贫乏不少。&br&&br&Python的优势在于其胶水语言的特性，一些底层用C写的算法封装在python包里后性能非常高效(Python的数据挖掘包Orange canve 中的决策树分析50万用户10秒出结果，用R几个小时也出不来，8G内存全部占满)。&br&&br&总的来说Python是一套比较平衡的语言，各方面都可以，而R是在统计方面比较突出。但是数据分析其实不仅仅是统计，前期的数据收集，数据处理，数据抽样，数据聚类，以及比较复杂的数据挖掘算法，数据建模等等这些任务，只要是100M以上的数据，R都很难胜任，但是Python却基本胜任。&br&&br&补充一下：&br&Python有专门的数据分析包Pandas用来完成类似SQL的功能，不过Pandas是会把数据都load到内存里，如果数据太大（2G以上）需要想办法分chunk分析，或者用pytables/pyh5转换为hdf5格式的文件在硬盘上分析。&br&另外如果是windows环境的话，建议用winpython，上面提到的这些包会自带。当然更丰富的是pythonxy可惜这个只有32位的。&br&&br&SAS和SPSS是商业数据分析软件，本屌从来没用过。
python与R相比速度要快。python可以直接处理上G的数据；R不行，R分析数据时需要先通过数据库把大数据转化为小数据（通过groupby）才能交给R做分析，因此R不可能直接分析行为详单，只能分析统计结果。Python=R+SQL/HiveR的优势在于有包罗万象的统计函数可以…
&b&正统教材: &/b& &br& 主要是下面这两本（第一本好些，虽然第二本好像国内用的比较多）: &br&&ol&&li&Pang-Ning Tan, Michael Steinbach and Vipin Kumar, Introduction to Data Mining.&br&&/li&&li&Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques.&/li&&/ol&&b&前沿教材: &/b&&br& 但比较新的还是推荐Stanford课程讲义总结出来的, 课件也很好。跟传统教材相比，更侧重大规模数据处理的一些技术，例如高维数据分析。
&br& Mining of Massive Dataset, by
Anand Rajaraman and Jeff Ullman ( Derived from Stanford CS345) (网上可以直接下载: &a href=&http://infolab.stanford.edu/~ullman/mmds.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&infolab.stanford.edu/~u&/span&&span class=&invisible&&llman/mmds.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& ) &br&&br&&b&通俗读本:&/b&&br& 更通俗的入门的推荐这本, 很多例子，生动，强调动手和实际问题解决而不是理论:
&br& Programming Collective Intelligence, by Toby Segaran, August 2007.
&br& (有中文版: &a href=&http://www./129896&ref=xilie& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/129896&re&/span&&span class=&invisible&&f=xilie&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& )
&br&&br&&b&拓展性读物: &/b&&br& 个人也很喜欢下面这本（网上可以下到PDF），一本多个大牛写的关于一些大规模数据分析和挖掘的应用合集，适合进阶的时候当闲书看看。 &br& Beautiful Data by Toby Segaran, Jeff Hammerbacher ( &a href=&/catalog/8& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/catalog/978&/span&&span class=&invisible&&&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& ) &br&&br& 还有两本参考书是我放在书架上有什么需要用到，但没有接触过就看看的, 两本都有影印版本:
&br& The Text Mining Handbook by R. Feldman and J. Sanger ( &a href=&/subject/3987475/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/subject&/span&&span class=&invisible&&/3987475/&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& )&br& Web Data Mining by Bing Liu ( &a href=&/subject/3639345/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/subject&/span&&span class=&invisible&&/3639345/&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& )
&br&&br&&b&基础理论性读物:&/b& &br& 最后，想要打好基础，可以回过头来看看这本偏理论的书:
&br& The Elements of Statistical Learning (统计学习基础) by Trevor Hastie etc
(&a href=&/subject/3578359/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/subject&/span&&span class=&invisible&&/3578359/&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& )
&br&&br& 当然，如果你是有志于专门深入数据挖掘的某个细分领域，最好直接读相关的survey论文，和最新的直接看各大数据挖掘相关会议论文即可 ( KDD/SIGMOD/VLDB/ICDE/WSDM/ICDM etc)
主要是下面这两本（第一本好些，虽然第二本好像国内用的比较多）: Pang-Ning Tan, Michael Steinbach and Vipin Kumar, Introduction to Data Mining.Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques.前沿教材:
来自子话题：
Python与R不同，Python是一门多功能的语言。数据统计是更多是通过第三方包来实现的。&br&&br&具体来说，我常用的Python在统计上面的Package有这样一些&br&1.Numpy与Scipy。这两个包是Python之所以能在数据分析占有一席之地的重要原因。其中Numpy封装了基础的矩阵和向量的操作，而Scipy则在Numpy的基础上提供了更丰富的功能，比如各种统计常用的分布和算法都能迅速的在Scipy中找到。&br&2.Matplotlib。这个Package主要是用来提供数据可视化的，其功能强大，生成的图标可以达到印刷品质，在各种学术会议里面出镜率不低。依托于Python，可定制性相对于其他的图形库更高。还有一个优点是提供互动化的数据分析，可以动态的缩放图表，用做adhoc analysis非常合适。&br&3.Scikit Learn。非常好用的Machine Learning库，适合于用于快速定制原型。封装几乎所有的经典算法(神经网络可能是唯一的例外，不过这个有Pylearn2来补充)，易用性极高。&br&4.Python标准库。这里主要是体现了Python处理字符串的优势，由于Python多功能的属性和对于正则表达式的良好支持，用于处理text是在合适不过的了。&br&&br&基本上就日常使用就涉及这些。符号运算等等也有Sympy和Theano等强力第三方库来支持。总结，Python在你列举这些里面是综合功能最强大的，但是这些功能分散在第三方库里面，没有得到有机的整合，相应的学习成本会较高。
Python与R不同，Python是一门多功能的语言。数据统计是更多是通过第三方包来实现的。具体来说，我常用的Python在统计上面的Package有这样一些1.Numpy与Scipy。这两个包是Python之所以能在数据分析占有一席之地的重要原因。其中Numpy封装了基础的矩阵和向量…
来自子话题：
谢邀，对于此问题也不甚了解，只能粗略回答一下。&br&&p&1.因子分析的基本步骤&/p&&p&（1）确认待分析的原始变量是否适合作因子分析；&/p&&p&（2）构造因子变量；&/p&&p&（3）利用旋转方法使因子变量具有可解释性；&/p&&p&（4）计算每个样本的因子变量得分。&/p&&p&2.因子分析的数学模型&/p&&img src=&/9a235c6eaa8e8_b.jpg& data-rawwidth=&548& data-rawheight=&456& class=&origin_image zh-lightbox-thumb& width=&548& data-original=&/9a235c6eaa8e8_r.jpg&&&p&3.&b&因素分析的主要方式&/b&&/p&&p&
围绕浓缩原有变量提取因子的核心目标，因子分析主要涉及以下五大基本步骤：&/p&&p&1、因子分析的前提条件&/p&&p&
由于因子分析的主要任务之一是对原有变量进行浓缩，即将原有变量中的信息重叠部分提取和综合成因子，进而最终实现减少变量个数的目的。因此它要求原有变量之间应存在较强的相关关系。否则，如果原有变量相互独立，相关程度很低，不存在信息重叠，它们不可能有共同因子，那么也就无法将其综合和浓缩，也就无需进行因子分析。本步骤正是希望通过各种方法分析原有变量是否存在相关关系，是否适合进行因子分析。&/p&&p&
SPSS提供了四个统计量可帮助判断观测数据是否适合作因子分析：&/p&&p&（1）计算相关系数矩阵Correlation Matrix&/p&&p&
在进行提取因子等分析步骤之前，应对相关矩阵进行检验，如果相关矩阵中的大部分相关系数小于0.3，则不适合作因子分析；当原始变量个数较多时，所输出的相关系数矩阵特别大，观察起来不是很方便，所以一般不会采用此方法或即使采用了此方法，也不方便在结果汇报中给出原始分析报表。&/p&&p&（2）计算反映象相关矩阵Anti-image correlation matrix&/p&&p&
反映象矩阵重要包括负的协方差和负的偏相关系数。偏相关系数是在控制了其他变量对两变量影响的条件下计算出来的净相关系数。如果原有变量之间确实存在较强的相互重叠以及传递影响，也就是说，如果原有变量中确实能够提取出公共因子，那么在控制了这些影响后的偏相关系数必然很小。&/p&&p&
反映象相关矩阵的对角线上的元素为某变量的MSA（Measure of
Sample Adequacy）统计量，其数学定义为：&img src=&/a796c43cbe0bdc81a574691_b.jpg& data-rawwidth=&632& data-rawheight=&288& class=&origin_image zh-lightbox-thumb& width=&632& data-original=&/a796c43cbe0bdc81a574691_r.jpg&&&/p&&p&
观察反映象相关矩阵，如果反映象相关矩阵中除主对角元素外，其他大多数元素的绝对值均小，对角线上元素的值越接近1，则说明这些变量的相关性较强，适合进行因子分析。与（1）中最后所述理由相同，一般少采用此方法。&/p&&p&（3）巴特利特球度检验Bartlett test of sphericity&/p&&p&
Bartlett球体检验的目的是检验相关矩阵是否是单位矩阵（identity matrix），如果是单位矩阵，则认为因子模型不合适。Bartlett球体检验的虚无假设为相关矩阵是单位阵，如果不能拒绝该假设的话，就表明数据不适合用于因子分析。一般说来，显著水平值越小（&0.05）表明原始变量之间越可能存在有意义的关系，如果显著性水平很大（如0.10以上）可能表明数据不适宜于因子分析。&/p&&p&（4）KMO（Kaiser-Meyer-Oklin
Measure of Smapling Adequacy）&/p&&p&
KMO是Kaiser-Meyer-Olkin的取样适当性量数。KMO测度的值越高（接近1.0时），表明变量间的共同因子越多，研究数据适合用因子分析。通常按以下标准解释该指标值的大小：KMO值达到0.9以上为非常好，0.8～0.9为好，0.7～0.8为一般，0.6～0.7为差，0.5～0.6为很差。如果KMO测度的值低于0.5时，表明样本偏小，需要扩大样本。&/p&&p&综上所述，经常采用的方法为巴特利特球度检验Bartlett test of sphericity和KMO（Kaiser-Meyer-Oklin Measure of Smapling
Adequacy）。&/p&&p&2、抽取共同因子，确定因子的数目和求因子解的方法&/p&&p&
将原有变量综合成少数几个因子是因子分析的核心内容。本步骤正是研究如何在样本数据的基础上提取和综合因子。决定因素抽取的方法，有“主成份分析法”（principal components analysis）、主轴法、一般化最小平方法、未加权最小平方法、最大概似法、Alpha因素抽取法与映象因素抽取法等。使用者最常使用的是主成份分析法与主轴法，其中，又以主成份分析法使用最为普遍，在SPSS使用手册中，也建议研究者多采用主成份分析法来估计因素负荷量。所谓主成份分析法，就是以较少的成份解释原始变量方差的较大部分。进行主成份分析时，先要将每个变量的数值转换成标准值。主成份分析就是用多个变量组成一个多维空间，然后在空间内投射直线以解释最大的方差，所得的直线就是共同因子，该直线最能代表各个变量的性质，而在此直线上的数值所构成的一个变量就是第一个共同因子，或称第一因子。但是在空间内还有剩余的方差，所以需要投射第二条直线来解释方差。这时，还要依据第二条准则，即投射的第二条直线与第一条直线成直交关系，意为代表不同的方面。第二条直线上的数值所构成的一个变量，称为第二因子。依据该原理可以求出第三、第四或更多的因子。原则上，因子的数目与原始变量的数目相同，但抽取了主要的因子之后，如果剩余的方差很小，就可以放弃其余的因子，以达到简化数据的目的。&/p&&p&
因子数目的确定没有精确的定量方法，但常用的方法是借助两个准则来确定因子的个数。一是特征值（eigenvalue）准则，二是碎石图检验（scree
test）准则。特征值准则就是选取特征值大于或等于1的主成份作为初始因子，而放弃特征值小于1的主成份。因为每个变量的方差为1，该准则认为每个保留下来的因子至少应该能解释一个变量的方差，否则达不到精简数据的目的。碎石检验准则是根据因子被提取的顺序绘出特征值随因子个数变化的散点图，根据图的形状来判断因子的个数。散点曲线的特点是由高到低，先陡后平，最后几乎成一条直线。曲线开始变平的前一个点被认为是提取的最大因子数。后面的散点类似于山脚下的碎石，可舍弃而不会丢失很多信息。&/p&&p&3、使因子更具有命名可解释性&/p&&p&
通常最初因素抽取后，对因素无法作有效的解释。这时往往需要进行因子旋转（rotation），通过坐标变换使因子解的意义更容易解释。转轴的目的在于改变题项在各因素负荷量的大小，转轴时根据题项与因素结构关系的密切程度，调整各因素负荷量的大小，转轴后，使得变量在每个因素的负荷量不是变大（接近1）就是变得更小（接近0），而非转轴前在每个因素的负荷量大小均差不多，这就使对共同因子的命名和解释变量变得更容易。转轴后，每个共同因素的特征值会改变，但每个变量的共同性不会改变。常用的转轴方法，有最大变异法（Varimax）、四次方最大值法（Quartimax）、相等最大值法（Equamax）、直接斜交转轴法（Direct
Oblimin）、Promax转轴法，其中前三者属于“直交转轴法”（orthogonal rotations），在直交转轴法中，因素（成份）与因素（成份）间没有相关，亦即其相关为0，因素轴间夹角为90°；而后二者（直接斜交转轴、Promax转轴法）属“斜交转轴”（oblique rotations），采用斜交转轴法，表示因素与因素间彼此有某种程度的相关，亦即因素轴间的夹角不是90°。&/p&&p&直交转轴法的优点是因素间提供的信息不会重叠，观察体在某一个因素的分数与在其它因素的分数，彼此独立不相关；而其缺点是研究者迫使因素间不相关，但在实际情境中，它们彼此有相关的可能性很高。因而直交转轴方法偏向较多人为操控方式，不需要正确响应现实世界中自然发生的事件（Bryman&Cramer,1997）。&/p&&p&
所谓直交旋转法（orthogonal rotations），就是要求各个因子在旋转时都要保持直角关系，即不相关。在直交旋转时，每个变量的共同性（commonality）是不变的。不同的直交旋转方法有不同的作用。在直交旋转法中，常用于社会科学研究的方式是Varimax旋转法。该方法是在旋转时尽量弄清楚在每一个因子上各个变量的因子负荷情况，也即让因子矩阵中每一列的的值尽可能变成1或0，该旋转法的作用是突出每个因子的性质，可以更清楚哪些变量是属于它的。由此可见，Varimax旋转法可以帮助找出多个因子，以澄清概念的内容。Quartimax旋转法可以则可以尽量弄清楚每个变量在各个因子上的负荷情况，即让每个变量在某个因子上的负荷尽可能等于1，而在其它因子上则尽可能等于0。该方法可以增强第一因子的解释力，而使其它因子的效力减弱。可见Quartimax旋转法适合于找出一个最强效力的因子。Equamax旋转法则是一种折中的做法，即尽可能简化因子，也可弄清楚负荷情况。其缺点是可能两方面都未照顾好。&/p&&p&斜交旋转（oblique rotarion）方法是要求在旋转时各个因子之间呈斜交的关系，表示允许该因子与因子之间有某种程度上的相关。斜交旋转中，因子之间的夹可以是任意的，所以用斜交因子描述变量可以使因子结构更为简洁。选择直接斜交旋转时，必须指定Delta值。该值的取值范围在0～－1之间，0值产生最高相关因子，大的负数产生旋转的结果与直交接近。Promax斜交旋转方法也允许因子彼此相关，它比直接斜交旋转更快，因此适用于大数据集的因子分析。&/p&&p&综上所述，不同的因子旋转方式各有其特点。因此，究竟选择何种方式进行因子旋转取决于研究问题的需要。如果因子分析的目的只是进行数据简化，而因子的确切含义是什么并不重要，就应该选择直交旋转。如果因子分析的目的是要得到理论上有意义的因子，应该选择斜交因子。事实上，研究中很少有完全不相关的变量，所以，从理论上看斜交旋转优于直交旋转。但是斜交旋转中因子之间的斜交程度受研究者定义的参数的影响，而且斜交选装中所允许的因子之间的相关程度是很小的，因为没有人会接受两个高度相关的共同因子。如果两个因子确实高度相关，大多数研究者会选取更少的因子重新进行分析。因此，斜交旋转的优越性大打折扣。在实际研究中，直交旋转（尤其是Varimax旋转法）得到更广泛的运用。&/p&&p&4、决定因素与命名&/p&&p&
转轴后，要决定因素数目，选取较少因素层面，获得较大的解释量。在因素命名与结果解释上，必要时可将因素计算后之分数存储，作为其它程序分析之输入变量。&/p&&p&5、计算各样本的因子得分&/p&&p&
因子分析的最终目标是减少变量个数，以便在进一步的分析中用较少的因子代替原有变量参与数据建模。本步骤正是通过各种方法计算各样本在各因子上的得分，为进一步的分析奠定基础。&/p&&br&&br&&p&地质生一枚，Geology isn't a real science!啊……&/p&
谢邀，对于此问题也不甚了解，只能粗略回答一下。1.因子分析的基本步骤（1）确认待分析的原始变量是否适合作因子分析；（2）构造因子变量；（3）利用旋转方法使因子变量具有可解释性；（4）计算每个样本的因子变量得分。2.因子分析的数学模型3.因素分析的主…
Excel分两步&br&先别买书，你看到的大多数书，都是帮助系统的变化版，甚至就是帮助系统本身打印出来的。在Excel里面，按F1，够你看一个月了，着重看功能和函数，VBA可以先不看，所有例子至少要练习一遍。&br&熟悉了这些之后，看你对应行业的实例操作，另外单独看一本会计的操作。剩下的你就自己知道选什么书真的适合你了。&br&SPSS，我用的一般，无法分辨好坏。
Excel分两步先别买书，你看到的大多数书，都是帮助系统的变化版，甚至就是帮助系统本身打印出来的。在Excel里面，按F1，够你看一个月了，着重看功能和函数，VBA可以先不看，所有例子至少要练习一遍。熟悉了这些之后，看你对应行业的实例操作，另外单独看一…
光会SPSS点菜单远远不够。理解背后原理可以让你不仅熟练运用SPSS，也可以让你更快跳出SPSS的框架，使用更复杂的工具，比如Mplus，R，SAS等&br&————————————————————————————————————————&br&用电脑更新一点吧。&br&我个人的经验是&b&还是要多看paper&/b&，尤其自己&b&本领域的paper&/b&，大家一般用什么分析方法，然后看他们的rationale，一般文章里都会写为什么选这个，有什么好处之类。然后结合自己的数据举一反三，查书和资料去挖掘背后的意义，这是个积累过程。大家都是慢慢学吧。&br&打个比方，测量2个rater之间的reliability现在主流是用Cohen‘s kappa。为什不用简单的percent agreement? 因为kappa控制了random agreement。&br&&br&&b&统计方法跟着实验设计走，开始阶段，自己的实验设计基本也是照葫芦画瓢，看领域内别人都是怎么做吧。&/b&&br&&br&比如我领域里很多大样本的family study（带双胞胎的），目的大多都是找变量关系，控制这个控制那个，找interaction，大多都是用回归模型。我平时学习关注的重点就在各种回归模型和结构方程建模上。我这个领域很多时候要分析dyadic data，我也一直在学习中，没少犯错。&br&&br&比如临床和社会方面，小样本的对照实验比较多，各种ANOVA，MANOVA, ANCOVA，Chi-sqaure可能就是你的学习重点。还要熟悉power analysis，判断实验需要的样本容量。&br&&br&做测量的，则侧重于psychometric theory的学习。比如各种reliability和validity的计算，甚至item response theory之类的。&br&&br&做认知的我没怎么接触，fMRI分析好像很复杂，好像也是GLM用的比较多。&br&——————————————————————————————————————————&br&&br&另外要清楚了解各种分析方法的假设条件assumption，哪些条件不满足不能使用哪些方法。知道如何变化自己的数据使之符合假设。还是那句老话：garbage in, garbage out.&br&&br&最后去学习更高级的知识。Process Analyses, SEM，MLM等。&br&&br&不过说&b&到底就是经验和多看paper和书，&/b&没事找数据练手。统计方法没有绝对对错，所以不存在“正确”这个说法，而只有合适不合适。犯错多了自然就明白了。具体问题可以私信。
光会SPSS点菜单远远不够。理解背后原理可以让你不仅熟练运用SPSS，也可以让你更快跳出SPSS的框架，使用更复杂的工具，比如Mplus，R，SAS等————————————————————————————————————————用电脑更新一点吧。我个人的经…
这个要分行业来看，在金融行业和医药行业，SAS占据统治性的地位（5大行、几乎所有股份制银行、部分城商行都在用SAS）；在政府和教育行业，则是SPSS占优。在互联网企业，则以开源的R等占据明显优势。
这个要分行业来看，在金融行业和医药行业，SAS占据统治性的地位（5大行、几乎所有股份制银行、部分城商行都在用SAS）；在政府和教育行业，则是SPSS占优。在互联网企业，则以开源的R等占据明显优势。
我觉得学SPSS有两个关键点，一是知道什么现实问题要用什么统计分析方法，二是要明白软件输出的各种指标是什么意思。前者推荐《深入浅出统计学》，多花一点时间入门，打好基础；后者我自己入门时候看的是《统计学：从数据到结论》，觉得还不错
我觉得学SPSS有两个关键点，一是知道什么现实问题要用什么统计分析方法，二是要明白软件输出的各种指标是什么意思。前者推荐《深入浅出统计学》，多花一点时间入门，打好基础；后者我自己入门时候看的是《统计学：从数据到结论》，觉得还不错
你先用excel做一张表，然后学习一下excel里面最基本的VBA（宏，大约只需要一两天就够了），然后你就可以批量产生大量的表了。
你先用excel做一张表，然后学习一下excel里面最基本的VBA（宏，大约只需要一两天就够了），然后你就可以批量产生大量的表了。
我个人认为，对于统计学软件，不用懂统计原理&br&买一本&SPSS其实很简单》,然后按着书中的数据进行输入，对变量属性学会怎么改&br&对于数据分析方法知道在软件的那个栏找到，并且知道这个分析方法有什么用途，得到结果怎么解释就可以了。&br&&br&一个工具软件，是知道如何操作，然后了解操作后的结果怎么解释就可以，什么统计学原理什么方程什么什么的，看着直糊涂，对于论文也不会应用，学了也没用，学会拿起斧子砍大树，然后知道树的这块木头用来生火，那块用来造房子就可以了。
我个人认为，对于统计学软件，不用懂统计原理买一本&SPSS其实很简单》,然后按着书中的数据进行输入，对变量属性学会怎么改对于数据分析方法知道在软件的那个栏找到，并且知道这个分析方法有什么用途，得到结果怎么解释就可以了。一个工具软件，是知道如何操…
难道你们都不知道一个叫E-pidata的软件吗，使用这个软件的录入效率要比使用Execl或SPSS高出几倍，本来这两个软件也不是专业用来录入数据的，而E-pidata的却是专为录入数据而生。&br&不过还有一个讨巧的办法，就是把问卷录入到类似问卷星这样的平台，录入数据只需要点击鼠标就就可以了，相比E-pidata而言，省去了制作录入文件的麻烦！&br&&br&&br&那些还在说使用excel录入数据的小伙伴们，你们就不能有点进步嘛？
难道你们都不知道一个叫E-pidata的软件吗，使用这个软件的录入效率要比使用Execl或SPSS高出几倍，本来这两个软件也不是专业用来录入数据的，而E-pidata的却是专为录入数据而生。不过还有一个讨巧的办法，就是把问卷录入到类似问卷星这样的平台，录入数据只…
懂了统计学SPSS还需要学习？
懂了统计学SPSS还需要学习？
来自子话题：
本科是数学，后来觉得自己太笨就去学统计，再后来感叹青春太短就去工作。&br&&br&做data analysis好处是不太累，忙中偷闲的时间多。坏处是钱不多，需要对着电脑。&br&&br&本科学了sql，matlab，c++。对c++实在无爱，学了一年不到放弃。matlab感觉界面不好看。sql那门课分也不高。&br&&br&读统计时候学了R，SAS，python。Java实在无爱。python很有趣，可惜我去不了Google后来就不太用了。R简直是一生所爱。SAS界面也很丑，工作用多习惯了。&br&&br&现在觉得软件只是工具，记得为什么而分析才是重要的。
本科是数学，后来觉得自己太笨就去学统计，再后来感叹青春太短就去工作。做data analysis好处是不太累，忙中偷闲的时间多。坏处是钱不多，需要对着电脑。本科学了sql，matlab，c++。对c++实在无爱，学了一年不到放弃。matlab感觉界面不好看。sql那门课分也…
可以啊，用程序处理excel很简单，你出多少钱？
可以啊，用程序处理excel很简单，你出多少钱？
当年我们数论老师余大侠曾经说过：什么叫学到家了，就是懂得玩味了。&br&&br&能在工作之余玩味一个软件，或者编程语言，那才是真正的境界了。比如某个君问你说，我现在在学B语言，之前我学过的A语言有xx功能，怎么B语言里没有啊！&br&这个时候你说，这有何难，让哥手到擒来现场给你实现出一个xx功能。&br&&br&做到这个，你就算学到家了。
当年我们数论老师余大侠曾经说过：什么叫学到家了，就是懂得玩味了。能在工作之余玩味一个软件，或者编程语言，那才是真正的境界了。比如某个君问你说，我现在在学B语言，之前我学过的A语言有xx功能，怎么B语言里没有啊！这个时候你说，这有何难，让哥手到…
来自子话题：
谢邀。&br&&br&这很取决于公车到达时间的分布。。。参：&a href=&/questions/222674/average-bus-waiting-time& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&probability - Average bus waiting time&i class=&icon-external&&&/i&&/a&
谢邀。这很取决于公车到达时间的分布。。。参：
我做过一次，分享一下我用excel处理的经历吧。&br&&br&&ol&&li&问卷录入是首要的问题，你需要设计一个表格，把网络和纸质的问卷都录入进去，我当初做的问卷分析有13000+问卷，同事一起录入零零碎碎用了两个礼拜左右。为了减少录入成本，用1,2,3,4代替ABCD，每个题一列，然后因为有开放性的答案，单独留一列给开放性的回答。如果是&b&多选题&/b&，比如总共个选项，那就给出5列，&b&排序题&/b&也一样，5个选项排序就给5列，5个选项排前三就给3列，只是注意录入的顺序要严格按照排序的顺序。截图如下：&img src=&/c6fd4f9a5cb_b.jpg& data-rawwidth=&1090& data-rawheight=&399& class=&origin_image zh-lightbox-thumb& width=&1090& data-original=&/c6fd4f9a5cb_r.jpg&&其中Q1就是多选，Q7就是开放性问题。&/li&&li&问卷选项转制，用公式把所有问题的选项转制为0和1，这一步比较麻烦，用了不少公式。还有就是，因为是开放性的回答，我对其中的观点进行提炼，总结出一些主要原因，并进行文本判断，来给开放性的回答归类，这个也有些麻烦。截图如下：&br&&img src=&/c304b634880e_b.jpg& data-rawwidth=&508& data-rawheight=&498& class=&origin_image zh-lightbox-thumb& width=&508& data-original=&/c304b634880e_r.jpg&&&br&&br&&img src=&/3a62ea472d1bde27bcfb5_b.jpg& data-rawwidth=&1035& data-rawheight=&489& class=&origin_image zh-lightbox-thumb& width=&1035& data-original=&/3a62ea472d1bde27bcfb5_r.jpg&&&img src=&/70de61eff441f3c3422157d_b.jpg& data-rawwidth=&994& data-rawheight=&458& class=&origin_image zh-lightbox-thumb& width=&994& data-original=&/70de61eff441f3c3422157d_r.jpg&&&br&&/li&&li&我这里还有一步，就是修改数据（掉节操
= =），因为甲方的要求是有人口比例的，20-30岁占问卷30%这样子，实际上分发问卷的线下公司不可能做的这么精细，没办法我就要改，又设计公式来控制比例，看看哪个城市哪个人群多，改到人群比例少的里面去。&/li&&li&转制出来的表格拉数透进行分析，用做出来的结果做PPT，数透截图如下：&img src=&/cfd87aa79fcc_b.jpg& data-rawwidth=&402& data-rawheight=&408& class=&content_image& width=&402&&&img src=&/cd7abfebf19de_b.jpg& data-rawwidth=&402& data-rawheight=&282& class=&content_image& width=&402&&&/li&&/ol&总结一下，一个是数据录入很烦，一个是公式设计比较麻烦。这就是我的经历，希望有用。
我做过一次，分享一下我用excel处理的经历吧。问卷录入是首要的问题，你需要设计一个表格，把网络和纸质的问卷都录入进去，我当初做的问卷分析有13000+问卷，同事一起录入零零碎碎用了两个礼拜左右。为了减少录入成本，用1,2,3,4代替ABCD，每个题一列，然后…
推荐这个，很好的书&br&《Mining of Massive Datasets 》&br&&a href=&http://infolab.stanford.edu/~ullman/mmds.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&infolab.stanford.edu/~u&/span&&span class=&invisible&&llman/mmds.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& &br&有ppt、全文
推荐这个，很好的书《Mining of Massive Datasets 》有ppt、全文
来自子话题：
这个问题，在知乎上挂了好多天，回答的人也很少（几乎没有╮(╯_╰)╭），大概是因为我刚开始用知乎，没什么人缘，只是根据系统推荐邀请了几个人回答，所以可能没什么人看到我的问题吧。所以，感谢一楼回答的那位。&br&&br&后来，我自己又查找各种资料，终于找到了因子分析的手算方法了。&br&&br&如下，因子分析的数学模型&br&&img src=&/330febbc4afaa9348f68_b.jpg& data-rawwidth=&548& data-rawheight=&456& class=&origin_image zh-lightbox-thumb& width=&548& data-original=&/330febbc4afaa9348f68_r.jpg&&手算步骤——&br&1.标准化原始数据X，具体方法可以在网上“轻易”找到&br&2.计算X的相关系数矩阵R（手算比较繁琐，但SPSS很容易导出）&br&3.也是我当时最困惑的一点，如何计算出因子载荷阵A（没有求出A，那么一切都无法继续啊啊啊，所以A应该怎么求啊啊啊，如下）&br&（1）求R的特征值λ1≥λ2≥λ3≥…λp≥0及对应的单位特征向量&i&μ&/i&1,&i&μ&/i&2&i&,μ&/i&3&i&,…μ&/i&p&br&（2）计算因子载荷a(ij)，得到因子载荷阵A&br&&img src=&/73d3b7b24fbc78778afcbb9da972f9a3_b.jpg& data-rawwidth=&436& data-rawheight=&127& class=&origin_image zh-lightbox-thumb& width=&436& data-original=&/73d3b7b24fbc78778afcbb9da972f9a3_r.jpg&&4.根据特征根λ大小确定公因子F个数，选出公因子（选λ&1的为公因子）&br&5.计算共同度和方差贡献率&br&Xi的变量共同度为因子载荷矩阵A中第&i&i&/i&行元素的平方和；因子变量Fj的方差贡献为因子载荷矩阵A中第j列各元素的平方和。&br&6.因子旋转，得出旋转后的成分矩阵（这个手算太可怕，不知道要用正交阵去乘因子载荷阵多少次，所以一般用SPSS导出吧。。。）&br&7.计算因子得分&br&&br&用SPSS导出的结果中，【成分矩阵】就是初始的因子载荷阵A！！！&br&&br&具体步骤和分析道理，可见百度文库一篇文&br&链接：&a href=&/view/33403b68ddccda38376baf6e.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&因子分析的基本思想、基本步骤、数学模型及求解&i class=&icon-external&&&/i&&/a&&br&&br&&br&自己的问题自己回答o(╯□╰)o，总之就酱啦~希望给后来人一个小借鉴吧。。。
这个问题，在知乎上挂了好多天，回答的人也很少（几乎没有╮(╯_╰)╭），大概是因为我刚开始用知乎，没什么人缘，只是根据系统推荐邀请了几个人回答，所以可能没什么人看到我的问题吧。所以，感谢一楼回答的那位。后来，我自己又查找各种资料，终于找到了…}

叫阿莫西中心