SPSS(Statistical Product and Service Solutions),即“统计产品与服务解决方案”软件。SPSS是IBM公司推出的统计分析软件,基本功能包括数据管理、统计分析、图表分析、输出管理。
SPSS是世界上最早的统计分析软件,由美国
斯坦福大学的三位研究生Norman H. Nie、C. Hadlai (Tex) Hull和Dale H. Bent于1968年研究开发成功,同时成立了SPSS公司,并于1975年成立法人组织,在
芝加哥组建了SPSS总部。1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、
回归分析、对数线性模型、聚类分析等几大类。
SPSS操作简便、编程方便、功能强大且分析结果清晰、直观,能够读取及输出多种格式的文件。比如由
dBASE、
Visual FoxPro、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据文件。SPSS应用领域广泛,在通信、医疗、银行、科研教育等众多领域和行业都有所涉及。
发展沿革
SPSS是世界上最早的统计分析软件,由美国
斯坦福大学的三位研究生Norman H.Nie、C.Hadlai(Tex) Hull 和 Dale H.Bent于1968年研究开发成功,同时成立了SPSS公司,并于1975年成立法人组织、在
芝加哥组建了SPSS总部。
2009年7月28日,IBM公司宣布将用12亿美元现金收购统计分析软件提供商SPSS公司。如今SPSS的最新版本为25,而且更名为IBM SPSS Statistics。迄今,SPSS公司已有40余年的成长历史。
主要功能
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。用户只要掌握一定的Windows操作技能,精通统计分析原理,就可以使用该软件为特定的科研工作服务。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPO格式,可以转存为
HTML格式和文本格式。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大的方便了中、高级用户。
SPSS for Windows是一个组合式软件包,它集数据录入、整理、分析功能于一身。用户可以根据实际需要和
计算机的功能选择模块,以降低对系统
HDD容量的要求,有利于该软件的推广应用。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、
回归分析、
对数线性模型、聚类分析、数据简化、生存分析、
时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分
线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段
最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。
SPSS for Windows的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,现已推广到多种各种操作系统的计算机上,它和
SAS、BMDP并称为国际上最有影响的三大统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。
SPSS for Windows由于其操作简单,已经在我国的
社会科学、
自然科学的各个领域发挥了巨大作用。该软件还可以应用于
经济学、数学、
统计学、
物流管理、生物学、心理学、地理学、医疗卫生、体育、农业、林业、商业等各个领域。
发展历史
1968年:诞生第一个用于大型机的统计软件
1984年:推出用于个人电脑的SPSS/PC+
1992年:推出Windows版本,同时全球自SPSS 11.0起,SPSS全称为“Statistical Product and Service Solutions”,即“统计产品和服务解决方案”
2009年:SPSS公司宣布重新包装旗下的SPSS产品线,定位为预测统计分析软件(Predictive Analytics
软件)PASW,包括四部分:
PASW
统计学(formerly SPSS Statistics):统计分析
PASW Modeler(formerly Clementine) :
数据挖掘数据 Collection family(formerly Dimensions):数据收集
PASW Collaboration and Deployment Services(formerly Predictive Enterprise Services):企业应用服务
2010年:随着SPSS公司被IBM公司并购,各子产品家族名称前面不再以PASW为名,修改为统一加上IBM SPSS字样。
数据管理
在10版以后,SPSS的每个新增版本都会对数据管理功能作一些改进,以使用户的使用更为方便。13版中的改进可能主要有以下几个方面:
1)超长变量名:在12版中,变量名已经最多可以为64个字符长度,13版中可能还要大大放宽这一限制,以达到对当今各种复杂数据仓库更好的
兼容性。
2)改进的Autorecode过程:该过程将可以使用自动编码模版,从而用户可以按自定义的顺序,而不是默认的ASCII码顺序进行变量值的重编码。另外,Autorecode过程将可以同时对多个变量进行重编码,以提高分析效率。
3)改进的日期/时间函数:本次的改进将集中在使得两个日期/时间差值的计算,以及对日期变量值的增减更为容易上。
结果报告
从10版起,对数据和结果的图表呈现功能一直是SPSS改进的重点。在16版中,SPSS推出了全新的常规图功能,报表功能也达到了比较完善的地步。13版将针对使用中出现的一些问题,以及用户的需求对图表功能作进一步的改善。
1)统计图:在经过一年的使用后,新的常规图操作界面已基本完善,本次的改进除使得操作更为便捷外,还突出了两个重点。首先在常规图中引入更多的交互图功能,如图组(Paneled charts),带误差线的分类图形如误差线条图和线图,三维效果的简单、堆积和分段饼图等。其次是引入几种新的图形,已知的有
人口金字塔和点密度图两种。
2)统计表:几乎全部过程的输出都将会弃用文本,改为更美观的枢轴表。而且枢轴表的表现和
易用性会得到进一步的提高,并加入了一些新的功能,如可以对
统计量进行排序、在表格中合并/省略若干小类的输出等。此外,枢轴表将可以被直接导出到
Microsoft Office PowerPoint中,这些无疑都方便了用户的使用。
统计建模
Complex Samples是12版中新增的模块,用于实现复杂
抽样的设计方案,以及对相应的数据进行描述。但当时并未提供统计建模功能。在13版中,这将会有很大的改观。一般线形模型将会被完整地引入复杂抽样模块中,以实现对复杂抽样研究中各种连续性变量的建模预测功能,例如对市场调研中的客户满意度数据进行建模。对于分类数据,Logistic回归则将会被系统的引入。这样,对于一个任意复杂的抽样研究,如多阶段分层整群抽样,或者更复杂的PPS抽样,研究者都可以在该模块中轻松的实现从抽样设计、统计描述到复杂统计
建模以发现影响因素的整个分析过程,
方差分析模型、线形回归模型、Logistic回归模型等复杂的
统计模型都可以加以使用,而操作方式将会和完全随机抽样数据的分析操作没有什么差别。可以预见,该模块的推出将会大大促进国内对复杂
抽样时统计推断模型的正确应用。
模块
这个模块实际上就是将以前单独发行的SPSS AnswerTree软件整合进了SPSS平台。笔者几年前在自己的网站上介绍SPSS 11的新功能时,曾经很尖锐地指出SPSS的产品线过于分散,应当把各种功能较单一的小软件,如AnswerTree、Sample Power等整合到SPSS等几个平台上去。看来SPSS公司也意识到了这一点,而AnswerTree就是在此背景下第一个被彻底整合的产品。
Classification Tree模块基于
数据挖掘中发展起来的树结构模型对分类变量或连续变量进行预测,可以方便、快速的对样本进行细分,而不需要用户有太多的统计专业知识。在市场细分和数据挖掘中有较广泛的应用。已知该模块提供了CHAID、Exhaustive CHAID和C\u0026RT三种算法,在AnswerTree中提供的QUEST算法尚不能肯定是否会被纳入。
为了方便新老用户的使用,Tree模块在操作方式上不再使用AnswerTree中的向导方式,而是SPSS近两年开始采用的交互式选项卡对话框。但是,整个选项卡界面的内容实际上是和原先的向导基本一致的,另外,模型的结果输出仍然是AnswerTree中标准的树形图,这使得AnswerTree的老用户基本上不需要专门的学习就能够懂得如何使用该模块。
由于树结构模型的方法体系和传统的统计方法完全不同,贸然引入可能会引起读者统计方法体系的混乱。为此,本次编写的高级教程并未介绍该模块,而将在高级教程的下一个版本,以及关于市场细分问题的教材中对其加以详细介绍。
兼容性
随着自身产品线的不断完善,SPSS公司的产品体系已经日益完整,而不同产品间的互补和
兼容性也在不断加以改进。在13版中,SPSS软件已经可以和其他一些最新的产品很好地整合在一起,形成更为完整的解决方案。例如,SPSS、SPSS
数据 Entry和新发布的SPSS
文本 Analysis for Surveys一起就形成了对调查研究的完整解决方案。而新增的SPSS Classification Trees模块将使得SPSS软件本身就能够针对市场细分工作提供更为完整的方法体系。
版本介绍
•SPSS 15.0.1-2006年11月
•SPSS 16.0.2-2008年4月
•SPSS
统计学 17.0.1-2008年12月
•PASW Statistics 17.0.2-2009年3月
•PASW Statistics 17.0.3-2009年11月
•PASW Statistics 18.0.0-2009年8月
•PASW Statistics 18.0.1-2009年12月
•PASW Statistics 18.0.2-2010年4月
•PASW Statistics 18.0.3-2010年9月
• IBM SPSS
统计学 19.0-2010年8月
• IBM SPSS Statistics 20.0-2011年8月
• IBM SPSS Statistics 21.0-2012年8月
• IBM SPSS Statistics 22.0-2013年8月
• IBM SPSS Statistics 23.0-2015年8月
• IBM SPSS Statistics 24.0-2016年8月
• IBM SPSS Statistics 25.0-2017年8月
• IBM SPSS Statistics 26.0-2019年5月
•从被IBM收购之后,SPSS的更新都是一年一个版本,每年的8月中旬,总能见到。
产品特点
操作简便
界面非常友好,除了数据录入及部分命令程序等少数输入工作需要
键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
编程方便
具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
功能强大
具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、
方差分析、非参数检验、多元回归、生存分析、
协方差分析、判别分析、因子分析、
聚类分析、
非线性回归、Logistic回归等。
数据接口
能够读取及输出多种格式的文件。比如由
dBASE、
Visual FoxPro、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.
txt及
HTML格式的文件。
模块组合
SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和
计算机的实际配置情况灵活选择。
针对性强
SPSS针对初学者、熟练者及精通者都比较适用。并且很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像
薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。
软件平台
SPSS自SPSS16.0起推出
Linux版本。SPSS最新版本为SPSS 24.0,已支持Windows 8/10、Mac OS X、Linux及
unix。
其他相关
Clementine
SPSS Clementine是ISL(Integral Solutions Limited)公司开发的数据挖掘工具平台。1999年SPSS公司收购了ISL公司,对Clementine产品进行重新整合和开发,Clementine已经成为SPSS公司的又一亮点。
作为一个
数据挖掘平台,Clementine结合商业技术可以快速建立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。强大的数据挖掘功能和显著的
投资报酬率使得Clementine在业界久负盛誉。同那些仅仅着重于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据挖掘工具相比,Clementine其功能强大的数据挖掘算法,使数据挖掘贯穿业务流程的始终,在缩短投资回报周期的同时极大提高了投资回报率。
广泛分析带来最优结果
为了解决各种商务问题,企业需要以不同的方式来处理各种类型迥异的数据,相异的任务类型和数据类型就要求有不同的分析技术。Clementine为您提供最出色、最广泛的数据挖掘技术,确保您可用最恰当的分析技术来处理相应的问题,从而得到最优的结果以应对随时出现的商业问题。即便改进业务的机会被庞杂的数据表格所掩盖, Clementine也能最大限度地执行标准的
数据挖掘流程,为您找到解决商业问题的最佳答案。
CRISP-DM使数据挖掘成为标准的商业流程
为了推广数据挖掘技术,以解决越来越多的商业问题,
SPSS Clementine和一个从事数据挖掘研究的全球性企业联盟制定了关于数据挖掘技术的行业标准--CRISP-DM(Cross-Industry Standard Process for Data Mining)。与以往仅仅局限在技术层面上的数据挖掘
方法论不同,CRISP-DM把数据挖掘看作一个商业过程,并将其具体的商业目标
映射为数据挖掘目标。一次调查显示,50%以上的
数据挖掘工具采用的都是CRISP-DM的数据挖掘流程,它已经成为事实上的行业标准。
Clementine完全支持CRISP-DM标准,这不但规避了许多常规错误,而且其显著的智能预测模型有助于快速解决出现的问题。
应用模板的结果
在数据挖掘项目中使用Clementine应用模板(CATs)可以获得更优化的结果。应用模板完全遵循CRISP-DM标准,借鉴了大量真实的数据挖掘实践经验,是经过理论和实践证明的有效技术,为项目的正确实施提供了强有力的支撑。Clementine中的应用模板包括:
CRM CAT--针对客户的获取和增长,提高反馈率并减少客户流失;
Web CAT--点击顺序分析和访问行为分析;
犯罪行为 CAT--犯罪分析及其特征描述,确定事故高发区,联合研究相关犯罪行为;
Fraud CAT--发现金融交易和索赔中的欺诈和
异常行为;
Microarray CAT--研究和疾病相关的基因序列并找到治愈手段。
结构方程模型
确定复杂的关系
在
社会科学以及经济、市场、管理等研究领域,有时需要处理多个原因多个结果间的复杂关系,或者会碰到不可直接观测的变量(即潜变量),这些都是传统的统计方法不好解决的问题。二十世纪八十年代以来,结构
方程分析迅速发展,弥补了传统统计方法的不足,成为多元数据分析的重要工具。
简单而言,与传统的回归分析不同,结构方程分析能同时处理多个因变量,并可以比较评价不同因果关系的理论模型。与传统的探索性因子分析不同,在结构方程模型中,我们可以提出一个特定的因子结构,并检验它是否吻合数据。通过结构方程多组分析,我们可了解不同组别(如不同性别)内各变量的关系是否保持不变,各因子的均值是否有显着差异。
国际上关于教育与心理统计的研究取得了快速的发展,结构方程模型可以说是其中发展较快,应用广泛的多元统计分析技术;在商业领域的品牌研究、顾客满意度研究等方向上也得到了广泛的应用。在我国,SEM研究方法还在
管理学、
经济学、医学及社会学研究等领域的应用也得到了快速的发展。
结构方程模型(SEM)是国际管理研究和其他社会科学研究中日益广泛采用的
建模技术,每年的美国管理学会年会上都有专题教学和研讨。SEM越来越成为各类高层次学术刊物、高层次管理研究以及
社会学和经济学等学科研究领域的必备方法。
AMOS软件简介
AMOS是SPSS
统计学软件包中的独立产品,是功能强大的结构
方程(SEM)建模工具,通过对包括回归、因子分析、
相关性分析和
方差分析等传统多元分析方法的扩展,为您的理论研究提供更多的支持。
在AMOS环境下,您可以在直观的路径图下指定、估计、评估以及设定模型,以展示假定的各变量之间的关系,来方便地地建立能真实反应复杂关系的行为态度模型。在AMOS中,任何数值变量,不管是可观测的还是潜在的,都可以用来
建模,预测其它数值变量。AMOS快速创建模型以检验变量之间的相互影响及其原因,由于结构方程模型是一次性地验证复杂的因果关系,用标准方法以及在此基础上扩展的方法进行多元分析,因此比普通最小二乘回归和探索性因子分析更进一步,能获得更精确、丰富的综合分析结果。
使用AMOS直观的拖放式绘图工具,您可以快速地以路径图定制模型而无需编程。在有缺失值的情况下,AMOS使用Full Information Maximum Likelihood方法仍然可以自动计算正确的标准误及适当的
统计量,降低估算值偏差。新版本的AMOS还增加了探索性结果方程模型、辅助多组分析、高级文本输出、扩展的AMOS编程环境等功能。AMOS被广泛地应用于顾客满意度分析等领域。
同类软件