《用EXCEL和SPSS学统计》
《用EXCEL和SPSS学统计》
这学期有门课叫数据模型建立和分析,课时数被压缩得很少,只有36学时,可它包含的内容很多。至少有统计学这门课程中的很多内容。
因为老师布置的作业作不出来,就在网上找了一些统计学方面的资料。没想到,没想到,找到的资料最好最系统最多样最精细的是来自一些大学网站。都是一 些大学为申报全国精品课程而建立的网站,里面能找到教材的WORD全稿、教师的全部PPT、课后作业及答案、上机操作指南、参考资料和论文、所用软件、甚 至一些上课视频等等。
真没想到网上有这样的好东西。
下面是一本书《用EXCEL和SPSS学习统计学》中的一章中的内容,来源是
http://stat.cufe.edu.cn/stat/shjzhd/shjzhd2.htm
我把整本书都下载下来,整理为WORD上传到网上,整本书的下载地址是:
http://blog.cersp.com/UploadFiles/2007-10/1031799056.doc
1.1 Excel的主要统计功能及其不足
1.2 常用统计软件简介
1.3 使用统计软件学习统计学的几点建议
1.1 Excel 的主要统计功能及其不足
Excel的基本功能中包括了比较强大的数据处理功能,还提供了丰富的工作表函数,可以完成很多类型的数据处理和分析任务。除了工作表函数以外,Excel还提供了一个称为“分析工具库”的加载宏。
1.1.1 Excel分析工具库的安装和调用
安装分析工具库可以采用以下三种方式。
1、在Office的默认安装中分析工具库并没有安装到你的计算机中,第一次使用“分析工具库”时需要从安装盘安装。操作步骤是:单击“工具”菜单中的“加载宏”命令,在弹出的“加载宏”对话框中选择“分析工具库”,单击“确定”按钮(如图1-1所示),此时系统要求插入Office安装盘,安装完成后,在“工具”菜单就多出了一个“数据分析”命令(图1-2)。“数据分析”模块提供了对数据进行描述统计、假设检验、相关和回归分析、方差分析等分析工具。我们在以后的章节中将会逐步讲解这些方法。
图1-1 加载分析工具库的界面
图1-2 加载分析工具库后的菜单
top↑
2、如果希望在第一次安装Office时就安装“分析工具库”,则需要在安装Office时选择自定义安装,再选中“选择应用程序的高级自定义”选择框,选择“下一步”,会弹出一个对话框,在Excel的加载宏中把“分析工具库”的安装方式改为“从本机运行”(图1-3)。
图1-3 自定义安装“分析工具库”的界面
3、如果你需要在一台没有安装该模块的电脑上临时使用“分析工具库”,也可以采用以下方法:在安装了“分析工具库”的电脑中找到一个名为“Analysis”的文件夹(一般情况下路径为“C:/Program Files/Microsoft Office/OFFICE11/Library/Analysis”),把这个文件夹复制到U盘上。需要使用“分析工具库”时双击运行文件夹中的ANALYS32.XLL就可以了(如果系统弹出一个安全警告的对话框,单击“启用宏”)。
要卸载分析工具库只需要在图1-1中取消选定“分析工具库”,否则每次启动Excel时这一模块都会自动加载。
1.1.2 Excel是一个适当统计软件吗?
由于Excel应用的普及性,许多人都把它作为最常用的统计软件来使用。Excel提供的统计功能包括数据管理、描述统计、概率计算、假设检验、方差分析和回归分析等等,对于统计学原理所涉及的大部分内容已经足够了。然而,在学习Excel的统计功能以前我们有必要先交待一下Excel在统计分析方面的局限性。下面是在网络、杂志和个人经验中发现的一些值得注意的方面:
1、就统计学原理所涉及的统计方法而言,Excel没有直接提供的方法包括:箱线图(Boxplot)、茎叶图、相关系数的p-值、无交互作用可重复的双因素方差分析、方差分析中的多重比较、非参数检验方法、质量控制图等。
2、按照优秀图形的标准,Excel做出的很多图形都不合格。Excel的有些图形可能适合于普通大众,但不适合用于科学报告中。例如二维图形的三维表示,圆柱图,圆锥图等等。Excel提供的有些图形可能永远不应该使用。
3、Excel不能很好的处理缺失值(Missing data)问题。总体来说Excel对缺失值的处理方式远不如专门的统计软件恰当。
4、虽然大部分情况下Excel的计算结果都是可靠的,但在一些极端情况下Excel的计算程序不够稳定和准确(特别是Excel2003以前的版本中);有些自动功能可能会导致意想不到地结果。关于这一方面的内容我们在后面的章节中还会提及,在这里只举两个例子使你有一点直观的印象。
练习1:如果自己计算,你认为“-5^ 2 ” 等于多少?在Excel工作表的单元格中输入“=-5^ 2 ” 得到的答案是多少?
练习2:在区域B1:B3中分别输入数字10、20、30;然后在B5中输入公式“=sum(b1:b3)”。这时B5的值等于多少?现在再在B4中输入40,B5的值有什么变化?
在第一个练习中Excel 2003得出的结果是25,这至少与通行的数学规则不一致。在第二个练习中Excel会自动将B5的公式改为“=sum(b1:b4)”。但这种自动功能有时候并不是我们想要的。在我们不知情的情况下对公式的修改将会直接导致计算结果的错误。
总体来说,Excel为我们输入和管理数据、描述数据特征、制作统计表和统计图都提供了强大的支持,但在处理复杂的计算时有时候误差相对较大,因而一些数据处理专家建议人们避免采用Excel处理复杂的统计问题。
top↑
1.2 常用统计软件简介
常用的统计分析软件包括SAS、SPSS、S-plus、Stata、Minitab等等。这些软件都能完成常用的统计方法,如描述统计、回归分析、生存分析、方差分析、多元分析等等,但不同的软件在功能、易用性、扩展性等方面又各具特色,下面我们分别加以简要介绍。
1、SAS
SAS过去是“Statistical Analysis System”的简称,由于其功能现已远远超出了统计分析的范围,“SAS”已经变成了一个单纯的商标。其强大的功能和可编程性使其成为一些超级用户的首选。
SAS软件的主要特点包括:可以同时处理多个数据集;有很多模块、功能非常全面;虽然也提供了许多菜单操作方式,但仍以编程为主,学习起来有一定困难,是最难掌握的统计软件之一。
SAS的绘图功能可能是所有的统计软件中最强大的,但同时也是最难掌握的:虽然SAS也提供了一些交互式的制图界面,但与其他软件相比还不够方便。
2、SPSS
SPSS过去是“Statistical Package for Social Sciences”的简称,它也是最早的统计软件之一。许多初学者都喜欢使用SPSS,因为它非常容易使用(以及误用):用鼠标点击下拉菜单中的命令就能完成分析工作。当然,SPSS也提供了编程的操作方式。
SPSS的数据编辑窗口与Excel类似,并且可以自己定义数据的属性(数值标签、数据类型等等),最多允许有4096个变量。但其数据管理功能相对较弱,一个SPSS过程只允许同时打开一个数据文件,这对于有些分析工作来说可能不够方便。SPSS是一个模块式的软件,可以根据需要选择购买不同的功能模块。SPSS在方差分析和多元统计分析方面的功能比较突出。
SPSS也有强大的图形功能,可以做出高质量的图形,并且可以比较方便的进行编辑。
3、S-Plus
许多人认为S-Plus是介于SAS和SPSS之间的一个软件,它也可以完成绝大部分统计分析,具有菜单式的操作界面,同时提供了强大的编程语言。你可以很容易地把自己编写的函数集成到S-Plus中去。S-Plus的绘图能力特别出色,灵活性强。
4、R
R是一套很像S-Plus的免费统计软件,其语法与图形功能几乎跟S-Plus一模一样,大多数的S-Plus程序也可在R上面顺利执行。R可以在R project的网页免费取得,不足之处是没有实现菜单式的图形用户界面,对于初学者来说学习起来较为困难。
5、Stata
经济学和社会科学领域的许多学者喜欢使用Stata软件。这一软件也有菜单式的操作界面,同时提供了强大的编程能力,易学易用,扩展性强,更新速度快,很容易将自己编写或者网上下载的程序加入到软件中。
Stata的回归分析和回归诊断部分功能非常强大,几乎能估计统计学和计量经济学中的所有回归模型,而在多元统计分析方面的功能稍弱。Stata可以用菜单或程序做出高质量的图形,但完成后的图形不能再进行编辑。
6、Minitab
Minitab也是一个简单易学的统计软件,其统计功能和图形功能都比较全面,在统计学的教学中应用广泛。这一软件突出特色是提供的质量改进分析工具非常全面易用。
top↑
1.3 使用统计软件学习统计学的几点建议
每个软件都有自己的优势和劣势。就统计学原理涉及的统计方法而言几乎所有的统计软件都可以胜任,但对于一些具体的实际问题可能有的软件会比其它软件更适合。例如,在进行一些多元统计分析时你可能会选择SAS,处理抽样调查数据可能会选择Stata,做方差分析可能会选择SPSS,进行质量改进统计分析可能会选择Minitab,希望进行统计应用开发时可能会选择SAS或S-plus。因此,如果你需要经常进行统计分析,我们的建议是你把这些软件都纳入到你的工具箱中。
作为入门的软件,易学易用的SPSS或者Minitab可能是较好的选择,一开始就学习复杂的统计软件可能令人沮丧。
Excel为我们处理数据和对数据进行初步的分析提供了良好的条件,但Excel至少在2003以前版本的部分统计函数中有一些缺陷,而且Excel的统计功能有限,如果你正进行的分析工作牵涉到重大的决策、对计算结果的准确性有很高的要求,我们建议你采用专门的统计软件。许多用户(包括作者)喜欢用Excel准备数据,然后用专门的统计软件进行统计分析,有时候还会把结果转回Excel中作图。
1、如果你要做统计分析的话,一定要正确的去做!使用Excel以及其它统计软件获得一些分析结果易如反掌,但要获得正确的答案并不容易,这要求你对相应的统计方法有透彻的理解。
2、在开始学习一种统计方法时,不要试图立即搞清楚软件的全部输出结果。即使你只希望计算一下数据的平均值,统计软件也可能有数页的输出结果:搞清楚所有输出结果的努力可能使你很沮丧,因为有些内容可能已经大大超出了你的学科范围。
3、不要试图使用你还不理解的统计方法,这很容易导致统计方法的误用;但要勇于学习新的方法,新的方法可能更适合你所研究的问题。
4、不要不加分析的把软件的全部输出结果直接复制到分析报告中,这只能说明你并没有真正理解软件的输出结果。可能对你研究的问题而言软件的大部分输出都是不必要的。此外,软件生成的图表往往也需要进行一些编辑工作才能使用。
5、学习统计软件的最好方法是在应用中学习。
6、软件的帮助文件可能是软件最好的使用说明书,许多软件还附有简明的例子。
7 、“ Garbage in , garbage out ”: 如果你输入的是垃圾,得到的也只能是垃圾。 你要反复检查数据的准确性,任何软件都不可能基于错误的数据得出可靠的结论。本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!