第一部分 笔记和习题详解
第1章 统计和度量的基本概念
1.1 复习笔记
一、统计、科学和观察
在心理学研究当中,研究者通过发问卷、做实验等方式来收集数据,通过分析数据对研究假设进行研究,得到支持研究假设的证据,这其实就是一个统计的过程。统计学包括描述统计、推论统计和多元统计。统计学是心理与行为科学中一个不可或缺的科学工具。统计方法不仅可以帮助研究者有效地获取信息、得出结论,而且可以帮助研究者更好地学习、理解他人的研究,促进学术交流和发展。
二、实验设计和科学方法
(一)实验设计
科学涉及到对不同变量之间关系的探索。在心理学研究中,研究者常常采用以下几种方法来研究变量间的关系:
1.相关研究
相关研究即观察在自然情境中存在的两个变量,是寻求变量之间关系的最简单的方法。相关研究只能够说明两个变量之间的相关程度,却不能提供因果关系的证据。如果想要进一步研究因果关系,则需要进行实验研究。
2.实验研究
实验研究的目的是为了确定两个变量之间的因果关系,即一个变量的变化是不是由另外一个变量的变化引起的。实验研究一般具有两个特征:①研究者需要操纵一个变量,然后观察另外一个变量,看这种操纵是否带来了变化;②要对研究中的其他一些无关变量进行控制,以确保这些变量不会对研究的结果产生影响。
3.准实验研究
准实验研究是介于真实验研究和非实验研究之间的一种研究,它对无关变量的控制好于非实验研究,但它又不没有真实验研究控制得那么充分和严格。在准实验研究中,自变量是一些研究者无法控制的、自然存在的因素,研究者考查已有的各组被试间的差别或在不同时间内采集的数据的差异。
4.非实验研究
非实验研究比准实验研究在控制的严格性上弱一些,一般用于考查自然存在的变量之间的关系,这是一种对现象的描述。常见的方法有观察法、问卷法等。
(二)科学方法
在心理学乃至大部分科学研究中,理论和假设是两个不可或缺的概念。心理学理论是对行为的潜在机制的一系列陈述,它可以用来解释心理学各个领域中的问题。假设是针对每次研究更加具体的一种预测,它会提出不同变量之间可能的关系。事实上,研究就是要来验证某假设正确与否。当研究的结果与其假设相符,那么假设成立,原来的理论得到加强或补充;如果研究的结果与其假设背道而驰,那么假设被推翻,研究者需要将这个新的发现填充到理论中,对理论进行修订,然后从中得到一个新的假设,继续进行研究。
三、心理统计中常用的一些概念和统计符号
(一)总体、样本和随机取样
1.总体
总体是指具有某些共同的、可观测特征的一类事物的全体,构成总体的每个基本单元称为个体。在心理学研究中,总体是特定研究所关注的所有个体的集合,研究者一般根据研究的兴趣和目的规定研究的总体,其特征和范围也随目的和要求的变化而不同。总体既可以是有限的也可以是无限的。
2.样本
样本是从总体中抽取的作为真正的研究对象的一些个体的集合。从总体中抽取的样本有大有小,一般来说要依据研究的目的而定。
3.随机取样
随机取样是指从总体抽取样本的一种策略,要求总体中的每一个个体被抽到的机会均等。只有对总体的分布、特征等有了全面的认识,才可能选取恰当的随机取样方法,保证所抽取的样本在最大可能上具有同总体一致的分布和特征,达到采取随机方法所希望的效果。
(二)描述统计和推论统计
1.描述统计
描述统计是指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达一件事物的性质。描述数据集中趋势的最常用的是求平均值,描述数据的离散情况最常用的是标准差。描述统计常常利用图、表的方式来表示,给研究者一个直观的对数据的整体认识。
2.推论统计
推论统计是指运用一系列的数学方法,将从样本数据中获得的结果推广到样本所在的总体。进行推论统计的关键在于所抽取的样本要能够尽量接近所要研究的总体,能够充分代表总体,使得用样本中的信息来推论总体时产生的误差最小。
(三)参数、统计量和取样误差
1.参数与统计量
参数是描述总体的数值。它既可以从一次测量中获得,也可以从总体的一系列测量中推论得到。统计量是描述样本的数值。它可以从一次测量中获得,或者从样本的一系列测量中推论得到。参数是一个固定的数值,而统计量的值是不定的,它会随着所取的样本而变化。
2.取样误差
取样误差是指样本统计量与相应的总体参数之间的差距。影响取样误差的因素有很多,包括样本容量、总体的变异情况、取样方式等。取样误差是难以完全避免的,研究者要做的就是尽可能减少取样中的误差,并使之保持在研究所允许的范围内。
在心理学研究中,变量的类型通常可以分为离散型变量和连续型变量。
1.离散型变量
离散型变量是由分离的、不可分割的范畴组成,在邻近范畴之间没有值存在。比较有代表性的离散型变量是计数数字。
2.连续型变量
连续型变量指在任何两个观测值之间都存在无限多个可能值,它可以分割成无限多个组成部分。一般来说,一个连续型变量可以用一条连续的实数直线表示,在实数直线上存在着无限的点,在任何两个相邻的点之间依然可以找到无数个点。
(五)变量的测度等级
按照概念被量化的程度,变量的测度等级通常可以分为以下四类:
1.命名测度
命名测度是最低的一种测度等级,由一系列具有不同名称的类型所组成。命名等级的度量对观察所得的数据进行标定并分类,它只包含质性差异,不能提供任何有关量的差异的信息。
2.顺序测度
顺序测度的量化水平高于命名等级,是由一系列按顺序排列的范畴所组成。也就是说,观察得到的结果不但分了类别,而且还是按照一定顺序进行排列的。顺序等级可以提供不同个体之间的顺序差异,然而不能够说明这种差异的程度和大小。
3.等距测度
等距测度是量化水平更高,是由一系列按顺序排列的范畴组成,且每两个邻近范畴之间的距离都相等。等距等级采用一定单位的实际测量值,可以进行加减法运算,但是不能进行乘除法运算。
4.比例测度
比例测度是最高的测度等级,除了具有等距测度的所有特征外,还有绝对零点。比例等级的变量除了可以进行加减运算,还可以进行乘除运算。
(六)常用的基本统计符号