欢迎来到研究方法 2!
哈囉!既然你已经掌握了「研究方法 1」的基础,现在是时候升级了。你可以把研究方法 2 视为心理学的「专业版」。我们将深入探讨心理学家如何确保研究结果的真实性、如何分析复杂的资料,以及如何向世界发表他们的研究成果。
如果一开始看到数学公式或专业术语觉得有点压力,别担心,我们会把它们拆解成容易消化的小单元,并搭配丰富的生活案例!
1. 信度与效度
在心理学中,我们需要知道我们用的「尺」(即测试或实验工具)是否真的准确。我们透过信度 (Reliability) 和效度 (Validity) 来进行评估。
信度:一致性
信度指的就是一致性 (Consistency)。如果你站上体重计显示 60kg,走下来再站上去却显示 75kg,那么这个体重计就是不可信的。在心理学中,如果一个研究每次重复进行都能得到相同的结果,我们就称它具有信度。
如何检验信度:
- 重测信度 (Test-retest): 让同一人在不同时间点进行同一项测试。如果分数相近,代表该测试具有信度。
- 观察者间信度 (Inter-observer reliability): 让两位不同的研究者观察同一种行为。如果他们的纪录一致(例如:两人都同意该名儿童表现出「攻击性」),则该研究具有信度。
效度:准确性
效度指的是真实性 (Truth) 或准确性 (Accuracy)。测试是否真的测量了它声称要测量的东西?如果我试图透过测量你的大拇指长度来衡量你的智商,我的「测试」虽然具有信度(你的拇指长度不会变),但它并不具备效度(因为拇指大小与 IQ 完全无关!)。
效度的类型:
- 内部效度 (Internal Validity): 自变量 (Independent Variable) 是否真的导致了因变量 (Dependent Variable) 的变化?还是有其他因素(外在变量)干扰了结果?
- 外部效度 (External Validity): 研究结果能否推广到其他情境?
- 生态效度 (Ecological Validity): 是否适用于现实生活?(还是实验室环境太过刻意?)
- 时间效度 (Temporal Validity): 1950 年代的研究结果在今天是否依然适用?
小测验: 想象一个飞镖靶。如果你的飞镖全都射在同一个点上,但却不是红心,代表你有信度但无效度。如果全都命中红心,则代表你两者兼具!
重点总结: 信度 = 一致性。效度 = 准确性/真实性。
2. 个案研究与内容分析
有时候,实验并不是最佳的研究方法,我们需要更深入的观察。
个案研究 (Case Studies)
个案研究是对单一个人、团体或事件进行深入调查。心理学家很喜欢用它来研究罕见案例。
例子:研究患有特定脑损伤的患者(如 HM)以了解记忆运作机制。
优点: 提供丰富的质性资料 (Qualitative data),且能研究那些在实验中进行「诱发」会违反伦理的现象。
缺点: 很难将单一个人的结果推广到全世界。
内容分析 (Content Analysis)
这是一种将质性资料(文字、影像)转化为量化资料(数字)的方法。
例子:计算电视广告中,男性与女性担任领导角色的次数。
执行步骤:
- 确定样本(例如:50 则电视广告)。
- 建立编码类别 (Coding categories)(例如:「发号施令」、「打扫」、「烹饪」)。
- 观看广告,并统计每个类别出现的次数。
重点总结: 个案研究是对个人的深度挖掘;内容分析是将媒体/文字转化为可统计的资料。
3. 科学的特征
心理学希望被视为一门「硬科学」(如物理或生物学)。要做到这一点,它必须遵循某些规则:
- 客观性 (Objectivity): 研究者不应让个人情感或偏见影响资料。只看事实!
- 实证性 (Empiricism): 知识应来自直接观察与经验,而不仅仅是「空想」。
- 可重复性 (Replicability): 其他科学家应该能够重复你的研究并得到同样的结果。这就是为什么我们需要撰写清晰的「方法」章节。
- 可证伪性 (Falsifiability): 一个理论如果无法证明其错误,就不是科学。
类比:如果我说「我的房间里有一只看不见的小独角兽,只要有人试图探测它,它就会消失」,这就是不可证伪的,因为你无法证明我是错的。因此,这不是科学!
- 范式 (Paradigms): 一套共享的假设或方法(例如:「认知革命」改变了我们研究心理的范式)。
重点总结: 科学的核心在于客观、可重复,且能被证伪。
4. 推论统计:数学的部分
别惊慌!通常你不需要亲手进行大规模计算,但你必须理解我们为什么要使用这些检验。
为什么要使用检验?
我们使用推论统计来检视结果是由实验所致,还是仅仅出于偶然 (Chance)(运气)。我们会关注显著性水平 (Significance level),通常写作 \(p \leq 0.05\)。
\(p \leq 0.05\) 代表什么? 这意味着结果纯属偶然发生的概率仅为 5%(或更低)。如果 \(p\) 值小于 0.05,我们就称研究结果具有统计显著性 (Statistically significant)!
测量尺度 (Levels of Measurement)
在选择统计检验前,你需要知道资料属于哪种类型。请记住 **NOIR** 这个缩写:
- 类别变量 (Nominal): 分类资料(例如:是/否、蓝眼/棕眼)。
- 顺序变量 (Ordinal): 可以排序,但各点之间距离不相等的资料(例如:比赛的第 1、2、3 名)。
- 等距变量 (Interval): 以相等单位测量的刻度资料(例如:摄氏温度)。
- 比率变量 (Ratio): 与等距相同,但具有真实零点(例如:身高或体重)。
选择正确的检验
选择检验时,请自问:
1. 我是在寻找差异 (Difference) 还是相关性 (Correlation)?
2. 我使用了什么实验设计(重复测量还是独立组别)?
3. 我的资料属于什么测量尺度(类别、顺序还是等距/比率)?
符号检验 (Sign Test): 这是 AS Level 必须掌握的具体计算。当资料为类别变量且使用重复测量设计时使用。你只需计算正号 (+) 和负号 (-) 的数量,并找出「S」值(出现频率较低的那个符号)。
第一型与第二型错误
有时候,科学家也会出错。
- 第一型错误 (Type I Error): 「伪阳性」。你以为发现了显著结果,但其实只是运气。即:不该接受实验假设却接受了。
- 第二型错误 (Type II Error): 「伪阴性」。你以为没有效果,但事实上确实有影响。即:不该拒绝实验假设却拒绝了。
重点总结: 我们使用统计来证明结果不只是运气。目标是达到 \(p \leq 0.05\)!
5. 心理学研究报告的撰写
心理学家完成研究后,会按照特定格式撰写报告,以便他人阅读。这就像科学的食谱。
- 摘要 (Abstract): 整个研究的简短概述(150-200 字)。
- 绪论 (Introduction): 为什么要进行研究以及之前的相关研究结论。
- 方法 (Method): 研究如何执行(必须详尽到足以让他人重复)。包含设计、受试者、仪器与程序。
- 结果 (Results): 数字、表格与图表。
- 讨论 (Discussion): 结果的含义,以及如何与绪论连结。
- 参考文献 (References): 对其他研究者的引用致意。
常见错误: 不要混淆「结果」与「讨论」章节。结果只是事实与数字;讨论则是解释这些数字对人类有什么实际意义。
重点总结: 科学报告是一种标准化方式,用以清晰、专业地分享研究发现。
最终鼓励
你已经度过了研究方法中最困难的部分!请记住,这些工具——信度、效度与统计学——正是将简单的观察转化为重大科学发现的关键。请持续练习辨识「测量尺度」(NOIR),剩下的内容就会水到渠成。你绝对没问题的!