Research methods 2 - Psychology (9685) - Oxford AQA International AS Level

欢迎来到研究方法 2！

哈囉！既然你已经掌握了「研究方法 1」的基础，现在是时候升级了。你可以把研究方法 2 视为心理学的「专业版」。我们将深入探讨心理学家如何确保研究结果的真实性、如何分析复杂的资料，以及如何向世界发表他们的研究成果。

如果一开始看到数学公式或专业术语觉得有点压力，别担心，我们会把它们拆解成容易消化的小单元，并搭配丰富的生活案例！

1. 信度与效度

在心理学中，我们需要知道我们用的「尺」（即测试或实验工具）是否真的准确。我们透过信度 (Reliability) 和效度 (Validity) 来进行评估。

信度：一致性

信度指的就是一致性 (Consistency)。如果你站上体重计显示 60kg，走下来再站上去却显示 75kg，那么这个体重计就是不可信的。在心理学中，如果一个研究每次重复进行都能得到相同的结果，我们就称它具有信度。

如何检验信度：

重测信度 (Test-retest)： 让同一人在不同时间点进行同一项测试。如果分数相近，代表该测试具有信度。
观察者间信度 (Inter-observer reliability)： 让两位不同的研究者观察同一种行为。如果他们的纪录一致（例如：两人都同意该名儿童表现出「攻击性」），则该研究具有信度。

效度：准确性

效度指的是真实性 (Truth) 或准确性 (Accuracy)。测试是否真的测量了它声称要测量的东西？如果我试图透过测量你的大拇指长度来衡量你的智商，我的「测试」虽然具有信度（你的拇指长度不会变），但它并不具备效度（因为拇指大小与 IQ 完全无关！）。

效度的类型：

内部效度 (Internal Validity)： 自变量 (Independent Variable) 是否真的导致了因变量 (Dependent Variable) 的变化？还是有其他因素（外在变量）干扰了结果？
外部效度 (External Validity)： 研究结果能否推广到其他情境？
- 生态效度 (Ecological Validity)： 是否适用于现实生活？（还是实验室环境太过刻意？）
- 时间效度 (Temporal Validity)： 1950 年代的研究结果在今天是否依然适用？

小测验： 想象一个飞镖靶。如果你的飞镖全都射在同一个点上，但却不是红心，代表你有信度但无效度。如果全都命中红心，则代表你两者兼具！

重点总结： 信度 = 一致性。效度 = 准确性/真实性。

2. 个案研究与内容分析

有时候，实验并不是最佳的研究方法，我们需要更深入的观察。

个案研究 (Case Studies)

个案研究是对单一个人、团体或事件进行深入调查。心理学家很喜欢用它来研究罕见案例。
例子：研究患有特定脑损伤的患者（如 HM）以了解记忆运作机制。

优点： 提供丰富的质性资料 (Qualitative data)，且能研究那些在实验中进行「诱发」会违反伦理的现象。
缺点： 很难将单一个人的结果推广到全世界。

内容分析 (Content Analysis)

这是一种将质性资料（文字、影像）转化为量化资料（数字）的方法。
例子：计算电视广告中，男性与女性担任领导角色的次数。

执行步骤：

确定样本（例如：50 则电视广告）。
建立编码类别 (Coding categories)（例如：「发号施令」、「打扫」、「烹饪」）。
观看广告，并统计每个类别出现的次数。

重点总结： 个案研究是对个人的深度挖掘；内容分析是将媒体/文字转化为可统计的资料。

3. 科学的特征

心理学希望被视为一门「硬科学」（如物理或生物学）。要做到这一点，它必须遵循某些规则：

客观性 (Objectivity)： 研究者不应让个人情感或偏见影响资料。只看事实！
实证性 (Empiricism)： 知识应来自直接观察与经验，而不仅仅是「空想」。
可重复性 (Replicability)： 其他科学家应该能够重复你的研究并得到同样的结果。这就是为什么我们需要撰写清晰的「方法」章节。
可证伪性 (Falsifiability)： 一个理论如果无法证明其错误，就不是科学。
类比：如果我说「我的房间里有一只看不见的小独角兽，只要有人试图探测它，它就会消失」，这就是不可证伪的，因为你无法证明我是错的。因此，这不是科学！
范式 (Paradigms)： 一套共享的假设或方法（例如：「认知革命」改变了我们研究心理的范式）。

重点总结： 科学的核心在于客观、可重复，且能被证伪。

4. 推论统计：数学的部分

别惊慌！通常你不需要亲手进行大规模计算，但你必须理解我们为什么要使用这些检验。

为什么要使用检验？

我们使用推论统计来检视结果是由实验所致，还是仅仅出于偶然 (Chance)（运气）。我们会关注显著性水平 (Significance level)，通常写作 \(p \leq 0.05\)。

\(p \leq 0.05\) 代表什么？ 这意味着结果纯属偶然发生的概率仅为 5%（或更低）。如果 \(p\) 值小于 0.05，我们就称研究结果具有统计显著性 (Statistically significant)！

测量尺度 (Levels of Measurement)

在选择统计检验前，你需要知道资料属于哪种类型。请记住 **NOIR** 这个缩写：

类别变量 (Nominal)： 分类资料（例如：是/否、蓝眼/棕眼）。
顺序变量 (Ordinal)： 可以排序，但各点之间距离不相等的资料（例如：比赛的第 1、2、3 名）。
等距变量 (Interval)： 以相等单位测量的刻度资料（例如：摄氏温度）。
比率变量 (Ratio)： 与等距相同，但具有真实零点（例如：身高或体重）。

选择正确的检验

选择检验时，请自问：
1. 我是在寻找差异 (Difference) 还是相关性 (Correlation)？
2. 我使用了什么实验设计（重复测量还是独立组别）？
3. 我的资料属于什么测量尺度（类别、顺序还是等距/比率）？

符号检验 (Sign Test)： 这是 AS Level 必须掌握的具体计算。当资料为类别变量且使用重复测量设计时使用。你只需计算正号 (+) 和负号 (-) 的数量，并找出「S」值（出现频率较低的那个符号）。

第一型与第二型错误

有时候，科学家也会出错。

第一型错误 (Type I Error)： 「伪阳性」。你以为发现了显著结果，但其实只是运气。即：不该接受实验假设却接受了。
第二型错误 (Type II Error)： 「伪阴性」。你以为没有效果，但事实上确实有影响。即：不该拒绝实验假设却拒绝了。

重点总结： 我们使用统计来证明结果不只是运气。目标是达到 \(p \leq 0.05\)！

5. 心理学研究报告的撰写

心理学家完成研究后，会按照特定格式撰写报告，以便他人阅读。这就像科学的食谱。

摘要 (Abstract)： 整个研究的简短概述（150-200 字）。
绪论 (Introduction)： 为什么要进行研究以及之前的相关研究结论。
方法 (Method)： 研究如何执行（必须详尽到足以让他人重复）。包含设计、受试者、仪器与程序。
结果 (Results)： 数字、表格与图表。
讨论 (Discussion)： 结果的含义，以及如何与绪论连结。
参考文献 (References)： 对其他研究者的引用致意。

常见错误： 不要混淆「结果」与「讨论」章节。结果只是事实与数字；讨论则是解释这些数字对人类有什么实际意义。

重点总结： 科学报告是一种标准化方式，用以清晰、专业地分享研究发现。

最终鼓励

你已经度过了研究方法中最困难的部分！请记住，这些工具——信度、效度与统计学——正是将简单的观察转化为重大科学发现的关键。请持续练习辨识「测量尺度」(NOIR)，剩下的内容就会水到渠成。你绝对没问题的！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。