编者按:
做科学研究,首先要学习做研究工作的方法。所谓 “工欲善,必先利其器”,这句话就是讲改进和完善自己工作方法的重要性。
作者蒋百川博士后期间,因教授Flom “世界上有多少事没人做过,你做得过来吗?这不能成为你要做这个研究的理由”的反问,开始认识到学习 “研究方法” 的重要性。之后蒋百川进行了相关课程的学习,并在实践中不断改进,逐步掌握了这方面的知识。2013年他退休后开始陆续撰文分享积累的经验、心得体会,并汇聚成一本《科学研究的方法》。《知识分子》获作者授权,将陆续为大家分享书中内容,此为该系列的第三篇。
撰文 | 蒋百川(美国诺瓦东南大学教授)
在这一部分,要讲述实验的设计方法。由于研究领域的不同,做实验的方法也不一样,所以不像阅读文献、综述写作一样有比较共通的方法和规律可循,也不象在学术会议作报告及写作科技论文那样有比较刻板的模式。基于我本人专业的关系,这里介绍的方法主要用于医学研究。对于其他领域,或许有参考价值,或许没有,取决于你的具体问题。
1.研究设计的含义和作用
在知道了想研究什么(what)以后,下一步是如何来(how)得到研究问题的答案。
传统的研究设计是一份详细的工作计划:选择可以测量的变量,决定所需的样本大小,数据的收集(实验设计)、统计分析,以及结论。研究设计是为了保证研究程序是妥适的,可以得到确实的(valid)、客观的(objective)、精确的(accurate)关于所研究的问题的答案。
2.在研究设计中对外部变量的考虑
一般的医学研究(或某些其他研究)都是为了寻找一个原因。例如某种疾病的原因,某种药物的疗效。在上述第一种情况,产生疾病的原因就是自变量,而疾病则是因变量;在第二种情况,某药物是自变量,而疗效则是因变量。但是研究工作不会是那样地简单,因为在寻找这种自变量与因变量的关系时,还参杂着许多外部变量 (如下图的一个例子所示)。所以设计实验时,首先必须清醒意识到有哪些外部变量,再采取如下的措施,或者排除、或者控制、或者包括进测量中。
措施一:保证外部变量对于对照组和实验组有相同的影响。
这里先提到一下对照组,下面还会详细讲。
(1)随机化-保证两组在各项外部变量方面是有可比性的。
(2)匹配-这是另一种保证两组有可比性的方式。
措施二:减少外部变量。
有时候可将外部变量作为一个因素考虑在实验条件内,或者消除这个外部变量对结果的影响。
(1)将外部变量包括在实验设计中。例如,要研究儿童健康服务对儿童死亡率的影响,由于儿童营养供给对婴儿死亡率也有很大影响,所以设计了2X2 因子的研究。在这样设计中,既可以研究外部变量单独的,以及与自变量联合的对因変量的影响。
(2)消除外部变量。例如文化背景可能对健康(因变量)有很大影响,可选择有相同文化背景的受试者,使问题简化。
3.不同的研究设计
若以实验者接触受试对象的次数分类,可有:
(1) 一次: 横向研究 (cross-sectional study);
(2) 二次: 前后对照(before-after study);
(3) 三次或以上: 纵向研究(longitudinal study)。
若以研究所选择的参照时间分类,可有:
(1) 回顾性(retrospective study);
(2) 前瞻性(prospective study) ;
(3) 回顾-前瞻 (retrospective-prospective study)。
若以研究性质分类,可有:
(1) 实验性 (experimental study);
(2) 非实验性(non-experimental study);
(3) 半实验性(semi-experimental study) 。
此外还有根据实验者(主要是收集数据的人员)以及实验对象对于实验情况(实验的因変量,如在药物疗效的实验中对于服用药物还是安慰剂的了解程度),可分为:
(1) 单盲研究(实验对象或受试者不了解以上情况);
(2) 双盲研究(实验对象及上述的实验者均不了解以上情况)。
现将几种主要方式再详细介绍如下:
(1) 一次:橫向研究(cross-sectional study)
用于发现人群中某个现象、情形、问题、态度等的分布情况。横向研究适合描述变量和它们分布模式的研究目的。也可以用于检查自变量(predictor)和因变量(outcome)之间的相关性。
研究者若根据横向研究的结果来讨论自变量与因变量的因果关系,往往会犯错误。例如在有一次国际会议上,新加坡一位资深同行根据儿童IQ与近视程度的相关性,下结论说IQ高的儿童因为书读得多所以容易近视。她讲完后,我上去质疑,我说IQ高的儿童,聪明,所以往往可以不读书就考第一,你如何证明IQ高的儿童一定读书多?说得满堂大笑。这里她至少犯了两个错误,一是这样一个横向研究结果,仅说明两件事情的相关性,无法证明它们有因果关系;二是她在IQ及近视眼外,又引入了另一个变量,即读书时间,并且不加证明地将读书多与IQ划上等号。这是搞科研工作不严谨的表现。
横向研究的设计步骤约为:
(1)确定研究问题;
(2)受试对象的取舍标准及取样方法,得到样本(sample);
(3)在这个取样样本中,需要观察或测量哪方面的数据,再将数据分解为下图中的四块;
(4)确立测量方法。
样本的确定是研究设计的重要一步。如果实验对象太少,实验结果出来后会发现无法得出需要的统计结果;如果太多,则无疑增加实验成本,浪费人力物力。样本数的估算需要使用统计方法和公式,特别是要知道(或估计)你的测量误差,所以要作预实验。详细的计算样本大小的公式可在统计学书籍或相关程序中找到。
§ 橫向研究的优缺点
优点:一次性测量,快速、省钱,它的结果可以提示流行程度。这个方法可以作为纵向研究的第一步,测量结果可以作为被试对象的基线(baseline),并揭示横向的变量的相关性。
缺点:从所收集的数据中,无法得出因果关系。对于少见病的研究,这种方法在一般人群中取样便不现实。但可以在有疾病的人群中取样。例如在1000位有AIDS的病人中,727人有同性恋性行为,236人有吸毒行为,于是甚至不必有对照组,可以认为这两件事对于AIDS的发病率是有高度危险的。
(2)二次: 前后对照研究 (before – after study)
优点:这是两组横向研究的数据。对于相同实验对象,可以发现在某种干预之下,他们的某个(些)变量发生的变化。
缺点:
(1) 要做二次实验,需相对长的研究时间;
(2)受试者在第二次测量时可能丢失;
(3)测量的是总的变化,不能把因变量和外部变量的 因素分离开来;
(4)时间可能改变受试者的某些条件;
(5)受试者的学习,称之为反应性效应(reactive effect);
(6)回归效应(regression effect)。在第一次测量时作极端反应的受试者在第二次测量时会作趋向中间位置的反应 。
(3) 纵向研究(longitudinal study or cohort study)
这种研究有两个基本目的。一是描述在一个时间段内某种结果发生的情况;另一是分析危险因子(risk factors)与这些结果之间的关联。这种研究可以是前瞻性,也可以是回顾性的(如果已有数据可以回答研究问题)。
§ 前瞻性的纵向研究:
例如用于分析发病率和相对危险因子。
纵向研究通常是建立因(predictor)和果(outcome)变量之间的时间序列的唯一方法。最近在网上也经常看到关于科学研究中对因果关系的讨论,多数都说得很对。对于经典研究而言,其最终目的是为了发现事物之间的因果关系。我以为最明了简单的表述是借助数学语言,即原因是结果发生的充分必要条件。由于原因的出现,发生了这个结果(充分条件);没有这个原因,便不发生这个结果(必要条件)。同时,从时间序列角度,因必出现在果之前。从医学实验研究角度,没有纵向研究,在研究中没有对照组,是无法确定因果关系的。
研究步骤:
(1)从群体取样;
(2)测量预期变量(危险因子,自变量);
(3)跟踪该群体;
(4)测量结果变量(疾病,因变量)。
优点:
这种研究方法很有利于确定发病情况以及研究潜在的发病原因,因为危险因子是在发病前所测量的。
缺点:
对于发病率很低的疾病的研究,费钱费时。
如果变量之间的相关性是由于混杂变量(confounding variables)的关系,研究结果中发现的相关性可能会误导研究者。
(4)实验性研究的设计及对照组问题
这样一个实验性研究的设计,使得前后的测量数据有可比性。但是仍然不能确定任何(因变量)的变化,是否完全由干预(自变量)引起的。为了克服这个问题,必须引入对照组。
实验组与对照组的设定必须是随机的,并且保证其他外部变量在两组之间无统计差异。
在一项研究工作中,可靠的实验结果是基于缜密的实验设计,所以实验设计是科学研究工作中重要的环节之一。有些学生急于着手实验,没有很好注意这个环节,等到结果做出来以后,发现出了问题,还得从头再来过。
更有人急于求成,违反科学道德,制造数据作假。需知你的工作若要真正有成就,首先是需要经得起同行的重复与认可,一旦作假被戳穿或者有人提出相反的证据,都会对你的学术名誉造成损害。国内目前对这种事情的处理太轻,也是造成某些人胆大妄为的原因。其实这样的事情,还要从中学、大学里学生考试或作业作弊之类事情抓起,在美国新生入学时,便对他们说清楚校规对作弊的处理,即一旦发现,立即开除。