观察性研究的起源可以追溯到经验主义的哲学基础,然而经验主义则强调通过直接观察和体验来获取关于世界的知识。科学观察的历史可以追溯到公元5世纪,当时它从一种日常实践演变成一种认知范畴。经过几个世纪的发展,科学观察者开始发明了各种仪器和技术,使得肉眼看不见的变得可见,短暂的现象变得永久,抽象的概念变得具体。这些工具包括望远镜、显微镜、问卷调查、摄影板以及其他一些旨在扩展和增强感官的巧妙发明,专门用于科学研究。
在不同的观察性研究中,医学里首先要重视的就是常见横断面研究。
横断面研究
在医学研究、流行病学、社会科学和生物学中,横断面研究(也称为横断面分析、横切研究、流行率研究)是一种观察性研究类型,用于在特定时间点分析来自总体或其代表性子集的数据,即横断面数据。
横断面研究也不同于病例对照研究,因为它们旨在提供研究总体的整个数据,而病例对照研究通常只包括已经发展出特定病症的个体,并将其与一般人口中与其匹配的小部分样本进行比较。横断面研究是描述性研究(既不是纵向也不是实验性的)。与病例对照研究不同,它们不仅可以描述比值比,还可以从流行率中描述绝对风险和相对风险。
风险比(Hazard Ratio,HR)主要应用于生存分析中,由 Cox 风险比例模型衍生出来,用于估计因为某种因素的存在导致结局事件风险变化的倍数。
在临床治疗性研究和流行病学队列研究中都有重要价值。例如在肿瘤免疫治疗临床研究中,比较包括新药在内的某种治疗方案与标准治疗方案对于患者的治疗效果,HR 可以体现试验组与对照组相比,发生终点事件(如疾病进展或死亡)的风险的比值。
HR = 1 时,表示该治疗方案的疗效与标准治疗方案的疗效无显著差异;HR > 1(例如 HR = 1.25)且 p 值有显著性时(如 p < 0.05),说明试验组的疗效优于对照组,即试验组发生终点事件的风险低于对照组;HR < 1 时,则表示试验组的疗效不如对照组。
横断面研究是指在一个特定时间点收集数据,以评估急性或慢性病的流行情况或确定医疗干预的效果。这类研究通常采用普查或抽样调查的形式。横断面研究的目标包括:
- 了解现有疾病在不同地域、不同人群和不同时间的流行情况及其相关因素,以确定易感人群。
- 早期发现患者,进行及时治疗,防止疾病进展。
例如,若要测量某一人群中的体重指数(BMI),可以随机抽取2000人进行身高和体重的测量,并计算其中有多少人属于肥胖类别。假设30%的样本被归类为肥胖,这一数据为我们提供了一个该人群在那个时间点上的快照。
横断面研究的优点包括实施简便、能够同时观察多种疾病和风险因素、节省人力和资源。例如常规数据的使用允许进行大规模的横断面研究,几乎不需要花费。这是相对于其他形式的流行病学研究的一个主要优势。有人建议从常规收集数据的廉价横断面研究开始,这些研究提出假设,再进行更具体测试的病例对照研究,最后进行成本更高且耗时更长的队列研究和试验,这些试验可能提供更强的证据。在横断面调查中,特定群体被研究以查看某种活动(例如饮酒)是否与所研究的健康效应(例如肝硬化)有关。如果饮酒与肝硬化相关,这将支持饮酒可能与肝硬化有关的假设。
临床研究的的常见偏倚
然而,该研究也存在一些偏倚,如非响应偏倚、回忆偏倚和测量偏倚。
在临床研究中,偏倚是指系统性的误差,导致结果偏离真实情况。以下是非响应偏倚、回忆偏倚和测量偏倚在临床研究中的例子解释:
非响应偏倚(Non-response Bias)
非响应偏倚是指在调查估计中可能发生的潜在误差,当响应调查的人和不响应调查的人之间存在差异时,就会出现这种偏倚。这是一种选择偏倚,如果处理不当,可能会导致结论不准确。
非响应偏倚指的是在调查中,因为响应者与未响应者在个人特征上存在系统性差异,可能导致调查结果的偏离实际情况。这种偏倚对调查结果的代表性和准确性构成威胁,尤其与年龄较大、男性性别和低教育水平等因素有关。通常情况下,响应者倾向于报告更好的健康状况、较少的风险行为以及更积极的结果,这与未响应者形成对比。为了最大程度地减少非响应偏倚,研究人员应采取措施以提高响应率,例如通过多次联系被调查者、提供激励措施,并确保调查过程的保密性。如果能够准确了解未响应者的特征,可以利用统计技术如加权和插补来调整偏倚,从而更准确地反映整体人群的情况。
例子:在一项调查新药效果的临床试验中,病情较轻的患者可能更愿意参与,而病情较重的患者由于健康状况限制或不愿冒风险而不参与。这可能导致试验结果低估了新药的实际疗效,因为没有纳入病情较重的患者。一般来说,病情较轻的患者通常在新药试验中较为积极,因为他们希望通过新药进一步改善自己的健康状况,并且他们的身体条件允许他们参加试验。相反,病情较重的患者可能面临更多的健康问题或由于疾病的严重程度限制了他们的活动能力,使他们难以参与试验。此外,病情较重的患者和他们的家属可能对新药的潜在风险更加敏感,从而选择不参与试验,以避免可能的不良反应。
这种选择性参与导致了样本中病情较重的患者比例不足,从而使试验结果偏离实际情况。试验结果主要反映了病情较轻患者的反应,而忽略了病情较重患者的反应。由于病情较轻的患者可能对治疗反应更好,这可能导致新药的实际疗效被低估。也就是说,试验结果可能显示新药效果不如实际,因为没有考虑到新药在病情较重患者中的潜在疗效。
回忆偏倚(Recall Bias)
回忆偏倚发生在需要受试者回忆过去事件或经历的研究中。由于人们记忆的选择性或不准确性,回忆的信息可能不准确,从而影响研究结果。
- 记忆错误:受试者可能无法准确记住过去的事件或细节,尤其是时间较久远的事情。
- 选择性记忆:受试者可能更容易记住对自己有利或印象深刻的事件,导致信息失真。
例子:在一项研究中,受试者需要回忆他们过去服用药物的情况。病情较轻的患者可能会忘记他们曾服用过的药物,而病情较重的患者可能会夸大他们服药的频率和剂量。这会导致研究结果偏差,无法准确评估药物的使用情况和效果。
测量偏倚(Measurement Bias)
测量偏倚是指由于测量工具或方法的问题,导致数据系统性误差的偏倚。它可以分为以下几种情况:
- 工具误差:测量仪器不准确或不一致。
- 观察者偏倚:观察者或数据收集者在记录信息时存在主观性或错误。
- 受试者偏倚:受试者由于知道自己在被研究而改变行为(霍桑效应)。
例子:在一项临床研究中,研究人员使用不同品牌的血压计来测量患者的血压。如果这些血压计的校准标准不同,测量结果可能会存在系统性误差,导致研究结果偏差。此外,如果研究人员在测量时没有按照标准操作程序,或在记录数据时出现主观判断错误,这也会引起测量偏倚。
临床研究的常用随机抽样方法
在研究中,选择合适的抽样方法至关重要,以确保样本的代表性和研究结果的可靠性。本文将详细探讨四种常见的概率抽样方法:简单随机抽样、系统抽样、分层抽样和集群抽样,每种方法的适用场景以及临床研究中的实际应用。
简单随机抽样(Simple random sampling)
简单随机抽样是一种基础的抽样方法,其特点是每个样本单位被抽中的概率相等且相互独立。这种方法适用于总体规模不大且特征分布均匀的情况。例如,在一项临床研究中,如果研究人员希望评估一种新药的有效性,可以从总体患者中随机选择一部分进行试验,确保每位患者有平等的机会被选入样本。简单随机抽样操作相对简单,通常通过随机数字表或计算机随机函数实现。尽管简单随机抽样方法容易实施,但如果总体特征差异较大,可能需要考虑其他抽样方法以提高样本的代表性和研究的有效性。
系统抽样(Systematic sampling)
系统抽样是一种按固定间隔选取样本的方法,适用于具有顺序编号的总体。在实际操作中,研究者首先确定总体规模和所需样本量,然后计算出抽样间隔,从一个随机的起始点开始,每隔固定间隔选取一个样本单位。例如,在一项调查中,研究人员希望了解某种疾病在一个地区的分布情况,可以按照街区编号每隔若干个街区选择一家医院或诊所进行调查。系统抽样相对于简单随机抽样,能够更有效地控制样本的分布,从而提高抽样的精度和效率。
分层抽样(Stratified sampling)
分层抽样是将总体按某一特征分成若干相对同质的子群(即分层),然后从每个子群内部进行独立抽样,并将这些样本合并成最终的样本。这种方法能够提高样本的代表性和精度,特别适用于总体内部特征差异较大的情况。例如,在临床研究中,如果研究人员想了解一种治疗方法在不同年龄段患者中的效果,可以先按年龄分层,然后从每个年龄层中随机选择样本。分层抽样不仅能够降低抽样误差,还能够根据不同子群的特点采取不同的抽样比例,提高研究的效率和代表性。
集群抽样(Cluster sampling)
集群抽样是一种将总体划分为若干个内部相对均质但彼此异质的子群(集群),然后从这些集群中随机抽取部分集群作为样本,并对选中的集群内所有单位进行调查或观察的方法。与前面的抽样方法不同,集群抽样的基本单位不是个体,而是自然形成的或人为划分的集群,例如社区、学校或医院。在临床研究中,集群抽样可以用于评估某种疾病在不同地区或不同医院的发病率,通过抽取几个医院作为样本,收集该医院内所有患者的数据进行分析。集群抽样操作相对简单,但由于集群内部单位相关性较高,样本的代表性可能会受到影响,需要采取适当的统计分析方法进行校正,以确保研究结果的准确性和可靠性。