审核:dianqin
在循证医学证据等级中,随机对照试验位于证据等级金字塔的顶端,而观察性研究由于其固有的局限性,位于金字塔的下方。问题来了:观察性临床研究数据如何分析可以提供更高质量的证据呢?
近日,一项发表在《Stroke》[1]上的研究,使用了新的研究方法来分析观察性数据;针对该研究的述评[2],则提出了以观察性研究数据模拟随机对照试验的诸多思考。
链接:
https://www.ahajournals.org/doi/10.1161/STROKEAHA.121.036178?url_ver=Z39.88-2003&rfr_id=ori:rid:crossref.org&rfr_dat=cr_pub%20%200pubmed
链接:
https://www.ahajournals.org/doi/abs/10.1161/STROKEAHA.121.037331
研究背景
几十年来,研究者对在特定患者中,用颈动脉内膜切除术(CEA)治疗无症状颈动脉狭窄的风险和益处的见解一直没有什么进展。两项大型随机对照试验显示CEA在预防同侧卒中的发生方面优于单纯优化的内科管理(药物治疗)。颈动脉支架植入术(CAS)的预后一般比CEA稍差,但在高度筛选的患者进行的试验中,或在有严格认证程序的试验中,似乎与CEA相当或更优。
然而,以上结论已成为过去。那时他汀类药物的益处尚未确定,抗血小板药物的使用频率较低,血压控制目标不那么严格,导致二级预防的绝对事件发生率较高。观察性数据已经表明,与干预试验中的单纯优化的内科管理(药物治疗)相比,近年来无症状颈动脉狭窄患者的同侧卒中发生率大大降低。与此同时,无症状CEA的围手术期事件发生率似乎在下降。
这就提出了一个重要的问题:在单纯优化的内科管理(药物治疗)更加积极、绝对事件发生率更低、手术并发症更少的情况下,对无症状的颈动脉狭窄进行干预是否仍然有益?正在进行的CREST-2试验(无症状颈动脉狭窄的颈动脉血管重建和内科管理)将有助于在未来几年内回答这个问题。与此同时,在《Stroke》上发表的这项研究采用了一种新的方法,并有可能提供一些新的见解。
研究方法
在这项研究中,作者使用了一种新的分析方法,称为模拟目标试验法(emulate a target trial),即用观察性数据来模拟随机对照试验。虽然历史上,使用观察性数据来确定治疗效果的试验结果参差不齐,但模拟目标试验法试图通过更严格地确定对照组中的研究起点(time zero,即何时纳入研究对象并开始进行随访),并使用倾向性评分匹配来减少各组的偏倚,从而至少考虑到非随机对照研究中常见的两个偏倚:永恒时间偏倚(immortal time bias)和混杂偏倚,希望能使因果推断更清晰、潜在偏倚更小。
在之前的研究中,作者就基于退伍军人事务系统的观察性数据,采用这种方法模拟了ACST(无症状颈动脉手术试验),比较了CEA与药物治疗(MT)的疗效。本研究使用相同的方法比较了在无症状颈动脉狭窄患者中颈动脉CAS和MT的疗效。
主要结果
在2005年至2009年期间,有20多万名患者接受了颈动脉成像,其中包括13000多名狭窄度≥70%的患者。使用倾向性评分匹配,构建了一个与接受CAS的患者相似的MT患者样本,结果包括551名CAS患者和2509名MT患者。
患者在最初进行颈动脉成像研究时被随机分配到CAS或MT组,并随访至在4个事件中至少发生了1个事件,这时患者就被剔除出研究,这4个事件包括:(1)发生卒中(主要结果),(2)完成了5年的随访(预先指定的研究期限),(3)治疗状态与分组的治疗策略不一致,或(4)患者退出保险,导致接受的手术不会被记录在数据集中。违背分配策略的患者信息将被视为删失,之后采用逆概率删失加权(inverse probability of censoring weighting,IPCW)的方法弥补删失的影响。
本研究中,IPCW的使用和在RCTs中使用IPCW来弥补删失信息类似(例如,治疗改变或违背分配策略)。研究使用Cox模型来估计IPCW权重,该模型纳入的变量包括基线数据(时间不变)和随时间变化的协变量,以体现基线差异,并预测患者在治疗期间可能会出现状况(例如癌症),这些情况可能使患者违背分配策略。
在模拟目标试验分析中,两组之间的5年卒中风险并无差异:CAS组为6.9%,MT组为7.1%。在另一项分析中,作者报告实际接受CAS的人卒中风险为10.3%,实际接受MT的人卒中风险为6.9%。总的来说,研究发现在这个老年男性群体中,CAS与MT相比没有使患者更加获益。
这项研究是怎么做的,结果可靠吗?
作者在推断CAS与MT的效应时,非常注意尽量降低观察性数据的局限性。最值得注意的是,他们花了很大力气来匹配队列,包括进行详细的病历审查,以确保在狭窄程度和其他一些潜在的重要临床因素上可比。
他们的模拟所依据的目标试验的方案是明确的,包括纳入/排除标准和研究起点,并且他们使用了敏感的算法来确定终点事件。他们对目标试验的模拟是在数据允许的范围内进行的,而且即使有更好的数据,他们的研究设计也已经不需要进行更大的改进了。
然而,尽管他们的分析方法很复杂,也很谨慎,但问题在于是否可能克服观察性数据在因果推断上的根本缺陷。随机对照试验中最关键的因素,随机化和盲法,是最难模拟的。虽然诸如倾向性评分匹配等可用于近似随机化,但并不能避免未测量的混杂因素带来的偏倚。盲法更难,而且往往无法模拟。
此外,本研究使用的数据不具备观察性数据的典型优势,即纳入大量一般人群。CAS患者是经过高度筛选的。此外,由于在该样本中很少有患者接受了CAS,CAS患者的数量也很少,因此很难由未观察到组间显著性差异得出强有力的结论,不过,在报告的CIs中,有与有意义的临床益处和有意义的损害相一致的结果。
如何看待这些结果?
撇开局限性不谈,如果从表面上看这些结果,与作者先前的研究结果一样,主张对无症状的颈动脉狭窄进行单纯优化的内科管理(药物治疗),或选择CEA/CAS。那么,就出现了两个问题。首先,对这些结果应给予多大的重视?第二,需要多强的证据来改变临床实践和指南?
对第一个问题的回答取决于对目标试验方法的评估,以及它在这个试验中的结果。虽然方法学相对较新,但早期的评估表明,目标试验法在某些情况下与随机对照试验的结果非常接近。无症状颈动脉狭窄的风险预测具有挑战性,而且现实世界的治疗决定可能是相当随意的,因此具有实质性的随机性,这一事实表明,该方法在这种临床情况下可能表现良好。
第二个问题,需要什么标准的证据来改变临床实践。伦理原则认为,在让病人接受外科手术之前,需要有强有力的证据证明好处大于风险。在颈动脉狭窄的病例中,多项对照试验建立了一个相当稳健的证据基础,支持对患者进行干预。
然而,需要什么标准的证据来推翻这一判断?是需要类似的强有力的证据,还是在不确定的情况下,应该倾向于对患者没有造成任何损害的办法?最后,这个问题可能需要进行学术讨论,因为即使有稳健的试验证据,改变医疗实践也是一个挑战,所以该研究似乎不太可能改变根深蒂固的临床实践模式。
对未来的思考
在未来几年里,关于证据标准的问题可能会变得越来越重要。随机对照试验不仅成本高、速度慢,而且在许多情况下是不可行的,即使对于重要的问题也是如此。如果《Stroke》上发表的这项研究用的目标试验方法被证明可以准确地预测各种临床情况下的治疗效果,那么该方法在未来几年里对推动临床决策的改变将会变得越来越重要。
最后,《Stroke》上发表的这项研究用了一种有希望的新的分析方法,非常谨慎地将观察性数据的局限性降到最低,并对将单纯优化的内科管理(药物治疗)作为无症状颈动脉狭窄患者的首选方法进行了适度支持。
尽管模拟目标试验是一种好方法,而且作者分析时也很谨慎,但观察性数据仍有一些固有的局限性,而随机对照试验仍是循证医学证据中的金标准。因此,就目前而言,可以先等待CREST-2的结果再做观察。
参考文章:
1. Stroke. 2022 Feb 15;STROKEAHA121036178.
doi: 10.1161/STROKEAHA.121.036178.
2. Stroke. 2022 Feb 15;STROKEAHA121037331.
doi: 10.1161/STROKEAHA.121.037331.
相关知识
数据分析入门——以鸢尾花分类为例
水体与城市微气候调节作用研究——以武汉为例
《春季花卉营销策略研究:以提升市场竞争力为例》
水体和城市微气候调节作用研究——以武汉为例.PDF
绿地结构设计对社区微气候的影响研究——以临海六角井未来社区为例
多因素影响下的大学校园绿地访问行为对情绪的调节作用研究——以北京市三所大学为例
季节性景观规划设计研究——以华宁浣溪四季公园为例
农户对环境友好型肥料的选择行为研究——以有机肥及控释肥为例
基于生态系统服务供需的城市绿色基础设施网络构建研究——以北京市通州区为例
急性白血病儿童的侵袭性真菌病和抗真菌预防:一项多中心回顾性澳大利亚队列研究。,The Lancet Regional Health
网址: 使用观察性数据的新玩法,以一项研究为例 https://m.huajiangbk.com/newsview1130884.html
上一篇: 野菊花的功效与作用,野菊花的副作 |
下一篇: 武侠大作捏脸哪家强?玩家:逆水寒 |