91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

针灸类系统综述与Meta分析存在的问题及对策探讨

  2021-12-08    92  上传者:管理员

摘要:针灸类系统综述及Meta分析普遍存在研究问题定义不清及方法学错误等问题。为进一步提高相关文献质量,本文结合针灸学特点,从PICOS(P:研究对象;I:干预措施;C:对照措施;O:结局指标;S:研究类型)框架探讨如何构建明确的研究问题,方法学上从文献检索、偏倚评价、结果的分析及解读、其他类型Meta分析的选择、方法学的更新五方面对存在的共性问题进行分析并探讨相关对策。

  • 关键词:
  • Meta分析
  • 医疗决策
  • 方法学
  • 系统综述
  • 针灸
  • 加入收藏

医疗决策应以目前可获得的最好的研究证据为基础。由于目前文献的发表数量急剧增长,同一临床问题往往存在大量文献。这些文献由于时间、所处环境不同,或代表患者群体不同,或存在方法学缺陷[1],可能得到不同甚至相反的结论。系统评价系统地纳入相关疗法治疗的所有文献,并运用减少偏倚策略进行评价和综合,可系统地汇总现有最好的证据。此外,系统综述通常还应展示目前缺少哪方面的知识[2],可提示未来的研究方向。根据证据等级金字塔,纳入多个随机对照试验(RCT)的系统综述和Meta分析是最好的证据[3]。因此,系统综述及Meta分析的过程不仅仅是重复,也是创造证据的过程。

一个好的综述通常需要定义明确的研究问题,并且方法学正确。笔者在针灸期刊系统综述及Meta分析类论文审稿的过程中,发现此类论文普遍存在研究问题定义不清,而且有较多的方法学错误。目前针灸的系统评价方法基本上沿用化学药物评价方法,而忽视了针灸疗法自身的特点,这也在一定程度上影响了相关研究结果的可信度和科学性,也使最终的结论在临床上难以使用。本文结合针灸学特点,主要依据Cochrane干预措施系统评价手册(CochraneHandbookforSystematicReviewsofInterventionsversion6.0,以下简称手册)[4],对存在的共性问题进行分析并探讨相关对策。


1、研究问题不明确


明确研究问题对系统综述而言是第一步也是最重要的一步。研究问题可以非常的具体,也可以宽泛一些。但如果研究问题比较宽泛,作者需要有足够的理由将不同的患者或多种治疗方法纳入,否则最好把该问题分解成一系列更具体的问题。构建一个具体、明确的问题一般可使用PICOS框架,以下根据此框架分别阐明存在的问题及对策。

1.1 研究对象

(1)纳入研究的对象存在不合理的限制。一般而言,纳入的研究对象应足够广泛,尽量减少人口学上不必要的限制,以涵盖更多的可能性并使结论有外推性,所有的限制应该合理并与临床相关。

(2)对于研究的疾病缺失明确定义或(和)诊断标准。特别是对于一些“宽泛”的疾病,如面瘫可分为周围性面瘫和中枢性面瘫,其机制及预后均不同,不宜笼统定义为面瘫;再如腰痛的原因非常多,并有急性与慢性之分。诊断标准对理解研究问题非常重要,但常被许多针灸类系统综述所忽视。建议分别列出符合要求的国内及国外相应的代表性诊断标准,以便同时纳入国内外文献。此外,疾病的诊断标准可能会随着时间改变,如1999年世界卫生组织将糖尿病诊断标准中的空腹血糖由7.8mmol/L改为7.0mmol/L[5],2017年美国高血压指南将血压标准阈值由140/90mmHg(1mmHg=0.133kPa)改为130/80mmHg[6]。诊断标准改变可能导致临床意义不同,应当进行阐述,必要时进行敏感性分析。

1.2 干预措施

对于针灸的定义不明确。针灸是包括多种治疗方法的一类治疗干预措施。由于目前针灸的定义缺乏共识和统一标准,故有必要对针灸进行明确的定义及详细说明,而这点在目前的系统评价中常被忽视。广义的针灸不仅包括针刺和艾灸,还包括拔罐、刮痧、穴位贴敷、穴位埋线、穴位按压、推拿等治疗方法,还可包括一些理化治疗,如激光、红外等,其治疗手段主要特点是以体表物理刺激为方法[7]。目前国内外对针灸尚未有统一的定义,如美国国立卫生研究院(NIH)将“Acupuncture”定义为“通过刺激体表某些解剖部位的一类治疗方法”[8],国际标准化组织(ISO)仅将其定义为针刺[9],各国际组织及代表性国家立法中对针灸的定义也不尽一致[10]。

在国内,针灸的定义与中医理论紧密相连,其理论基础是“中医理论”,是“中医学”的一部分[11],而对具体的治疗方法并未规定。特别是新疗法层出不穷,如穴位埋线、针刀、激光疗法等迅速发展,这些是否属于针灸疗法还未达成共识。再如,有的系统综述评价平衡针、腹针、毫针、电针等针法的亚组分析或进行网状Meta分析,本质上讲,平衡针、腹针等也属于毫针刺法,而文献上如何明确区分,也需要必要的说明。具体到论文中,不同作者对“针灸”的定义及包括的治疗方法也不完全一致,最终导致纳入文献不同。如果不明确定义针灸及其范围,会导致最终结论不明确。

1.3 对照措施

仅定义干预措施不足以明确研究问题,综述中通常会忽视对照措施的定义。针灸类Meta分析主要评价的是针灸的疗效,对照组的选择决定于最终的研究目的,目前主要存在如下问题。

(1)未提及对照组,对照组不合理,对照组过于笼统。对照一般包括以下3种:无效对照、安慰剂对照及阳性对照[12]。合理的对照包括针灸与无治疗或安慰剂比较,以及针灸与效果已知的某疗法比较。而针灸与效果不明的疗法比较将无法解释。有些Meta分析将不同类型的对照不加区分,统一放在一起分析,最终结果也无法解释。有些Meta分析的对照使用“西药”“中药”等笼统的概念,最后得出的结论是“针灸比西药/中药有效”,这样的结论也是不明确的。由于西药和中药都有非常多的种类,应该至少明确是哪一类药,如止痛药分为非甾体抗炎类药和中枢类止痛药,尽管作者的目的是纳入更多的文献,但纳入正确的文献更加重要,否则将导致结论在临床上无法使用。

(2)忽视基础治疗的存在。对于许多慢性疾病或某些疾病而言,针灸治疗的同时还需要基础治疗。对基础治疗应明确包括哪些方面的治疗,避免其中某些治疗干扰疗效的判断。有些系统综述尽管纳入的文献包括基础治疗,但最终的结论却未提及基础治疗,这会使最终的结论脱离实际。另外,需要强调的是两组的基础治疗必须一致,否则会产生干扰或沾染,导致最终的结果难以解释。

1.4 结局指标

结局指标的选择非常重要,不同的结局指标可能会得出不同的结论,并应根据其重要程度或研究目的分为主要结局指标和次要结局指标。在结局指标的选择上,系统综述强调要纳入所有与决策相关的重要结局,要避免仅根据原始使用的结局指标来确定所纳入的结局指标。有些重要的结局指标即使无报告也应该纳入,这可提示未来临床研究的方向。存在的主要问题有以下3点。

(1)仅报告有效性指标,而忽略安全性指标或其他指标的报告。尽管针灸被认为是一种安全的治疗方法[13],但对于一种疗法仅评价其有益的作用,而忽略不良反应的报告,都是有偏倚的。另外,针灸通常被认为是一种有成本效益优势的治疗方法,也应该考虑相应的经济学指标。

(2)未报告结局指标的定义或测量方法。如不少针灸类系统综述使用“有效率”作为结局指标,但并未对其做明确的定义或说明该指标如何计算。“有效率”不是一个意义明确的指标,不同的研究对有效率的定义及计算均不同,如在针灸治疗绝经期RCT所采用的结局指标,“有效率”使用次数最多,但有10种不同的计算标准[14]。如果不加区分进行合并,最终的结果会产生误导,也会导致最终的结论在临床及科研上无法使用。再比如使用视觉模拟量表(visualanaloguescale,VAS)评分作为结局指标,还应报告其量程是10分还是100分[15,16]等,不同的量程其临床含义不同。

(3)忽视治疗时间对疗效的影响。对于不同的疾病,针灸治疗的时间很可能对疗效有影响。如果最终纳入的各研究治疗的时间范围有较大差异,一般还需要定义结果的时间点,否则可能会导致较大的异质性。系统综述的时间点通常指时间范围而不是特定的时间点,如短期1~3个月、中期3~6个月等,一般需要根据临床意义确定。时间范围不宜过窄,否则会导致各亚组中病例过少,在后面的合成中产生困难。目前针灸疗程对针灸疗效影响的研究还较少,认识上还不系统,有待进一步研究和探讨。

1.5 研究类型及其他

对于治疗疗效的评价,RCT是最佳的研究设计类型。但有些系统综述未说明纳入的研究类型,这会影响读者对纳入研究的判断。一般仅纳入RCT不用说明理由,随机是防止不同试验组与对照组基线特征系统差异的唯一方法。如果纳入其他类型的研究设计还需要说明相应理由,并需对最终的结果偏倚做进一步的讨论。

语言及出版时间方面,最理想的情况是纳入所有可能的文献证据,对语言及出版时间不做限制。不论研究是否出版,都应该包括,除非有明确的排除理由。

尽管可以根据方法学质量来排除一些质量低下的论文,但为避免发表性偏倚,一般情况下最好是在敏感性分析中对不同方法学质量进行分类合并。

除了明确定义研究问题外,选题应结合临床实际问题,如“针灸在不同时机介入治疗周围性面瘫的疗效”[17]就是对临床有指导意义的问题,尽量避免选择“针灸治疗某常见病的有效性和安全性”这种不具体的研究问题。


2、方法学存在的问题


2.1 文献检索

系统评价要求彻底且可重复的检索数据库来源,以避免出现偏倚,这也是系统综述与传统综述的主要区别点。目前存在的问题主要是以下两点。

(1)检索数据库不全,或检索策略报告不完整。对于针灸的系统综述,一般需至少同时检索中文及英文数据库,每种语言的数据库应不少于两种,否则可能因检索不充分而产生偏倚。对于英文,手册建议应至少选择Medline、EMbase、CENTRAL3个数据库,中文可选择中文期刊全文数据库(CNKI),中国生物医学文献服务系统(SinoMed)、万方知识服务平台(Wanfang)等,另外对于补充替代医学还可选择AMED.为保证系统综述的可重复性,应至少报告一个数据库的完整检索策略。

(2)忽视临床注册中心数据库。临床注册中心数据库是RCT的重要信息源[18],但目前被许多系统综述忽视。常用临床注册中心平台有美国的ClinicalTrials.gov、中国临床试验注册中心等,这两个注册中心都是WHOICTRP平台下的分中心,也可以在ICTRP上统一进行检索。检索时,尤其要注意已注册但因阴性结果未发表的临床试验。阴性结果的试验发表率较低,但其结果和阳性试验的结果同样重要,如果仅纳入阳性结果的试验将会导致发表偏倚。如果检索出未发表的试验,应与注册者联系并请求提供相应的数据,并在最终的Meta分析中将相应的数据纳入。

2.2 偏倚评价

偏倚是指研究结果或统计推断中的系统误差,或指与真实值的偏差。偏倚有方向性,也有量的变化。科学研究的目的在于尽量减少偏倚,因此偏倚的评价对系统综述的科学性和可信度至关重要。偏倚可能会夸大治疗效果,甚至出现假阴性或假阳性的结果。严格的偏倚评价可以帮助读者判断结果的科学性和真实性,但现有的研究却多对偏倚评价不重视,选择了不当的评价工具,甚至偏倚评价错误。

(1)对偏倚评价不重视,有的论文甚至没有偏倚评价的过程,直接给出相应的偏倚评价图表。这对于读者并不透明,使读者无法准确判断纳入文献偏倚的方向及大小,从而降低了论文价值。

(2)偏倚评价工具选择不当。对于RCT一般使用Cochrane偏倚风险评价工具,目前已经修订至2.0版[19]。有的论文选择Jadad[20]等赋值类工具进行评价,而手册明确表明不推荐使用赋值的量表,原因是这些赋值的量表权重如何分配很困难,不同类型的研究对于同一因素权重不一致,且赋值的量表对于证据使用者不透明。

(3)对偏倚评价错误,未根据评价工具说明评价。如不明白“不完整结局数据”和“选择性报告”项的评价内容而随意评价;随意增加或减少评价工具的领域,如Cochrane偏倚风险评价工具,1.0版为7项评价域,而有些论文却随意删除“其他偏倚”,或将“研究对象和干预实施者的盲法”及“结局评估者的盲法”合并成盲法,这两项分别代表实施偏倚和检测偏倚,不能随意合并;对于非盲法研究的评价,过度使用“不明确风险”等。此外,对于偏倚的评价不应只看论文的原文,需要有自己的独立思考。如未采用安慰针刺的研究却在文中使用了“双盲”,双盲是对受试者和研究者施盲,未使用安慰针是无法对受试者施盲的;即使使用了安慰针,也需要考虑实施的可能性,一般安慰针仅可以在背部或受试者不能看见的区域使用,另外还要求受试者之前未接受过针灸疗法等情况。此外,针灸临床研究对研究者施盲非常困难。为保证评价的准确性,必要时需联系相关作者或研究人员以提供更详细的信息,但在联系时应使用开放式提问以避免作者给出积极信息。

2.3 结果的分析及解读

2.3.1 纳入研究特点表格

纳入研究特点表格内容不规范。本表格应该提取PICOS的内容。建议详细列出针灸治疗特点,如针刺的选穴、疗程、手法等,以帮助读者理解研究的特点及异质性的可能来源,而不是偏倚评价中的随机、盲法等内容。

2.3.2 效应量的选择

对于效应量的选择不注意对结果的解释。效应量除了对定性比较外,某些效应量还可以有定量的意义。对效应量的选择建议如下。

对于连续性变量建议使用MD,其为RCT中两组平均值之间的绝对差值,即均值差,具有量纲。如果在不同的研究中评价了相同的结局,但使用了不同的评价工具或不同的方式测量,这种情况下才需要使用SMD(standardmeandifference)。由于SMD将不同研究干预效果进行标准化,其结果与实际效应量无关,也难以解释,应避免对相同测量方式的结局使用SMD。

对于非连续性变量建议使用RR(riskratio)。OR(oddsratio)是比值比,表明特定事件发生的概率与不发生的概率比;RR是风险比,表明两组结果发生可能性的比值。OR值与RR值的意义不同且难以解释,如果将OR值解释为RR值将高估干预措施的效果。RR值在某些试验设计中无法计算发生率,如病例对照设计,因此OR值有更广泛的适用性。但由于针灸类系统评价一般纳入的均为RCT,一般不存在此问题。

2.3.3 异质性的认识及处理

现有综述普遍存在对异质性认识不清的问题。异质性是指系统综述中纳入研究之间所有种类的变异,包括临床异质性、方法学异质性及统计异质性。而异质性的统计性检验(I2或χ2检验)仅为包括纳入研究的不同研究结果的差异,即统计异质性。因此,统计量的同质并不代表研究间不存在异质性。

对于有较大的异质性的结果,目前多数作者几乎仅使用固定效应或随机效应模型来合并效应量,而回避对异质性的探索。使用不同效应模型是解决异质性的一种方法,但远远不够。由于针灸治疗及方法上的多样性,统计上的异质性几乎是难以避免的[21]。即使同是针刺,也有选穴、配穴、针刺深度、行针手法、留针时间、治疗频率、总治疗次数、针灸师的资质等不同,因此具有较大的异质性。因此,除非有明确证据表明纳入研究的同质性(如纳入的两个研究均为同一研究者的研究,且治疗方法相同),否则建议在效应模型中一律使用随机效应模型[22]。随机效应模型和固定效应模型的效应值通常差别不大,但随机效应模型估计范围更宽,结果也更为稳健。

有些论文对于异质性的来源的探讨较为草率。针灸属于复杂干预,影响针灸疗效的因素非常多,因此针灸的异质性往往难以确定,对于异质性的解读应慎重。有些系统综述在探索的过程中缺乏目的,在可能的异质性来源中强行通过某些方面解释差异,又不能找到相应的证据进行佐证,也不能指出其临床意义,这种异质性的探索可能存在错误甚至产生误导。

2.3.4 亚组分析

亚组分析通常是获得临床问题结果的关键分析方法。亚组分析可以根据不同的受试者特点、不同的干预特点等进行分组,以回答特定组别或特定干预的疗效问题。也可以考虑不同针灸疗法、疗程、选穴等差异是否会明确改变干预效果,并在此根据差异定义不同的亚组。这部分主要根据临床实际来确定,尚无统一的分组方法。目前存在的主要问题如下。

(1)亚组分析时目的性不强。亚组分析应基于临床,或基于研究目的来确定,否则其结果毫无意义。在任何大数据集中都有一定数量看似明显但实际上虚假的亚组差异[23]。因此,亚组分析应事先确定,这也是要求系统综述需进行注册的原因之一。亚组分析不应选择太多,否则可能会出现假阳性的结果。

(2)对于亚组差异缺少明确的解释。如果存在相应的亚组差异,应当先明确这些效应是否可信[24],并对结果做进一步的分析及合理的解释,即这些解释是否有直接或间接证据佐证,差异的大小是否有临床意义。

(3)盲目将所有亚组合并为总体。有些亚组分析不适宜用总体合并,是否合并所有亚组应根据亚组合并后是否可以解释而定,如将亚组按照对照措施分为药物组和空白组,如果合并最终的总体结果,最终的总体结果将无法解释。

2.3.5 敏感性分析

目前的系统综述常缺少敏感性分析的内容。敏感性分析主要是评价最终的结果或相应的统计模型是否稳定,评估结果或结论的稳健性。主要方法是通过剔除有某种特征的少数研究,来观察剩余的研究合并结果是否会发生明显的变化,如改变文献纳入标准、效应量、统计模型等。如果结果发生了明显的变化,则需要对此进行进一步的解释。

2.3.6 发表偏倚的判断

由于仅有部分研究会公开发表,有统计学意义的结果更可能公开发表,但无统计学意义的结果却同样重要。如果仅纳入已发表的有统计学意义的研究,最终的结果可能会产生误导。目前国内期刊对阴性结果论文发表的比例很低[25,26],这也导致了发表偏倚的可能性。避免发表偏倚主要是尽量检索完全,包括对灰色文献、临床试验注册中心的检索。

目前有许多论文对发表偏倚评价错误。发表偏倚可通过漏斗图的对称性进行评价。漏斗图需要纳入一定的研究数量(一般至少10项研究或以上),否则难以判断其对称性;对称性主要是看无效区间部分是否存在缺角,即是否缺少阴性结果的小样本论文,而不是看两对称线两边点的个数是否相同。此外,漏斗图的判断过于主观,不同的人可能评判结果不同,可以使用Eggertest等进行定量评价。如果存在发表偏倚,则可能由于没有纳入阴性研究而导致效应量夸大,可以使用剪补法[27]对效应量进行修正。

2.3.7 结果的解释

对于结果的解释,一个主要的错误是将“没有明确的证据”及“无效”相混淆。另外,最终的结论不应超过证据范围,如结局中没有评价不良事件,就不要在结论中说该疗法安全。

许多系统评价的结论很宽泛,对临床的指导性不强,也不准确,如“针灸对头痛有效”,或“针灸治疗面瘫优于西药”等。建议根据PICOS框架叙述,一般需要明确对哪一方面有效、是否需要基础治疗、西药是哪一类等信息,同时还需注意个体变异、就医环境等影响。由于针灸的特殊性,针灸的证据质量偏低,这并不表明无法得出强推荐的结论。根据GRADE指南[28],确定推荐强度,除了需要考虑证据质量以外,还需要考虑利弊的平衡、价值观和偏好以及资源的利用三方面,作者可以多从后面几个方面加以讨论。

最后的讨论应从实践角度和科研角度两方面分析。从实践角度而言,除了有效性的结论外,还应该强调可能影响决策的其他因素,如患者价值观和偏好、经济学、利弊权衡等。研究方面,应讨论进一步研究的必要性及未来需要解决的问题。

2.4 其他类型的Meta分析的选择

2.4.1 网状Meta分析

网状Meta分析是目前广泛使用的一种Meta分析方法,可用于3种及以上不同干预措施疗效的比较。网状Meta分析使用某种药物或干预作为桥梁进行疗效的传递,因此对疗法的同质性要求较高。针灸包括多种治疗方法,网状Meta分析目前多用于不同针灸治疗方法疗效的比较。但即使是针灸同种治疗方法,异质性也很高,如对于电针而言,不同研究的取穴、针刺深度、针刺角度、电流频率、电流强度等均不相同,因此在针灸文献使用网状Meta分析时应慎重。目前存在的主要问题是桥梁药物或桥梁疗法不明确,有的直接用西药或中药作为桥梁药物。对于桥梁药物,必须明确到某一种药,目前发表的网状Meta分析论文甚至对药物的剂量、服用频次也有明确的规定,否则无法保证疗效的准确传递。

2.4.2 IPDMeta分析

IPD(individualpatientdata)Meta分析即个体患者数据的Meta分析,是将患者个体数据纳入研究,而不是纳入整个研究的发表结果。由于IPDMeta分析采用更加灵活的统计方法探讨影响治疗效果的因素,能在一定程度上避免文献发表偏倚,可更有效处理临床的异质性,其结果可更有效地指导临床实践,因此IPDMeta分析是Meta分析的金标准[29]。目前国际上已有专家使用IPDMeta分析对针灸治疗疼痛类疾病进行了相关的探索[30,31]。IPDMeta分析对统计学及资源的要求很高,国内尚未见相关研究发表。

2.5 方法学的更新

证据综合的方法在不断更新,作者也应该不断学习相应的方法进展,而目前的论文却大多沿用过去的工具及方法。2019年Cochrane手册更新至6.0版,GRADEpro和RevMan软件也均更新为线上版本GRADEGDT和RevManWeb,原有计算机程序已不再更新;Cochrane偏倚风险评价工具也修订为2.0版,PRISMA声明也针对针灸发布了PRISMA-A扩展[32],这也要求作者不断进行相应的学习并使用更新的工具。结语

尽管目前发表的针灸类系统评价及Meta分析文献数量不断增加,但质量一直不高,其对临床的指导意义也未得到充分的发掘,这也是因为目前针灸学与循证医学整合中许多关键问题没有达到共识。系统评价的方法还在不断发展,这也需要方法学专家的关注,并针对针灸的特点不断完善相应的评价方法。


参考文献:

[7]赵京生.针灸理论体系概念范畴初探[J].世界中医药,2014,9(11):1405-1407.

[10]孙雨颉,刘保延;何丽云,等.针灸定义在国际组织及部分国家立法中的现状[J].中国针灸,2017,37(12):1329-1332.

[11]王凡.关于“针灸学"定义之我见[J].中国针灸,2017,37(12):1333-1336.

[17]靳丹丹,叶静,郭梦,等.针灸在不同时机介入治疗周围性面瘫疗效的Meta分析[J].中国针灸,2020,40(6):664-668.

[25]陈汐敏.我国医学期刊论文发表偏倚的调查和思考[J].中国科技期刊研究,2019,30(7):715-720.


文章来源:陈超,郭盛楠,郝洋,艾艳珂,江丽杰.针灸类系统综述与Meta分析存在的问题及对策探讨[J].中国针灸,2021,41(12):1387-1393.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

环球中医药

期刊名称:环球中医药

期刊人气:1794

期刊详情

主管单位:国家卫生健康委员会

主办单位:中华国际医学交流基金会

出版地方:北京

专业分类:医学

国际刊号:1674-1749

国内刊号:11-5652/R

邮发代号:80-726

创刊时间:2008年

发行周期:月刊

期刊开本:大16开

见刊时间:10-12个月

论文导航

查看更多

相关期刊

热门论文

推荐关键词

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定