杨浩(销售总监)
展会咨询QQ: 515616785
手机: 18964878976
肠息肉辅助诊断软件(以下简称肠息肉AI)是一类利用深度学习算法,在内镜检查过程中实时识别结直肠息肉的辅助诊断软件。肠息肉AI的应用可有效提高内镜医师在结直肠镜检查中息肉的检出率,相当于内镜医师的“第三只眼”,有助于达到结直肠癌早发现、早治疗的目的,尤其适用于基层医疗机构以及经验相对不足的内镜医师。目前,肠息肉AI产品的临床试验设计是深度学习辅助诊断软件研究的热点领域之一。
兼顾准确度与优效性
从检测对象来看,肠息肉AI是对目标疾病病灶进行辅助检测的产品。根据国家药监局医疗器械技术审评中心于2019年7月发布的《深度学习辅助决策医疗器械软件审评要点》,以及于今年5月发布的一则题为《基于深度学习的计算机辅助决策产品临床试验设计类型如何考虑》的共性问题解答,对于此类产品的临床试验,建议采用对照设计,其中试验组为医师与申报产品共同检测,对照组则为传统检测诊断方法(如临床医师的阅片/综合诊断)。在主要评价指标设置方面,应考虑诊断准确度指标;同时,为体现产品的临床价值,应采用优效性检验。因此,肠息肉AI的临床试验应采用“AI+人>人”的试验设计。
与常规病灶辅助检测产品不同,肠息肉AI为实时检测诊断产品,用于对结直肠息肉进行实时识别。在电子肠镜检查过程中,患者的结直肠息肉,尤其是可疑的腺瘤性息肉,往往会被内镜医师摘除。由于患者的疾病状态在检查过程中会不断发生变化,肠息肉AI临床试验无法像传统病灶辅助检测产品一样采用严格意义上的配对诊断试验设计,而一般是以平行对照设计为主,并评价研究者联合申报产品的病灶诊断水平是否优于传统肠镜检查手段。
两类临床试验设计各有利弊
从目前已有的文献报告及产品申报情况来看,肠息肉AI产品的临床试验设计主要分为两种:传统平行对照和平行序贯对照。
传统平行对照设计
该类临床试验设计是把研究者联合申报产品进行肠镜检查作为试验组,把传统肠镜检查作为对照组,主要评价指标一般为息肉(或腺瘤)检出率。若试验组的息肉(或腺瘤)检出率在统计学意义上优于对照组,则表明产品具有一定的临床价值。
在传统平行对照临床试验中,每例受试者仅进行1次电子肠镜检查,受试者依从性往往较高,且试验操作与临床实际诊疗流程基本相符,研究者的接受程度也较高,因此传统平行对照是目前大部分文献以及产品申报采用的主流试验设计方式之一。
传统平行对照试验尽管可操作性较好,但在产品评价上存在一些难以避免的固有偏倚。例如,传统平行对照设计的主要评价指标一般为息肉(或腺瘤)检出率,而该检出率往往受发病率及研究者诊疗水平的影响较大。虽然该临床试验设计可采用分层区组随机法,以尽量使试验组及对照组受试者的发病率趋于相同,但组间研究者经验水平差异带来的试验偏倚仍无法避免。因此,传统平行对照设计得出的优效性结果可能带有研究者经验水平的混杂因素,且试验结果可能存在较为显著的中心效应。另外,大样本临床试验及荟萃分析均显示,我国目前通过传统电子肠镜检查的息肉(或腺瘤)检出率依然偏低,因此采用传统平行对照设计的样本量往往较大,一般在800例左右。
平行序贯对照设计
该类试验设计具体为同一研究者对同一受试者分别在使用肠息肉AI与不使用肠息肉AI的条件下进行2次电子肠镜检查,且2种检查方式的顺序随机。
平行序贯对照设计的主要评价指标为息肉(或腺瘤)漏诊率。漏诊率的定义为,研究者在第2次检查中新发现的息肉(或腺瘤)数目占前后2次检查发现的息肉(或腺瘤)总数的比例。由于漏诊率是在是否使用肠息肉AI的情景下对比获得,故平行序贯对照设计可有效避免因研究者诊疗水平差异造成的偏倚。除此以外,平行序贯对照设计还可按照受试者的就诊原因进行组间分层,以使得不同就诊原因下患者的发病率差异在两组间趋于均衡,从而有效避免受试者发病率的偏倚。由此可见,平行序贯对照设计可较好反映产品本身的诊断性能。
然而,平行序贯对照设计的主要难点在于,受试者需要进行连续2次电子肠镜检查,依从性可能较差。因此,研究者在采用平行序贯对照设计时,建议在受试者处于全麻状态时对其进行电子肠镜检查,以改善受试者的检查体验。
值得注意的是,由于结直肠息肉在临床试验中不一定会被全部摘除或进行活检,在临床试验设计中还应考虑设立“金标准”阅片小组,以评价那些没有被摘除或活检但被发现的息肉(或腺瘤)的准确性。
此外,在平行序贯对照设计中,由于2次肠镜检查的部位和角度不可能完全相同,在评价息肉(或腺瘤)漏诊率时,可能还需要对比2次肠镜检查所拍摄的位置是否完全一致,以更加准确地评价漏诊情况。
总的来说,由于肠息肉AI的临床试验设计具有较大的特殊性,与常规病灶识别的辅助诊断产品具有较大的差别,其临床试验设计应从控制偏倚的角度入手,以充分体现产品的临床应用性能和价值。