目前胰腺癌的5年生存率仅约6%,无创性诊断试验仅能区分三分之二的胰腺导管腺癌(PDAC)和慢性胰腺炎(CP)的患者,因此研究者试图寻找血液来源的代谢性生物标志物以提高胰腺癌的检测准确性。
本期学习的文献于年发表于GUT(IF=16.),文章从探索性研究到验证性研究,涉及临床研究中多种常用的统计学方法,包括ROC曲线、FDR校正和主成分分析等,掌握和综合应用这些统计学方法,有助于更好地进行医学临床研究。
Metabolicbiomarkersignaturetodifferentiatepancreaticductaladenocarcinomafromchronicpancreatitis.代谢性生物标志物用于鉴别胰腺导管腺癌与慢性胰腺炎。
研究流程
本研究分为三个阶段(其中,PDAC,胰腺导管腺癌;CP,慢性胰腺炎;LC,肝硬化;BD,献血者、对照组、非胰腺疾病患者术前患者)。
1探索性研究第一阶段,研究者比较了43例CP患者、20例LC患者、例BD对照和34例PDAC患者的血浆代谢组学谱(MxP宽谱分析、MxP类固醇和MxP脂质),以识别不同分组的代谢物。
2确认性研究第二阶段,对PDAC患者(n=)和临床相关对照(77例BD,例CP患者,80例LC患者)进行确认性研究。在这个集合中,研究者使用两种不同的样本类型(血清和血浆)来测试方法的稳健性。
其中,使用78例PDAC患者和80例CP患者的血浆样本作为训练集,以确定可鉴别PDAC与CP的代谢性生物标志物。
3验证性研究第三阶段,在测试集中,重新入组另外79例PDAC患者、80例CP患者和80名对照(接受外科手术和全身麻醉),验证上阶段得到的代谢性生物标志物。
在训练集和测试集中,疾病组需保证年龄和性别均衡。
统计方法
对代谢组学数据进行log10变换,使数据分布近似正态;
将疾病,年龄,体重指数,性别和样品储存时间作为固定效应,拟合线性模型。通过使用Benjamini和Hochberg提出的方法计算错误发现率(FDR)来解决多重比较的问题;
为了根据患者的代谢谱数据对患者进行分类,使用R包glmnet的弹性网络(EN)算法拟合惩罚logistic回归。将特异度固定为85%,在训练集中通过10倍交叉验证计算灵敏度,得到相应的cut-off值。然后在测试集中应用此临界值,计算灵敏度和特异度来评价性能。
研究结果
表1
第二阶段确认性研究,使用MxP平台,在血清和血浆样本中共识别出个高优先级的代谢物,分布在10大类。最大的代谢物组是复杂的脂质,脂肪酸和相关的代谢物。在鉴别胰腺癌和慢性胰腺炎的生物标志物中,九个代谢物中的五个(不包括CA19-9)均属于脂质大类。生物标志物中每个代谢物的倍数变化值、P值和FDR在表1中给出。
图1
对确认性研究和验证性研究中,所有PDAC和CP患者的代谢组学数据进行主成分分析。在多变量主成分分析中,例PDAC患者和例CP患者通过主成分3(7.2%)和4(6.6%)分离(图1)。
知识点
主成分分析图通过数据空间分布的差异直观地展现了不同分组之间以及同一组内各个样本之间的差异大小;
空间分布差异越小,表示两者的数据越接近;
分布图中每个点代表一个样本,并以不同颜色区分不同分组;
同一组内的不同样本应该聚集在一个相对集中的范围内,并可以与其他组的数据聚集区域区分开,显示出各组的特异性。
图2
在训练集中,对性别、年龄、体重指数(BMI)和样本储存时间校正后,分析得到,血浆样本中有个显著改变的代谢物,血清样本中有55个显著改变的代谢物,两种类型的样本中共有29个显著改变的代谢物(图2)。
为构建一个有效的胰腺癌诊断模型,研究者应用了弹性网络(EN)算法分析训练集的数据。基于该方法,除了CA19-9之外,还选择了九个血浆代谢物作为生物标志物,如表1所示,然后将其应用于测试集。
图3
在训练集中,假设慢性胰腺炎群体中胰腺癌的累积发生率为1.95%,用包含九个代谢物和CA19-9的生物标志物鉴别胰腺癌与慢性胰腺炎,曲线下面积(AUC)为0.96(95%CI0.93-0.98),特异度固定为85%,此时灵敏度为94.9%(95%CI87%-97%),结果阴性预测值为99.9%(95%CI99.7%-99.9%)(图3左)。诊断准确率为90%(95%CI86%-91%)。相比之下,研究中腹部超声的敏感度为68%,特异度为75%。
将由训练集所得的cut-off值0.应用到测试集,并对诊断性能进行评价。在测试集中,检测到胰腺癌的AUC为0.94(95%CI0.91-0.97),特异度为91.3%(95%CI82.8%-96.4%),灵敏度为89.9%(95%CI81%-95.5%),阴性预测值为99.8%(95%CI99.6%-99.9%)(图3右)。
研究者选出的生物标志物的AUC显著高于CA19-9的AUC(0.94比0.85,P<0.),敏感度(89.9%比74.7%,P<0.01)和特异度(91.3%比77.5%,P<0.05)也明显好。
下一期微文将重点介绍如何用spss实现ROC曲线的绘制。
我们不生产数据,
我们只是数据的挖掘机!
欢迎咨询与合作,联系方式
7
邮箱:medstato
.