关键词:
强直性脊柱炎
银屑病
富集分析
机器学习
人工神经网络
交叉验证
列线图
免疫细胞浸润
孟德尔随机化
药物预测
摘要:
背景:强直性脊柱炎和银屑病的发生及发展密切相关,但其关键基因及调控机制尚不明确。目的:建立基于GEO数据库的强直性脊柱炎和银屑病共有基因的人工神经网络模型并评价其效果,同时使用孟德尔随机化确定关键基因表达与两病有无因果关系。方法:从GEO数据库中下载数据集GSE25101(强直性脊柱炎样本和健康对照样本各816例)、GSE30999(银屑病样本和健康对照样本各85例)、GSE73754(52例强直性脊柱炎样本和20例健康对照样本)和GSE14905(33例银屑病样本和49例健康对照样本),以GSE25101和GSE30999分别作为强直性脊柱炎和银屑病的训练数据集,通过差异分析鉴定出各自的差异表达基因从而获得两病共有驱动基因,利用随机森林和支持向量机递归特征消除术两种机器学习方法进一步筛选出关键核心基因,基于关键核心基因构建人工神经网络模型并在外部数据集GSE73754和GSE14905中进行验证,接下来构建相应的列线图以预测疾病的发病率。同时,对强直性脊柱炎和银屑病的免疫浸润结果展开分析。最后,使用孟德尔随机化评估关键基因与疾病之间的因果关系,使用Dgidb数据库分析药物-基因相互作用,从而预测药物靶点。结果与结论:①在强直性脊柱炎中共获得差异基因61个,在银屑病中共获得差异基因4309个,取交集后得到8个共有差异基因,进一步通过机器学习筛选得到5个关键基因(DNMT1,GNG11,CDC25B,S100A8及S100A12),并利用关键基因分别构建强直性脊柱炎和银屑病的人工神经网络模型,在训练集GSE25101和GSE30999中AUC值分别为0.979及0.989,在外部验证数据集GSE73754和GSE14905中AUC值分别为0.818及0.874。②基于5个关键基因构建了列线图,校准曲线显示列线图模型的预测概率与理想模型几乎一致。免疫细胞浸润显示,关键基因与活化B细胞、自然杀伤细胞、γδT细胞、滤泡辅助性T细胞、单核细胞、浆细胞样树突状细胞、中性粒细胞等相关。孟德尔随机化结果显示,S100A8是强直性脊柱炎与银屑病发病的危险因素。最后,利用DGIdb筛选得到81种靶向药物,其中,只有甲氨蝶呤(Methotrexate)、阿托吉泮(Atogepant)、乌布吉泮(Ubrogepant)、瑞美吉泮(Rimegepant)、艾普奈珠单抗(Eptinezumab)、阿扎胞苷(Azacitidine)、硒片(Selenium)、羟基脲(Hydroxyurea)、异环磷酰胺(Ifosfamide)、氟尿苷(Floxuridine)、姜黄素(Curcumin)、米托蒽醌(Mitoxantrone)、顺铂(Cisplatin)、三氧化二砷(Arsenic Trioxide)、己烯雌酚(Diethylstilbestrol)及地西他宾(Decitabine)16种药物获得了美国食品药品监督管理局的批准。③国际数据库、欧洲群体的研究成果和数据分析,尤其在基因组学和疾病表型研究方面,已经积累了大量成功的案例,这些经验为中国疾病的流行病学特征、基因多样性及其对环境和生活方式的反应提供了有价值的参考。④文章构建了强直性脊柱炎和银屑病共同驱动基因的人工神经网络模型并得到验证,发现了关键基因与两病发病的因果关系,预测出潜在治疗的靶向药物,希望能为探索其发病机制和治疗方向提供一个新的视角。