目的 基于复杂生物网络和机器学习方法,识别乳腺癌相关的边缘生物标志物,构建乳腺癌生存预后模型,从而在系统水平解释乳腺癌的发生发展机制。方法 首先基于TCGA数据库的RNAseq数据识别乳腺癌相关的lncRNA-mRNA共表达扰动关系对,进一步构建乳腺癌相关的lncRNA-mRNA共表达扰动网络并对网络中的关键基因进行通路富集分析。然后,基于乳腺癌相关的lncRNA-mRNA关系对,构建乳腺癌预测的分类器模型。最后,通过Lasso回归筛选变量构建多因素Cox比例风险回归模型对乳腺癌患者进行生存预后分析。结果 构建了乳腺癌相关的lncRNA-mRNA共表达扰动网络,其中的关键基因富集分析得到32条与乳腺癌相关的生物通路。分类预测模型的灵敏度、特异度和准确性分别为98.2%、85.2%、97.6%。Lasso回归共筛选出22个和乳腺癌生存预后显著相关的lncRNA-mRNA互作关系对,进而构建的生存预测模型把训练集和测试集的乳腺癌患者分为高风险组和低风险组,两组患者生存预后均存在明显差异。结论 LncRNA-mRNA共表达互作网络中的关键基因以及乳腺癌相关的边缘生物标志物大多被证明与乳腺癌相关。同时基于边缘生物标志物的预后模型可以稳健地预测乳腺癌患者的生存预后状态,有利于从网络层面更好地理解乳腺癌的发生发展机制。
|