An Effective Feature Selection Optimization Algorithm For Gene Splice Junction Sites Prediction
目的剪接位点是真核细胞生物基因序列中外显子和内含子的相邻区域,如果能准确预测基因序列中的剪接位点,就能将基因中的表达区域和非表达区域分开.方法从机器学习的角度出发,提出了一种有效的特征选择算法用于剪接位点的建模和预测.该算法首先将初始链模型中每一对父子节点作为特征量提取,然后通过遗传算法和最大后验分类器进行特征选择.结果及结论对剪接位点数据的预测结果显示,这种新算法能够有效地优化链模型的结构,提高对剪接位点的预测能力.同时,经过优化的模型也有助于了解真核细胞中基因转录和表达的过程.