Applying clustering and association rule mining for analyzing gene expression data
随着DNA微阵列技术的广泛应用,产生了海量基因表达数据,如何利用这些数据研究基因间的调控关系成为当前生物信息学的一个研究热点.关联规则挖掘是数据挖掘领域的一个重要技术,然而直接埘基因表达数据进行关联规则挖掘存在两个问题:一是时间和空间复杂度过高;二是获得的规则仅定性表示基因间的调控关系,无法提供关于调控关系强度的信息.本文利用聚类实现数据降维,然后将基因表达水平离散化为七个状态,最后关联分析每个聚类中的基因表达数据.实验结果表明本文的分析方法是有效的.