证候是中医理论的核心.准确判定冠心病患者属于何种证候是中医有效治疗的重要前提.本文中,基于冠心病临床流行病学调查得到的1069例中医四诊信息和相应的辨证结果数据,用四类数据挖掘方法和一类统计方法作为预测模型对其学习和预测.采用十倍交叉验证方法得到的三个指标--敏感性,特异性和正确率以及运行时间来衡量算法的性能,并从每类方法中选择一个最优者进行对比研究.运行结果显示Bayesian network是贝叶斯方法中性能最好的,敏感性90.17%,特异性88.89%,正确率89.24%,运行时间0.53s;径向基神经网络(RBFN)是神经网络中最好的,敏感性84.07%,特异性94.32%,正确率91.49%,运行时间1.03s;Libsvm是支持向量机(SVM)方法中最好的,敏感性91.19%,特异性93.15%,正确率92.61%,运行时间1.0s;ADTree是决策树方法中最好的,敏感性83.73%,特异性95.99%,正确率92.61%,运行时间2.78s;Logistic回归的敏感性是88.14%,特异性94.44%,正确率是92.70%,运行时间1.09s.综合各项性能指标,SVM最好,Logistic回归次之,决策树、贝叶斯和神经网络依次次之.本文的对比研究为准确判别冠心病的中医证候提供适宜的数据挖掘方法.
|