基于机器学习的心脏病预测模型研究
心脏病作为当今社会对人类生活健康威胁最严重的血管疾病之一,不仅严重威胁人类的生命安全,而且高昂的治疗费用还会给家庭和社会带来严重的经济负担.针对目前心脏病预测研究中存在准确性不足及缺乏特征可解释性的问题,通过挖掘影响心脏病的重要特征,实现对心脏病准确预测和影响因素可解释性分析.首先,利用T检验来分析特征之间的显著差异性(P-value),通过P-value值降序排列选出特征进行组合.然后,利用十种机器学习模型和SHAP方法实现对心脏病的预测及其特征可解释性分析.在UCI心脏病数据集上进行验证实验,在7个医学领域广泛使用的评价指标上都到达了1,优于对比论文实验结果.最后,利用SHAP方法对13个特征进行可解释性分析,通过特征重要性排序可视化结果,挖掘单个特征与心脏病之间的关联,能为医生对心脏病的精准医疗提供决策支持.