注意:本文引用自专业人工智能社区Venus AI
更多AI知识请参考原站 ([www.aideeplearning.cn])
在该项目中,构建并训练了 XG-Boost 分类器来预测一个人是否有患宫颈癌的风险。数据来自委内瑞拉加拉加斯“加拉加斯大学医院”的 858 名患者,包括怀孕次数、吸烟习惯、性传播疾病 (STD)、人口统计和历史医疗记录等特征。对训练数据集进行探索性数据分析和数据可视化。在模型训练之前准备数据并分为训练和测试数据集。使用 Python 中的 sci-kit 库针对此任务对 XG-Boost-Algorithm 进行了训练和评估。该机器学习模型的准确度为:0.997(训练数据集)0.953%(测试数据集)
数据展示
数据来自委内瑞拉加拉加斯“加拉加斯大学医院”的 858 名患者,包括怀孕次数、吸烟习惯、性传播疾病 (STD)、人口统计和历史医疗记录等35个特征。详细的数据如图所示。
绘制热力图进行相关性分析
模型搭建与训练
!pip install --upgrade pip
!pip install seaborn
!pip install xgboost
import xgboost as xgb
model = xgb.XGBClassifier(learning_rate = 0.1, max_depth = 50, n_estimators = 100)
model.fit(X_train, y_train)
验证结果可视化
项目资源下载
详情请见网站基于XG-Boost B预测宫颈癌