本节将介绍Sklearn库基本功能,以及其自带的几个标准数据集的调用方法。本节是学习后面内容的基础,如果您已经对本节内容相当熟悉,可跳过本节内容。
1.1 Sklearn库基本功能
的
1.2 Sklearn库标准数据集
Sklearn自带许多标准数据集,这些数据集从简单到复杂,可用于机器学习的各个领域。主要包括以下四类:
- Toy datasets
- Real world datasets
- Generated datasets 生成式数据集
- Loading other datasets 其它来源数据集
(1)波士顿房价数据集
波士顿房价数据集(Boston Housing Dataset)
该数据集包含了 506 个波士顿地区的房屋数据,其中每个数据点都有 13 个变量(例如犯罪率、房产税率、房间数量等)和一个目标变量(房屋价格的中位数)。该数据集最初由 Harrison, D. 和 Rubinfeld, D.L. 在 1978 年发布。
https://zhuanlan.zhihu.com/p/618818240