3、建立你的第一个机器学习模型

建造你的第一个模型,万岁!

本课程所需数据集夸克网盘下载链接:https://pan.quark.cn/s/9b4e9a1246b2
提取码:uDzP

文章目录

  • 1、为建模选择数据
    • 1.1选择预测目标
  • 2、选择“特征”
  • 3、构建模型

1、为建模选择数据

您的数据集中有太多的变量,以至于您无法理解,甚至无法很好地打印出来。你怎样才能把这么庞大的数据压缩成你能理解的东西呢?

我们先用我们的直觉挑选一些变量。稍后的课程将向您展示数据统计技术,以自动排列变量的优先级。

要选择变量/列,我们需要查看数据集中所有列的列表。这是通过 DataFramecolumn 属性完成的(下面的代码底线)

In [1]:

import pandas as pd

melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv'
melbourne_data = pd.read_csv(melbourne_file_path) 
melbourne_data.columns

Out[1]:

Index(['Suburb', 'Address', 'Rooms', 'Type', 'Price', 'Method', 'SellerG',
       'Date', 'Distance', 'Postcode', 'Bedroom2', 'Bathroom', 'Car',
       'Landsize', 'BuildingArea', 'YearBuilt', 'CouncilArea', 

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-01-18 09:42:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-18 09:42:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-18 09:42:02       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-18 09:42:02       20 阅读

热门阅读

  1. 01 数据结构前言

    2024-01-18 09:42:02       37 阅读
  2. STM32 单片机重启(查看上次重启原因)

    2024-01-18 09:42:02       36 阅读
  3. ssh: connect to host github.com port 22: Connection timed out

    2024-01-18 09:42:02       34 阅读
  4. npm install:深入理解与应用

    2024-01-18 09:42:02       31 阅读
  5. Hive之set参数大全-8

    2024-01-18 09:42:02       28 阅读
  6. Git中config配置

    2024-01-18 09:42:02       28 阅读
  7. postgresql安装脚本

    2024-01-18 09:42:02       40 阅读