学习Dive into Deep learning:2.2 数据预处理,pandas

为了能用深度学习来解决现实世界的问题,我们经常从预处理原始数据开始, 而不是从那些准备好的张量格式数据开始。 在Python中常用的数据分析工具中,我们通常使用pandas软件包。 像庞大的Python生态系统中的许多其他扩展包一样,pandas可以与张量兼容。 

2.2.1. 读取数据集

举一个例子,我们首先创建一个人工数据集,并存储在CSV(逗号分隔值)文件 ../data/house_tiny.csv中。 以其他格式存储的数据也可以通过类似的方式进行处理。 下面我们将数据集按行写入CSV文件中。

import os

os.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:
    f.write('NumRooms,Alley,Price\n')  # 列名
    f.write('NA,Pave,127500\n')  # 每行表示一个数据样本
    f.write('2,NA,106000\n')
    f.write('4,NA,178100\n')
    f.write('NA,NA,140000\n')

要从创建的CSV文件中加载原始数据集,我们导入pandas包并调用read_csv函数。该数据集有四行三列。其中每行描述了房间数量(“NumRooms”)、巷子类型(“Alley”)和房屋价格(“Price”)。

# 如果没有安装pandas,只需取消对以下行的注释来安装pandas
# !pip install pandas
import pandas as pd

data = pd.read_csv(data_file)
print(data)

相关推荐

  1. python pandas 数据预处理

    2024-03-28 15:40:03       56 阅读
  2. 学习Dive into Deep learning:2.2 数据预处理pandas

    2024-03-28 15:40:03       40 阅读
  3. 机器学习学习 - 数据预处理

    2024-03-28 15:40:03       30 阅读
  4. pytorch笔记篇:pandas数据预处理(更新中)

    2024-03-28 15:40:03       42 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-28 15:40:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-28 15:40:03       101 阅读
  3. 在Django里面运行非项目文件

    2024-03-28 15:40:03       82 阅读
  4. Python语言-面向对象

    2024-03-28 15:40:03       91 阅读

热门阅读

  1. 【晴问算法】算法初步—散列—整数出现次数

    2024-03-28 15:40:03       39 阅读
  2. Linux-跨节点免密登录

    2024-03-28 15:40:03       41 阅读
  3. 2990: 【C3】【递推】蟠桃记

    2024-03-28 15:40:03       42 阅读
  4. SQL:求同时在线人数问题

    2024-03-28 15:40:03       40 阅读
  5. Vue 3 关于组件的注册

    2024-03-28 15:40:03       43 阅读
  6. 广告牌效果的C#实现

    2024-03-28 15:40:03       34 阅读
  7. 突破编程_C++_查找算法(二叉树查找)

    2024-03-28 15:40:03       39 阅读
  8. Spring全家桶涉及的注解

    2024-03-28 15:40:03       35 阅读
  9. Element-UI中el-cascader级联选择器获取label值

    2024-03-28 15:40:03       42 阅读
  10. Bean对象拷贝工具封装

    2024-03-28 15:40:03       40 阅读
  11. 若依分离版 —引入echart连接Springboot后端

    2024-03-28 15:40:03       42 阅读
  12. openGauss的索引组织表

    2024-03-28 15:40:03       40 阅读