UCi数据集处理技巧记录

如何起步使用UCI数据集

这里记录一下如何把带分号的数据变成经常使用的csv形式。这里使用wine的例子

https://archive.ics.uci.edu/dataset/186/wine+quality

原始数据 Wine

在这里插入图片描述

UCI数据操作

这种带分号的使用python的不好阅读,可以尝试以下步骤:
在这里插入图片描述

  1. 转变为txt文件,用替换的形式,将分号替换为逗号。
  2. 将文件形式转变为csv文件即可。

其次文件的头部可以改成字母。以下是在jupyter的python代码

import heapq
import datetime
import numpy as np
import pandas as pd
from sklearn import svm
from scipy.stats import spearmanr
from sklearn.model_selection import KFold
from sklearn.preprocessing import MinMaxScaler
from sklearn.neighbors import KNeighborsClassifier
from decimal import Decimal

# 读取数据 下载的UFD数据没有列名称,它把第一行当作了列名称,这里需要处理一下。
data = pd.read_csv(r"C:\Users\LCC\Desktop\wine.csv")
row1 =  data.columns.values
row1
# 将列名字改为字母顺序
columns_name = []
for i in range(len(row1)):
    columns_name.append(chr(ord('A')+i))
columns_name
#保存 这里默认根路径是桌面
data.columns = columns_name
data.to_csv("wine.csv")

改善后效果图

在这里插入图片描述

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-01 08:06:04       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-01 08:06:04       100 阅读
  3. 在Django里面运行非项目文件

    2024-01-01 08:06:04       82 阅读
  4. Python语言-面向对象

    2024-01-01 08:06:04       91 阅读

热门阅读

  1. 使用Python实现简单的区块链

    2024-01-01 08:06:04       58 阅读
  2. Docker 容器命令总汇

    2024-01-01 08:06:04       55 阅读
  3. 5-Docker实例-安装tomcat

    2024-01-01 08:06:04       62 阅读
  4. React16源码: createRef与forwardRef源码实现

    2024-01-01 08:06:04       44 阅读
  5. SAT问题

    2024-01-01 08:06:04       60 阅读
  6. git常用命令

    2024-01-01 08:06:04       48 阅读
  7. iris数据集的介绍

    2024-01-01 08:06:04       60 阅读
  8. 关于数据库归档

    2024-01-01 08:06:04       53 阅读
  9. Git详解

    2024-01-01 08:06:04       49 阅读
  10. MySQL 数据页损坏处理思路

    2024-01-01 08:06:04       59 阅读
  11. C语言中的难点

    2024-01-01 08:06:04       47 阅读
  12. 2.PHP数组的用法

    2024-01-01 08:06:04       59 阅读