目录
一、概述
1.1 npz 文件
.npz 是 NumPy 的压缩文件格式,用于存储多个 NumPy 数组。它具有以下特点:
1.数据格式:
- .npz 文件可以包含多个 NumPy 数组,每个数组都有一个键来标识。
- 数据以二进制格式存储,适合于高效的读写操作。
2.读写速度:
- 由于使用二进制格式,读写速度较快,特别适合存储和加载大量数据。
3.压缩:
- .npz 文件使用 zip 压缩,因此可以减少文件大小。
4.使用场景:
- 常用于保存和加载训练好的模型参数、大规模数据集等,需要高效存储和读取的场景。
5.文件操作:
- 使用 numpy.savez 和 numpy.load 函数进行读写操作。
1.2 txt 文件
.txt 文件是纯文本文件,用于存储人类可读的文本数据。它具有以下特点:
1.数据格式:
- .txt 文件以文本格式存储数据,通常每行表示一条记录。
- 可以包含任意类型的文本数据,包括数值、字符、混合文本等。
2.读写速度:
- 由于使用文本格式,读写速度较慢,特别是处理大规模数据时。
3.压缩:
- .txt 文件本身不进行压缩,文件大小取决于内容。
4.使用场景:
- 适用于存储配置文件、日志文件、简单数据记录等,需要人类可读的场景。
5.文件操作:
- 使用标准的文件读写操作,如 open、read、write 等进行操作。
二、使用方法
2.1npz的存储与加载
import numpy as np
# 创建一些示例数据
matrix = np.array([[1, 2, 3], [4, 5, 6]])
vector = np.array([1, 2, 3, 4, 5])
# 保存到 .npz 文件
np.savez('data.npz', matrix=matrix, vector=vector)
# 加载 .npz 文件
data = np.load('data.npz')
print(data['matrix'])
print(data['vector'])
2.2txt的存储与加载
import numpy as np
# 创建一些示例数据
matrix = [[1, 2, 3], [4, 5, 6]]
vector = [1, 2, 3, 4, 5]
# 保存到 .txt 文件
with open('data.txt', 'w') as f:
for row in matrix:
f.write(' '.join(map(str, row)) + '\n')
f.write(' '.join(map(str, vector)) + '\n')
# 加载 .txt 文件
with open('data.txt', 'r') as f:
lines = f.readlines()
matrix = [list(map(int, line.split())) for line in lines[:-1]]
vector = list(map(int, lines[-1].split()))
print(matrix)
print(vector)
三、总结
- .npz 文件:适用于高效存储和读取大规模数据,使用二进制格式和压缩。
- .txt 文件:适用于存储简单的文本数据,易于人类阅读和编辑,但读写速度较慢。
选择哪种文件格式取决于具体的使用场景和需求。如果需要高效存储和读取大量数据,建议使用 .npz 文件。如果需要易于阅读和编辑的文本格式,可以选择 .txt 文件。