Python:处理矩阵之NumPy库(上)

目录

        1.前言

        2.Python中打开文件操作

        3.初步认识NumPy库

        4.使用NumPy库

        5.NumPy库中的维度

        6.array函数

        7.arange函数     

        8.linspace函数

        9.logspace函数

        10.zeros函数

        11.eye函数


        前言

        NumPy库是一个开源的Python科学计算库,它提供了高性能的多维数组对象、派生对象(如掩码数组、矩阵)以及用于快速操作数组的各种例程,包括逻辑、形状操作、离散傅立叶变换、基本线性代数、基本统计运算、随机模拟等操作,本系列博客讲重点对NumP库的函数已经操作进行讲解


Python中打开文件操作

        本系列是对NumPy库的讲解,为什么第一小节却是使用Python打开文件?这是因为在数学建模中,数据的提供往往是Excel格式,要对数据进行操作之前,我们得先了解在Python中基本的文件操作:

        1.open函数用于打开文件

                1.Path为文件路径

                2.mode指定模式,默认为r:

模式指令 备注
x 创建文件,若文件已存在则失败
a 写入模式,文件存在则在末尾追加
r 读取模式
w 写入模式,并线截断文件
b 二进制模式
t 文本模式
+ 更新磁盘文件,读写并且读入

                3.buffering为缓冲区(内存的读写速度快于外设,所以大部分情况不用设,即不大于0

                4.encoding为编码方式

filePtr = open(path,mode='r',buffering=-1,encoding='utf-8-sig')
//定义一个文件指针filePtr指向打开的文件

        2.seek函数用于移动文件的读取指针到指定位置。seek函数需要使用文件对象进行调用,无返回值

value = 3
#定义变量value移动光标至3的位置
type.seek(0)
#移动到文件头位置
type.seek(value)
#将文件读取指针移动到文件的第p个字节处,表示绝对位置
type.seek(value, 1)
#在当前位置的基础上,将文件读取指针移动p个字节,表示相对位置
type.seek(value, 2)
#在文件尾的基础上,将文件读取指针移动p个字节,表示相对位置

        3.read函数用于从文件光标位置读取字节:

value_A = type.read(5)
#表示读取五个字符赋值给value_A
value_B = type.read()
#无参数表示读取至文件结束

        4.readline函数用于一次读取文件一行内容,以字符串的形式存储:

value_A = type.readline()
#表示读取文件一行内容
value_B = type.readline()[:-1]
#使用切片可控制读取到的位置,[:-1]代表该行的末尾

        5.readlines函数用于读取文件所有行,以列表的形式存储:

value_A = type.readlines()
#表示读取文件所有行
value_B = type.readlines()[:5]
#使用切片可控制读取到的位置,[:5]代表读取至第五行

        6.split函数用于分割数据:

                1.格式:split('text',value)

                2.以text内容分割内容,分割次数为value

                3.value的默认值为 -1,即分割所有出现次数

                4.列表格式不能使用split函数分割,只能字符串格式才能分割

value_A = type.readline().split(',')
#表示以逗号分割所读取到的行内容
value_B = type.readline().split(',',3)
#表示以逗号分割三次所读取到的行内容

        7.strip函数用于删除两侧字符

                1.格式:strip(value)

                2.当value为空时,代表删除头尾字符(换行,回车,制表符,空格)

                3.不为空则代表删除头尾的value值

value_A = type.strip(',')
#代表删除头尾的逗号字符
value_B = type.strip()
#代表删除头尾的换行,回车,制表符和空格字符

        8.lstrip函数用于删除左侧字符:

                1.格式:lstrip(value)

                2.当value为空时,代表删除开头字符(换行,回车,制表符,空格)

                3.不为空则代表删除开头的value值

value_A = type.lstrip(',')
#代表删除开头的逗号字符
value_B = type.lstrip()
#代表删除开头的换行,回车,制表符和空格字符

        9.rstrip函数用于删除右侧字符:

                1.格式:rstrip(value)

                2.当value为空时,代表删除末尾字符(换行,回车,制表符,空格)

                3.不为空则代表删除末尾的value值

value_A = type.rstrip(',')
#代表删除末尾的逗号字符
value_B = type.rstrip()
#代表删除末尾的换行,回车,制表符和空格字符

初步认识NumPy库

        NumPy库主要的功能之一用来操作数组和矩阵。是科学计算、深度学习等高端领域的必备工具。在使用TensorFlow、Caffe框架训练神经网络模型时,需要进行大量复杂的运算,可以直接调用NumPy里面的API,而且NumPy还包含了很多使用的数学函数,覆盖了很多的数学领域,比如,线性代数、傅里叶变换、随机数生成。在数学建模比赛中,你还可以认为Python + NumPy == Matlab     

图1.动手学NumPy库


使用NumPy库

        使用Numpy库前需要导入Numpy库

import numpy as _numpy    #导入numpy库并取别名为_numpy

NumPy库中的维度

        在介绍NumPy库的操作前,我们需要了解NumPy中的维度。Numpy中维度就是平常所说的一维(只有x轴)、二维(x、y轴)、三维(x、y、z轴)

#一维使用print输出后有一对花括号 [ ]
#二维使用print输出后有两对花括号 [ [] ]
#三维使用print输出后有三对花括号[ [ [] ] ]

array函数

        array函数用于将列表或元组转换为数组

 array(接收对象,dtype = 转换后数据类型,copy = True,order = 'K',subok = False,ndmin = 0)
参数 备注
接收对象 可为公开数组接口的任何对象,__array__方法返回数组的对象,或任何(嵌套)序列
dtype 数组所需的数据类型。如果没有给出,那么类型将被确定为保持序列中的对象所需的最小类型
copy 数组所需的数据类型。如果没有给出,那么类型将被确定为保持序列中的对象所需的最小类型
order 指定阵列的内存布局。如果接收对象不是数组,则新创建的数组将按C顺序排列(行主要),除非指定了'F',在这种情况下,它将采用Fortran顺序(专业列)。如果object是一个数组,则以下成立。 {'K','A','C','F'},可选
subok 如果为True,则子类将被传递,否则返回的数组将被强制为基类数组(默认)
ndmin 指定结果数组应具有的最小维数。根据需要,将根据需要预先设置形状
返回值 满足要求的数组对象

       表1.array函数参数表

        测试用例:

s1 = [1,2,3,10]
#创建一维列表s1
a1 = _numpy.array(s1,dtype = int)
#将列表s1转换为数组,数据类型为int型
s2 = [[1,2,3,10]]
#创建二维列表s2
a2 = _numpy.array(s2,dtype = int)
#将列表s1转换为数组,数据类型为int型
tp = (2,4,6,9,4)
创建元组tp
a3 = _numpy.array(tp,dtype = float)
#将列表a2转换为数组,数据类型为flosr型
#s1.dtype      s1.size        s1.itemsize   s1.ndim       s1.shape
#查看数组类型   查看元素个数   查看元素大小   查看数组维度   查看数组结构

arange函数     

        arange函数用于生成一维数组

arange([start , ],stop[ , step ,],stype = None)
参数 备注
start 代表初始值,默认从0开始
stop 代表终止值,必填参数
step 代表步长,默认为1

表2.arange函数参数表

        测试用例:

_numpy.arange(10)
#array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
_numpy.arange(5,10)
#array([5, 6, 7, 8, 9])
_numpy.arange(5,10,2)
#array([5, 7, 9])
#以上分别省略了初始值和步长


linspace函数

        linspace函数用于生成一个一维数组,其数据是一个等差数列

linspace(start,stop,num = 50,endpoint = True,retstep = False,dtype = None,axis = 0)
参数 备注
start 代表初始值,必填参数
stop 代表终止值,必填参数
num 代表生成数据的个数,默认为50
endpoint 代表是否包含终止值,默认为True
retstep 代表是否显示步长,默认为False
dtype 代表数据类型
axis 代表轴向,默认为0,代表沿X轴

表3.linspace函数参数表

        测试用例:

_numpy.linspace(10,20,10)
#array([10.        , 11.11111111, 12.22222222, 13.33333333, 14.44444444,
       15.55555556, 16.66666667, 17.77777778, 18.88888889, 20.        ])

_numpy.linspace(10,20,10,endpoint = False)
#array([10., 11., 12., 13., 14., 15., 16., 17., 18., 19.])

_numpy.linspace(10,20,10,endpoint = False,retstep = True)
#(array([10., 11., 12., 13., 14., 15., 16., 17., 18., 19.]), 1.0)

_numpy.linspace(10,20,10,endpoint = True,retstep = True,dtype = int)
#(array([10, 11, 12, 13, 14, 15, 16, 17, 18, 20]), 1.1111111111111112)
#最后两句代码显示的步长不同,但是数组相同。是因为dtype为int类型,所以小数强转为int类型


logspace函数

        logspace函数用于生成一个一维数组,其数据是一个等比数列

logspace(start,stop,num = 50,endpoint = True,base = 10.0,dtype = None,axis = 0)
参数 备注
start 代表初始值,必填参数
stop 代表终止值,必填参数
num 表生成数据的个数,默认为50
endpoint 代表是否包含终止值,默认为True
base 代表底数,默认为10.0
dtype 代表数据类型
axis 代表轴向,默认为0,代表沿X轴

表4. logspace函数参数表

_numpy.logspace(10,20,5)
#array([1.00000000e+10, 3.16227766e+12, 1.00000000e+15, 3.16227766e+17,1.00000000e+20])

_numpy.logspace(10,20,5,endpoint = False)
#array([1.e+10, 1.e+12, 1.e+14, 1.e+16, 1.e+18])

_numpy.logspace(10,20,5,endpoint = False,base= 100.0)
#array([1.e+20, 1.e+24, 1.e+28, 1.e+32, 1.e+36])
#底数为100

_numpy.logspace(10,20,5,endpoint = True,base = 10.0,dtype = int,axis = 0)
#array([-2147483648, -2147483648, -2147483648, -2147483648, -2147483648])
#底数为10

zeros函数

        zeros函数用于创建一个元素全为零的数组

zeros(shape,dtype = float,order = 'C')
参数 备注
shape 代表数组尺寸,可以是数值或元组
dtype 代表数组中的元素的数据类型,默认为float
order 代表存储多维数组时,是列优先'F'还是行优先'C',默认为行优先
shape 代表数组尺寸,故可以使用[]或()分别代表列表或元组的尺寸

表5. zeros函数参数表

_numpy.zeros((2,2))
#array([[0., 0.],
       [0., 0.]])

_numpy.zeros([2,2])
#array([[0., 0.],
       [0., 0.]])

_numpy.zeros((2,2),dtype = int)
#array([[0, 0],
       [0, 0]])
#与前两个元素类型不同

_numpy.zeros((3,5),dtype = int,order = 'F')
#array([[0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0]])

PS:当shape为[]或()时,可以传入多个数值,如_numpy.zeros((2,2,2)),代表2个3维数组,其元素含有2行2列。总结:当传入的数值大于2时,每增加一个数值代表维度加一,而最终的数字个数由前两个数字综合确定


eye函数

        eye函数用于创建元素中一个对角线全为一的数组矩阵

eye(N,M = None,k = 0,btype = < class 'float' >,order = 'C')
参数 备注
N 代表行数
M 代表列数
k 代表对角线元素个数,默认为0
dtype 代表数组中元素的数据类型,默认为float
order 代表存储多维数组时,是列优先'F'还是行优先'C',默认为行优先

表5. eye函数参数表

_numpy.eye(3,3)
#array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

_numpy.eye(3,3,dtype = int)
#array([[1, 0, 0],
       [0, 1, 0],
       [0, 0, 1]])

_numpy.diag([3,4,5])
#array([[3, 0, 0],
       [0, 4, 0],
       [0, 0, 5]])

_numpy.diag((3,4,5),1)
array([[0, 3, 0, 0],
       [0, 0, 4, 0],
       [0, 0, 0, 5],
       [0, 0, 0, 0]])

_numpy.diag((3,4,5),-1)
#array([[0, 0, 0, 0],
       [3, 0, 0, 0],
       [0, 4, 0, 0],
       [0, 0, 5, 0]])

相关推荐

  1. Python数据处理和常用(如NumPy、Pandas)

    2024-06-09 10:40:02       17 阅读
  2. python数据处理numpy

    2024-06-09 10:40:02       17 阅读
  3. Python】数据处理NumPy

    2024-06-09 10:40:02       5 阅读
  4. python_数据分析_numpy

    2024-06-09 10:40:02       29 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-09 10:40:02       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-09 10:40:02       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-09 10:40:02       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-09 10:40:02       18 阅读

热门阅读

  1. 参观营业额变化增长(sql练习)

    2024-06-09 10:40:02       6 阅读
  2. g++ 预处理 编译 汇编 链接 命令

    2024-06-09 10:40:02       7 阅读
  3. Npm发布自己的插件包

    2024-06-09 10:40:02       7 阅读
  4. Linux基本指令查询硬件信息001

    2024-06-09 10:40:02       9 阅读
  5. 360数字安全:2024年3月勒索软件流行态势分析报告

    2024-06-09 10:40:02       8 阅读
  6. Redis中的发布/订阅模式:构建灵活的消息系统

    2024-06-09 10:40:02       8 阅读
  7. 2024年OceanBase数据库中级培训课程

    2024-06-09 10:40:02       9 阅读
  8. cocos入门9:三维向量点乘

    2024-06-09 10:40:02       11 阅读
  9. TypeScript 中的 tsconfig.json

    2024-06-09 10:40:02       7 阅读
  10. Tomcat 启动闪退问题解决方法

    2024-06-09 10:40:02       7 阅读
  11. WDF驱动开发-PNP和电源管理(二)

    2024-06-09 10:40:02       14 阅读
  12. Linux下tcpwrappers防火墙介绍

    2024-06-09 10:40:02       7 阅读
  13. Mysql的脏读、幻读、不可重复读

    2024-06-09 10:40:02       7 阅读