PyTorch张量拼接方式【附维度拼接/叠加的数学推导】

2024-07-17 06:10:03
开发
21

文章目录

1、简介
2、torch.cat
3、torch.stack
4、数学过程

🍃作者介绍：双非本科大三网络工程专业在读，阿里云专家博主，专注于Java领域学习，擅长web应用开发、数据结构和算法，初步涉猎人工智能和前端开发。
🦅个人主页：@逐梦苍穹
📕所属专栏：人工智能
🌻gitee地址：xzl的人工智能代码仓库
✈ 您的一键三连，是我创作的最大动力🌹

1、简介

张量拼接是将两个或多个张量沿指定维度连接起来的操作，这是在神经网络搭建过程中是非常常用的方法。
在深度学习和数据处理的过程中，经常需要将多个张量拼接成一个更大的张量。

张量拼接：

定义：张量拼接是将两个或多个张量沿着指定的维度连接起来，形成一个新的张量。
应用：常用于数据预处理、特征组合、模型输出处理等场景。
要求：被拼接的张量在非拼接维度上的形状必须一致。

2、torch.cat

torch.cat 函数可以将两个张量根据指定的维度拼接起来。

# -*- coding: utf-8 -*-
# @Author: CSDN@逐梦苍穹
# @Time: 2024/7/17 1:28
import torch


def test():
    data1 = torch.randint(0, 10, [3, 5, 4])
    data2 = torch.randint(0, 10, [3, 5, 4])
    print(data1)
    print(data2)
    print('-' * 50)
    # 1. 按0维度拼接
    new_data = torch.cat([data1, data2], dim=0)
    print(new_data.shape)
    print('-' * 50)
    # 2. 按1维度拼接
    new_data = torch.cat([data1, data2], dim=1)
    print(new_data.shape)
    # 3. 按2维度拼接
    new_data = torch.cat([data1, data2], dim=2)
    print(new_data)


if __name__ == '__main__':
    test()

运行结果：

E:\anaconda3\python.exe D:\Python\AI\PyTorch\11-张量拼接.py 
tensor([[[0, 7, 4, 8],
         [7, 7, 9, 6],
         [2, 6, 8, 2],
         [7, 1, 0, 3],
         [8, 0, 2, 4]],

        [[0, 1, 0, 9],
         [5, 1, 9, 8],
         [7, 8, 8, 5],
         [0, 6, 0, 0],
         [0, 8, 9, 2]],

        [[4, 2, 2, 3],
         [7, 9, 0, 9],
         [2, 7, 8, 8],
         [6, 9, 8, 5],
         [3, 6, 9, 8]]])
tensor([[[7, 2, 3, 8],
         [3, 1, 6, 3],
         [4, 0, 2, 8],
         [6, 9, 8, 9],
         [1, 1, 5, 2]],

        [[4, 0, 2, 2],
         [0, 0, 7, 4],
         [9, 3, 9, 2],
         [1, 5, 9, 5],
         [7, 5, 7, 6]],

        [[1, 8, 3, 9],
         [4, 2, 6, 4],
         [6, 6, 6, 9],
         [2, 5, 0, 5],
         [9, 0, 1, 2]]])
--------------------------------------------------
torch.Size([6, 5, 4])
--------------------------------------------------
torch.Size([3, 10, 4])
tensor([[[0, 7, 4, 8, 7, 2, 3, 8],
         [7, 7, 9, 6, 3, 1, 6, 3],
         [2, 6, 8, 2, 4, 0, 2, 8],
         [7, 1, 0, 3, 6, 9, 8, 9],
         [8, 0, 2, 4, 1, 1, 5, 2]],

        [[0, 1, 0, 9, 4, 0, 2, 2],
         [5, 1, 9, 8, 0, 0, 7, 4],
         [7, 8, 8, 5, 9, 3, 9, 2],
         [0, 6, 0, 0, 1, 5, 9, 5],
         [0, 8, 9, 2, 7, 5, 7, 6]],

        [[4, 2, 2, 3, 1, 8, 3, 9],
         [7, 9, 0, 9, 4, 2, 6, 4],
         [2, 7, 8, 8, 6, 6, 6, 9],
         [6, 9, 8, 5, 2, 5, 0, 5],
         [3, 6, 9, 8, 9, 0, 1, 2]]])

Process finished with exit code 0

3、torch.stack

torch.stack 函数可以将两个张量根据指定的维度叠加起来.

def test2():
    data1 = torch.randint(0, 10, [2, 3])
    data2 = torch.randint(0, 10, [2, 3])
    print(data1)
    print(data2)

    new_data = torch.stack([data1, data2], dim=0)
    print(new_data)
    print(new_data.shape)

    new_data = torch.stack([data1, data2], dim=1)
    print(new_data)
    print(new_data.shape)

    new_data = torch.stack([data1, data2], dim=2)
    print(new_data)
    print(new_data.shape)

输出：

E:\anaconda3\python.exe D:\Python\AI\PyTorch\11-张量拼接.py 
tensor([[4, 2, 9],
        [5, 2, 2]])
tensor([[8, 4, 7],
        [4, 7, 3]])
tensor([[[4, 2, 9],
         [5, 2, 2]],

        [[8, 4, 7],
         [4, 7, 3]]])
torch.Size([2, 2, 3])
tensor([[[4, 2, 9],
         [8, 4, 7]],

        [[5, 2, 2],
         [4, 7, 3]]])
torch.Size([2, 2, 3])
tensor([[[4, 8],
         [2, 4],
         [9, 7]],

        [[5, 4],
         [2, 7],
         [2, 3]]])
torch.Size([2, 3, 2])

Process finished with exit code 0

4、数学过程

维度拼接和维度叠加的本质区别：

维度拼接不改变矩阵维度
维度叠加会增加矩阵维度

4.1、维度拼接

先说结论：

维度拼接的本质，就是沿着轴方向进行拼接

轴的编号定义，由外往内依次为0，1，2，…，n

4.1.1、二维张量

先用简单的二维张量引入

假设有两个二维张量 A 和 B：
$\begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} ]$ $\begin{pmatrix} 5 & 6 \\ 7 & 8 \end{pmatrix} ]$
沿着第0维度（行）拼接，会将B的行追加到A的行后面：
$\text{cat}(A, B, \text{dim} = 0) = \begin{pmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \\ 7 & 8 \end{pmatrix} ]$
沿着第1维度（列）拼接，会将B的列追加到A的列后面：
$\text{cat}(A, B, \text{dim} = 1) = \begin{pmatrix} 1 & 2 & 5 & 6 \\ 3 & 4 & 7 & 8 \end{pmatrix} ]$

4.1.2、三维张量

假设我们有两个张量 $A$ 和 $B$ ，它们的形状都是 [3,5,4]。
这里我们使用以下符号表示它们的元素：
$A=a_{ijk}$ ； $B=b_{ijk}$
其中 $i$ 的范围是 [0,2]， $j$ 的范围是 [0,4]， $k$ 的范围是 [0,3]。
按 0 维度拼接
当我们沿着第 0 维度拼接时，新张量 $C$ 的形状变为 [6,5,4]。
具体来说，新张量 $C$ 的元素定义如下：
$C_{ijk} = \begin{cases} a_{ijk} & \text{if } i < 3 \\ b_{(i-3)jk} & \text{if } i \geq 3 \end{cases} ]$
这意味着新张量 $C$ 的前 3 个切片是 $A$ 的所有元素，接下来的 3 个切片是 $B$ 的所有元素。
按 1 维度拼接
当我们沿着第 1 维度拼接时，新张量 $D$ 的形状变为 [3,10,4]。
具体来说，新张量 $D$ 的元素定义如下：
$D_{ijk} = \begin{cases} a_{i(jk)} & \text{if } j < 5 \\ b_{i(j-5)k} & \text{if } j \geq 5 \end{cases} ]$
这意味着新张量 $D$ 的前 5 列是 $A$ 的所有列，接下来的 5 列是 $B$ 的所有列。
按 2 维度拼接
当我们沿着第 2 维度拼接时，新张量 $E$ 的形状变为 [3,5,8]。
具体来说，新张量 $E$ 的元素定义如下：
$E_{ijk} = \begin{cases} a_{ij(k)} & \text{if } k < 4 \\ b_{ij(k-4)} & \text{if } k \geq 4 \end{cases} ]$
这意味着新张量 $E$ 的前 4 个深度切片是 $A$ 的所有深度切片，接下来的 4 个深度切片是 $B$ 的所有深度切片。

4.1.3、具体实例

为了更好地理解，我们举个例子。假设：
$\begin{pmatrix} \begin{pmatrix} 1 & 2 & 3 & 4 \\ 5 & 6 & 7 & 8 \\ 9 & 10 & 11 & 12 \\ 13 & 14 & 15 & 16 \\ 17 & 18 & 19 & 20 \end{pmatrix} \\ \begin{pmatrix} 21 & 22 & 23 & 24 \\ 25 & 26 & 27 & 28 \\ 29 & 30 & 31 & 32 \\ 33 & 34 & 35 & 36 \\ 37 & 38 & 39 & 40 \end{pmatrix} \\ \begin{pmatrix} 41 & 42 & 43 & 44 \\ 45 & 46 & 47 & 48 \\ 49 & 50 & 51 & 52 \\ 53 & 54 & 55 & 56 \\ 57 & 58 & 59 & 60 \end{pmatrix} \end{pmatrix}$ ； $\begin{pmatrix} \begin{pmatrix} 101 & 102 & 103 & 104 \\ 105 & 106 & 107 & 108 \\ 109 & 110 & 111 & 112 \\ 113 & 114 & 115 & 116 \\ 117 & 118 & 119 & 120 \end{pmatrix} \\ \begin{pmatrix} 121 & 122 & 123 & 124 \\ 125 & 126 & 127 & 128 \\ 129 & 130 & 131 & 132 \\ 133 & 134 & 135 & 136 \\ 137 & 138 & 139 & 140 \end{pmatrix} \\ \begin{pmatrix} 141 & 142 & 143 & 144 \\ 145 & 146 & 147 & 148 \\ 149 & 150 & 151 & 152 \\ 153 & 154 & 155 & 156 \\ 157 & 158 & 159 & 160 \end{pmatrix} \end{pmatrix}$

按 0 维度拼接：

$\begin{pmatrix} A_{1,:,:} \\ A_{2,:,:} \\ A_{3,:,:} \\ B_{1,:,:} \\ B_{2,:,:} \\ B_{3,:,:} \end{pmatrix} ]$

按 1 维度拼接：

$\begin{pmatrix} A_{:,1,:} & B_{:,1,:} \\ A_{:,2,:} & B_{:,2,:} \\ A_{:,3,:} & B_{:,3,:} \\ A_{:,4,:} & B_{:,4,:} \\ A_{:,5,:} & B_{:,5,:} \end{pmatrix} ]$

按 2 维度拼接：

$\begin{pmatrix} A_{:,:,1} & B_{:,:,1} \\ A_{:,:,2} & B_{:,:,2} \\ A_{:,:,3} & B_{:,:,3} \\ A_{:,:,4} & B_{:,:,4} \end{pmatrix} ]$

这么看也许还是有些抽象，下面用画图的形式帮助理解。
三个轴由内到外：

零维拼接：

一维拼接：

二维拼接：

4.2、维度叠加

维度叠加中的0维、1维、2维叠加具体描述了在多维张量（tensor）操作中，如何将多个张量沿某个特定维度堆叠成一个新的更高维度的张量。通过例子和相应的 LaTeX 表达式，可以更清晰地理解这些操作。
维度叠加的概念
假设我们有两个形状相同的张量 A 和 B，形状为 [𝑑0,𝑑1,𝑑2][d0,d1,d2]。
维度叠加就是在现有维度基础上增加一个新的维度来合并这些张量。

假设矩阵 $A$ 和 $B$ 为：
$\begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix}$ ； $\begin{pmatrix} 7 & 8 & 9 \\ 10 & 11 & 12 \end{pmatrix}$

4.2.1、0维叠加

0维叠加表示在新增加的第0维度上堆叠多个张量。这会在现有张量的前面增加一个新维度。
操作： $C = s t a c k (A, B, d im = 0)$
结果： $\begin{pmatrix} \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix} \\ \begin{pmatrix} 7 & 8 & 9 \\ 10 & 11 & 12 \end{pmatrix} \end{pmatrix}$
新张量形状：[2,2,3]

4.2.2、1维叠加

1维叠加表示在第1维度上堆叠多个张量。这会在现有张量的第二个维度上增加一个新维度。
操作： $C = s t a c k (A, B, d im = 1)$
结果： $\begin{pmatrix} \begin{pmatrix} 1 & 2 & 3 \end{pmatrix} & \begin{pmatrix} 7 & 8 & 9 \end{pmatrix} \\ \begin{pmatrix} 4 & 5 & 6 \end{pmatrix} & \begin{pmatrix} 10 & 11 & 12 \end{pmatrix} \end{pmatrix}$
新张量形状：[2,2,3]

4.2.3、2维叠加（非常重要⭐）

2维叠加表示在第2维度上堆叠多个张量。这会在现有张量的第三个维度上增加一个新维度。
操作： $C = s t a c k (A, B, d im = 2)$
结果： $\begin{pmatrix} \begin{pmatrix} 1 & 7 \\ 2 & 8 \\ 3 & 9 \end{pmatrix} & \begin{pmatrix} 4 & 10 \\ 5 & 11 \\ 6 & 12 \end{pmatrix} \end{pmatrix}$
新张量形状：[2,3,2]

前面的都好理解，不再展开，
下面详解如何二位叠加。

维度叠加中的二维叠加意味着在第三个维度上堆叠张量。
这种叠加方式实际上增加了一个新维度，将两个张量的对应元素组合在一起。
具体来说，对于每个位置 $(i, j)$ ，新的张量在该位置上包含两个元素，一个来自 $A$ ，一个来自 $B$ 。

计算步骤：
对于位置 (1,1)： $A_{11}=1,B_{11}=7$
在2维叠加之后，新张量在位置 (1,1) 上的元素为： $C_{11} = \begin{pmatrix} 1 \\ 7 \end{pmatrix}$
对于位置 (1,2)： $A_{12}=2,B_{12}=8$
在2维叠加之后，新张量在位置 (1,2) 上的元素为： $C_{12}=\begin{pmatrix} 2 \\ 8 \end{pmatrix}$
对于位置 (1,3)： $A_{13}=3,B_{13}=9$
在2维叠加之后，新张量在位置 (1,3) 上的元素为： $C_{13}=\begin{pmatrix} 3 \\ 9 \end{pmatrix}$
继续这样处理所有位置，得到新的张量 $C$ 的形状为 [2,3,2]，每个位置上的元素包含两个来自原始张量的元素。
新张量 $C$ 的具体表示: $\begin{pmatrix} \begin{pmatrix} 1 & 7 \\ 2 & 8 \\ 3 & 9 \end{pmatrix} \\ \begin{pmatrix} 4 & 10 \\ 5 & 11 \\ 6 & 12 \end{pmatrix} \end{pmatrix}$

原文地址:https://blog.csdn.net/qq_60735796/article/details/140482053 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1813335309857984512.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部