论文阅读【时间序列】DSformer

论文阅读【时间序列】DSformer

arxive: DSformer: A Double Sampling Transformer for Multivariate Time Series Long-term Prediction
github: MTST

分类:多变量时间序列(Multivariate time series)

核心观点

多变量时间序列3个维度信息

Fig 1

  1. 变量间关联(Variable correlation):如Fig. 1(a)所示,不同变量具有相似的变化趋势 → \rightarrow Variable Attention
  2. 全局信息(Global information):如Fig. 1(b)所示,从全局来看,序列显示出一定的周期性 → \rightarrow Down Sampling
  3. 局部信息(Local information):如Fig. 1©所示,局部信息 → \rightarrow Piecewise Sampling

个人观点:全局信息更多指周期项,局部信息更多指趋势项

整体框架

Fig 2

符号 含义
N 变量数
H 输入序列长度
L 输出序列长度
C 切分子序列数量

N 为变量数,H为输入序列长度,C是切分子序列的数量。
输入序列 X ∈ R N ∗ H X \in R^{N*H} XRNH,经过Down sampling得到 X d s ∈ R N ∗ C ∗ H C X_{ds} \in R ^{N * C * \frac{H}{C}} XdsRNCCH,经过Picewise Sampling得到 X p s ∈ R N ∗ C ∗ H C X_{ps} \in R ^{N * C * \frac{H}{C}} XpsRNCCH
TVA-block中进行Variable AttentionTemporal Attention。其中Temporal Attention Q ∈ R N ∗ C ∗ H C Q \in R ^{N * C * \frac{H}{C}} QRNCCH, K ∈ R N ∗ H C ∗ C K \in R ^{N * \frac{H}{C} *C} KRNCHCVariable Attention Q ∈ R H C ∗ C ∗ N Q \in R ^{\frac{H}{C} * C * N} QRCHCN, K ∈ R ∗ H C ∗ N ∗ C K \in R ^{ * \frac{H}{C} *N *C} KRCHNC

Temporal Attention是子序列之间,通过比较同一变量子序列的相似度计算注意力,Variable Attention是不同子序列之间,通过比较同一位置各个变量的相似度计算注意力。

随后,Temporal AttentionVariable Attention输出 X ′ ∈ R N ∗ C ∗ H C X' \in R ^{N * C * \frac{H}{C}} XRNCCH被FFN压缩成 X ′ ∈ R N ∗ H C X' \in R ^{N * \frac{H}{C}} XRNCH,然后相加。
最后,经过一个TVA-block整理来自不同视角的信息(Down samplingPicewise Sampling)和MLP得到输出。

采样过程

Fig 3

两种采样方式的区别在于如何将切分后的子序列重新排列。

  • Down Sampling: 每隔几个点取一个,用来捕获全局信息
    X d s j = [ x j , x j + H C , x j + 2 ∗ H C , . . . , x j + ( C − 1 ) ∗ H C ] X^j_{ds} = [x_j, x_{j+\frac{H}{C}}, x_{j+2*\frac{H}{C}},..., x_{j+(C-1)*\frac{H}{C}}] Xdsj=[xj,xj+CH,xj+2CH,...,xj+(C1)CH]
  • Piecewise Sampling:
    X p s j = [ x 1 + ( j − 1 ) ∗ C , x 2 + ( j − 1 ) ∗ C , x 3 + ( j − 1 ) ∗ C , . . . , x j ∗ C ] X^j_{ps} = [x_{1+(j-1)*C}, x_{2+(j-1)*C}, x_{3+(j-1)*C},..., x_{j*C}] Xpsj=[x1+(j1)C,x2+(j1)C,x3+(j1)C,...,xjC]

TVA block

Fig4
两种attention的主要区别在于X的维度变化:

  • Temporal Attention: Q ∈ R N ∗ C ∗ H C Q \isin R^{N * C * \frac{H}{C}} QRNCCH, K ∈ R N ∗ H C ∗ C K \isin R^{N * \frac{H}{C} * C} KRNCHC
  • Variable Attention: Q ∈ R H C ∗ C ∗ N Q \isin R^{ \frac{H}{C} * C * N} QRCHCN, K ∈ R H C ∗ N ∗ C K \isin R^{ \frac{H}{C} * N * C} KRCHNC

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-10 00:48:03       49 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-10 00:48:03       53 阅读
  3. 在Django里面运行非项目文件

    2024-07-10 00:48:03       42 阅读
  4. Python语言-面向对象

    2024-07-10 00:48:03       53 阅读

热门阅读

  1. Linux grep技巧 结合awk查询

    2024-07-10 00:48:03       14 阅读
  2. Appium:强大的移动应用测试工具

    2024-07-10 00:48:03       19 阅读
  3. 宝塔-Linux模板常用命令-centos7

    2024-07-10 00:48:03       15 阅读
  4. 仙人掌中的SNMP检测不到服务器

    2024-07-10 00:48:03       18 阅读
  5. 算法力扣刷题 三十四【71.简化路径】

    2024-07-10 00:48:03       18 阅读
  6. yolov5:Conv类参数量计算

    2024-07-10 00:48:03       23 阅读
  7. GitHub每日最火火火项目(7.9)

    2024-07-10 00:48:03       19 阅读
  8. py基础语法简述

    2024-07-10 00:48:03       16 阅读
  9. 代码随想录算法训练营:20/60

    2024-07-10 00:48:03       19 阅读
  10. 【6-1:全链路压测】

    2024-07-10 00:48:03       19 阅读
  11. 识别色带后执行相应命令

    2024-07-10 00:48:03       17 阅读