Mamba-2 Error: ‘NoneType‘ object has no attribute ‘causal_conv1d_fwd‘已解决!!!

  在网上试了很多解决办法,终于解决。

1.安装

想要运行mamba-2,需要安装causal-conv1d>=1.4.0这是官方github中说的。

GitHub - state-spaces/mamba: Mamba SSM architecture

关于mamba_ssm版本我安装了2.2.2

下图是我安装的两个版本,

注意:我选择的是两个FALSE版本,我第一次安装的时候causal-conv1d选择了TRUE版本所以出现了上述问题。后面,我卸载了之后重装了FALSE版本就没有这个问题了。

还有就是,如果你是第一次安装可以参考我之前写的博客。

https://blog.csdn.net/lihaiyuan_0324/article/details/138076262icon-default.png?t=N7T8https://blog.csdn.net/lihaiyuan_0324/article/details/138076262

如果你是已经安装过1.0版本的,最好是先卸载在装1.0版本的,因为我第一次没卸载1.0,直接安装1.4还是出现了标题的问题,但是后面卸载后重装就没有这个问题了。

causal-conv1d:

mamba_ssm:Releases · state-spaces/mamba · GitHub

2.AttributeError: module 'triton.language' has no attribute 'cumsum'

我解决标题的问题之后,又出现了,上述问题。

按照作者的回复,Please use triton >= 2.1.0

我安装了triton = 2.2.0

就成功了。

3.测试代码

import torch
from mamba_ssm import Mamba

batch, length, dim = 2, 64, 16
x = torch.randn(batch, length, dim).to("cuda")
model = Mamba(
    # This module uses roughly 3 * expand * d_model^2 parameters
    d_model=dim,  # Model dimension d_model
    d_state=16,  # SSM state expansion factor
    d_conv=4,  # Local convolution width
    expand=2,  # Block expansion factor
).to("cuda")
y = model(x)
print("Mamba result", y.shape)
assert y.shape == x.shape

import torch
from mamba_ssm import Mamba2

batch, length, dim = 2, 64, 512
x = torch.randn(batch, length, dim).to("cuda")
model = Mamba2(
    # This module uses roughly 3 * expand * d_model^2 parameters
    # make sure d_model * expand / headdim = multiple of 8
    d_model=dim,  # Model dimension d_model
    d_state=64,  # SSM state expansion factor, typically 64 or 128
    d_conv=4,  # Local convolution width
    expand=2,  # Block expansion factor
    headdim=64,  # default 64
).to("cuda")
y = model(x)
print("Mamba2 result", y.shape)
assert y.shape == x.shape

以下是运行结果

Mamba result torch.Size([2, 64, 16])
Mamba2 result torch.Size([2, 64, 512])

希望可以帮助到你!

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-19 18:24:02       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-19 18:24:02       71 阅读
  3. 在Django里面运行非项目文件

    2024-07-19 18:24:02       58 阅读
  4. Python语言-面向对象

    2024-07-19 18:24:02       69 阅读

热门阅读

  1. go exporter开发 第一篇

    2024-07-19 18:24:02       17 阅读
  2. ubuntu23安装tensorRT步骤记录

    2024-07-19 18:24:02       18 阅读
  3. Unable to connect to Redis] with root cause

    2024-07-19 18:24:02       18 阅读
  4. redis时间环结构-时序特征

    2024-07-19 18:24:02       19 阅读
  5. 欢迎来到 Mint Expedition:Web3 和 NFT 的新时代开始

    2024-07-19 18:24:02       23 阅读
  6. MySQL运算符

    2024-07-19 18:24:02       22 阅读
  7. 【gradle中如何不使用插件将依赖打进jar包】

    2024-07-19 18:24:02       18 阅读
  8. web前端面向对象面试25题

    2024-07-19 18:24:02       18 阅读
  9. 【编程语言】C++和C的异同点

    2024-07-19 18:24:02       20 阅读
  10. 【React Hooks原理 - useSyncExternalStore】

    2024-07-19 18:24:02       14 阅读