git lfs使用(huggingface下载大模型文件)

0、git lfs是Git的一个扩展工具,用于管理大型文件(如音视频文件、数据集等),避免将它们存储在Git仓库中,而是单独存储在Git LFS服务器上。
1. 安装

Linux安装步骤

curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
sudo apt-get install git-lfs
git lfs install

2. 下载HuggingFace文件

最近在看BLOOM,但是Huggingface的仓库里除了我想要的pytoch_model_xxxxx.bin,放了一些别的格式的checkpoints,全部下载的话太大了,而且很慢很慢

2.1 首先通过git下载小文件
git lfs install
GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/bigscience/bloom-7b1

需要注意,GIT_LFS_SKIP_SMUDGE=1和后面的git clone必须在同一行才能生效,表示不下载大文件(小文件、大文件的区分依据是有没有使用git lfs)。

此时git会下载所有的小文件,比如tokenizer.json ,但是对于git lfs存储的大文件,只会存储一个文本的pointer file.

2.2 手动pull需要的大文件
由于我只需要仓库里的pytorch_model-00001-of-00002.bin和pytorch_model-00002-of-00002.bin ,所以可以这样写:
注意:此处需要进入到下载的文件夹中:

cd bloom-7b1
git lfs pull --include="*.bin"

此时*.bin会匹配这两个文件,然后等着他下载完毕就可以了。

如果你只想要单个文件,写文件名就可以。

3. 另外一种方式:下载HuggingFace全部文件(包括大小文件)

命令:

git lfs install
git lfs clone https://huggingface.co/bigscience/bloom-7b1

4. git lfs 下载中断了,继续下载的命令 

git lfs fetch
5、命令对比解释:

相关推荐

  1. git lfs使用huggingface下载模型文件

    2024-04-06 13:12:01       17 阅读
  2. 下载huggingface上的模型文件

    2024-04-06 13:12:01       6 阅读
  3. HuggingFace模型文件下载

    2024-04-06 13:12:01       18 阅读
  4. HuggingFace模型下载

    2024-04-06 13:12:01       23 阅读
  5. 优雅的从HuggingFace下载模型

    2024-04-06 13:12:01       31 阅读
  6. Huggingface镜像网站下载语言模型方法

    2024-04-06 13:12:01       35 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-06 13:12:01       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-06 13:12:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-06 13:12:01       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-06 13:12:01       20 阅读

热门阅读

  1. loopvar 改动不同版本的影响-大循环的执行时间

    2024-04-06 13:12:01       15 阅读
  2. ETCD备份方案制定

    2024-04-06 13:12:01       14 阅读
  3. ubuntu23设置kibana后台启动服务

    2024-04-06 13:12:01       16 阅读
  4. netty+websocket实现简易聊天

    2024-04-06 13:12:01       17 阅读
  5. 如何在Bash中比较数字

    2024-04-06 13:12:01       17 阅读
  6. 正弦实时数据库的应用(1)-数字孪生

    2024-04-06 13:12:01       15 阅读
  7. 623: 程序设计C 实验五 题目六 排序查找(python)

    2024-04-06 13:12:01       14 阅读