下载huggingface中数据集/模型(保存到本地指定路径)

一. snapshot_download

# 1.安装huggingface_hub
# pip install huggingface_hub


import os

from huggingface_hub import snapshot_download


print('downloading entire files...')
# 注意,这种方式仍然保存在cache_dir中
snapshot_download(repo_id="ibrahimhamamci/CT-RATE", repo_type="dataset",
                  local_dir="本地路径",
                  local_dir_use_symlinks=False, resume_download=True,
                  token='hf_***')


# 保存到特定的路径
snapshot_download(repo_id="ibrahimhamamci/CT-RATE", repo_type="dataset",
                  cache_dir="本地路径",
                  local_dir_use_symlinks=False, resume_download=True,
                  token='hf_***')



# download single file...,下载单个文件
# from huggingface_hub import hf_hub_download
# hf_hub_download(repo_id="ibrahimhamamci/CT-RATE", filename='config.json', 
#                 repo_type="dataset", filename='....',
#                 local_dir="/home/miao/data/dataset/CT-RATE/dataset/train",
#                 local_dir_use_symlinks=False, resume_download=True,
#                 force_download=False, subfolder='dataset/train/train_10006')

注意事项:

  • 获取token的网址
  • 下图的repo_id为“google/gemma-7b”

二.  huggingface-cli

# 1.安装huggingface-cli
# pip install -U "huggingface[cli]"
# 命令行输入:huggingface-cli -h,可以查看对应的帮助文档

# 2.下载模型
# 注意,模型仍然保存在cache_dir文档中
huggingface-cli download --token hf_*** --resume-download meta-llama/Llama-2-7b-hf --local-dir Llama-2-7b-hf

# 3.下载数据集
# 这种方式,数据集会保存到"/home/local-dir/"中
huggingface-cli download --repo-type dataset --token hf_** --resume-download ibrahimhamamci/CT-RATE --cache-dir /home/local-dir --local-dir-use-symlinks False

三.总结

1.若需要将数据集/模型放在指定路径,需要指定"cache-dir"参数,而不是“local-dir”

2.直接从huggingface中下载对应的模型和数据集,需要外网。因此可以使用国内镜像“HF-Mirror - Huggingface 镜像站

四.参考

[1] HF-Mirror - Huggingface 镜像站

相关推荐

  1. HuggingFace模型下载

    2024-03-31 01:20:03       21 阅读
  2. HuggingFace模型与文件下载

    2024-03-31 01:20:03       18 阅读
  3. unity(WebGL) 把截图保存下载本地

    2024-03-31 01:20:03       39 阅读
  4. mysql每天自动将数据库数据保存指定文件夹

    2024-03-31 01:20:03       14 阅读
  5. 优雅的从HuggingFace下载模型

    2024-03-31 01:20:03       28 阅读
  6. Huggingface镜像网站下载语言模型方法

    2024-03-31 01:20:03       34 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-03-31 01:20:03       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-03-31 01:20:03       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-03-31 01:20:03       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-03-31 01:20:03       18 阅读

热门阅读

  1. kubernetes(K8S)学习(八):K8S之常见部署方案

    2024-03-31 01:20:03       18 阅读
  2. PreparedStatement对象

    2024-03-31 01:20:03       15 阅读
  3. Acwing 1238.日志统计 双指针

    2024-03-31 01:20:03       17 阅读
  4. 对象数组与指针与引用

    2024-03-31 01:20:03       18 阅读
  5. css之flex布局文本不换行不显示省略号的解决方法

    2024-03-31 01:20:03       18 阅读
  6. 09、Lua 运算符

    2024-03-31 01:20:03       16 阅读
  7. SpringMVC源码分析(六)--参数名称解析器

    2024-03-31 01:20:03       18 阅读
  8. Web框架开发-Django-form组件

    2024-03-31 01:20:03       19 阅读