NLP学习与踩坑记录(持续更新版)

本博客记录了博主在学习NLP时遇到了各种各样的问题与解决方法,供大家参考,希望踩过的坑不踩第二次!

OSError: Can’t load tokenizer for ‘bert-base-uncased’.

tokenizer = BertTokenizer.from_pretrained("bert-base-uncased", truncation_side=truncation_side)

博主在调用上述代码时出现此报错,原因是在国内因为网络问题无法下载huggingface上的模型。
解决办法一:检查自己的网络,在国内需要使用VPN保证可以访问huggingface,然后重新运行代码。若不行,将模型下载到本地,再重新运行代码。

huggingface-cli download --resume-download google-bert/bert-base-cased --local-dir /home/user/bert-base-cased

解决办法二:使用modelscope上的镜像,速度较快,但可能存在一些huggingface上的模型modelscope上没有。

# pip install modelscope
from modelscope.hub.snapshot_download import snapshot_download
llm = snapshot_download('AI-ModelScope/bert-base-uncased')
tokenizer = BertTokenizer.from_pretrained(llm, truncation_side=truncation_side)

解决办法三:Colab下载转移至Google Drive上,再从Google Drive上下载。

google.protobuf.message.DecodeError: Error parsing message

原因是通过git clone命令直接下载,并没有下载到正确的模型参数文件,只是一个文本文档,解决方法是下载huggingface上的模型需要使用huggingface-cli工具。

# 错误的下载方式
git clone https://huggingface.co/bert-base-uncased
# 正确的下载方式
pip install huggingface_hub
huggingface-cli download --resume-download [model_name] --local-dir [local path] 
# eg: huggingface-cli download --resume-download google-bert/bert-base-cased --local-dir /home/user/

Deepspeed

相关推荐

  1. NLP学习记录持续更新版)

    2024-06-18 12:32:03       8 阅读
  2. 深度学习记录持续更新)

    2024-06-18 12:32:03       19 阅读
  3. 深度学习记录

    2024-06-18 12:32:03       38 阅读
  4. nacos新版

    2024-06-18 12:32:03       10 阅读
  5. mySQL记录

    2024-06-18 12:32:03       44 阅读
  6. Pinia 记录

    2024-06-18 12:32:03       35 阅读
  7. golang记录

    2024-06-18 12:32:03       20 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-18 12:32:03       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-18 12:32:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-18 12:32:03       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-18 12:32:03       20 阅读

热门阅读

  1. Eureka 概述与 Eureka Server 配置

    2024-06-18 12:32:03       9 阅读
  2. 如何更改電腦的IP地址?

    2024-06-18 12:32:03       6 阅读
  3. 几分钟带你初步了解人工智能

    2024-06-18 12:32:03       9 阅读
  4. AI大模型争霸:通用vs垂直,谁主沉浮?

    2024-06-18 12:32:03       11 阅读
  5. redis穿透解决方案

    2024-06-18 12:32:03       6 阅读
  6. CPU与GPU的原理不同

    2024-06-18 12:32:03       6 阅读
  7. MySQL触发器基本结构

    2024-06-18 12:32:03       11 阅读
  8. OpenCV之cv::createTrackbar

    2024-06-18 12:32:03       9 阅读
  9. 数据持久层与 SQL 注入

    2024-06-18 12:32:03       8 阅读
  10. React useContext

    2024-06-18 12:32:03       6 阅读
  11. elementUI实现上传excel文件并传给后端

    2024-06-18 12:32:03       8 阅读
  12. 数据库-单表查询-基本查询

    2024-06-18 12:32:03       7 阅读
  13. GDB使用

    2024-06-18 12:32:03       5 阅读