Hugging Face实战-系列教程20:文本摘要建模实战2 之 Tokenizer处理

🚩🚩🚩Hugging Face 实战系列 总目录

有任何问题欢迎在下面留言
本篇文章的代码运行界面均在Jupyter Notebook中进行
本篇文章配套的代码资源已经上传

文本摘要建模实战1 之 数据清洗
文本摘要建模实战2 之 Tokenizer处理

3 Tokenizer处理

  • 注意需要先pip install sentencepiece这个包(装完之后重启下这个notebook)
  • 应该是mt5这个没有fast实现方法,所以需要借助这个包
from transformers import AutoTokenizer
model_checkpoint = "google/mt5-small"
tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)

文本摘要建模实战1 之 数据清洗
文本摘要建模实战2 之 Tokenizer处理

相关推荐

  1. TensorFlow2实战-系列教程12:RNN文本分类4

    2023-12-19 06:22:05       34 阅读
  2. pytorch+huggingface+bert实现一个文本分类

    2023-12-19 06:22:05       32 阅读
  3. pytorch-textsummary,中文文本摘要实践

    2023-12-19 06:22:05       35 阅读
  4. TensorFlow2实战-系列教程14:Resnet实战2

    2023-12-19 06:22:05       43 阅读
  5. TensorFlow2实战-系列教程 总目录

    2023-12-19 06:22:05       41 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-19 06:22:05       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-19 06:22:05       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-19 06:22:05       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-19 06:22:05       20 阅读

热门阅读

  1. serializable和parcelable的区别(GPT回答)

    2023-12-19 06:22:05       39 阅读
  2. 读写分离之同步延迟测试

    2023-12-19 06:22:05       52 阅读
  3. 【mask转json】文件互转

    2023-12-19 06:22:05       54 阅读
  4. Linux 命令大全备忘录

    2023-12-19 06:22:05       47 阅读
  5. 基于三维点云处理技术的工件识别和匹配

    2023-12-19 06:22:05       39 阅读