昇思25天学习打卡营第十六天|基于MindSpore的GPT2文本摘要

不知不觉已经到了第16天,打卡营已经时间过半了。今天学的内容是GPT2文本摘要,记录一下:

基于MindSpore的GPT2文本摘要

数据集加载与处理

  1. 数据集加载

    本次实验使用的是nlpcc2017摘要数据,内容为新闻正文及其摘要,总计50000个样本。

  2. 数据预处理

    原始数据格式:

    article: [CLS] article_context [SEP]
    summary: [CLS] summary_context [SEP]
    

    预处理后的数据格式:

    [CLS] article_context [SEP] summary_context [SEP]
    

    因GPT2无中文的tokenizer,我们使用BertTokenizer替代。

模型构建

  1. 构建GPT2ForSummarization模型,注意shift right的操作。
  2. 动态学习率

模型训练

模型推理

数据处理,将向量数据变为中文数据

model = GPT2LMHeadModel.from_pretrained('./checkpoint/gpt2_summarization_epoch_0.ckpt', config=config)
model.set_train(False)
model.config.eos_token_id = model.config.sep_token_id
i = 0
for (input_ids, raw_summary) in test_dataset.create_tuple_iterator():
    output_ids = model.generate(input_ids, max_new_tokens=50, num_beams=5, no_repeat_ngram_size=2)
    output_text = tokenizer.decode(output_ids[0].tolist())
    print(output_text)
    i += 1
    if i == 1:
        break

在这里插入图片描述

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-11 23:40:06       66 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-11 23:40:06       70 阅读
  3. 在Django里面运行非项目文件

    2024-07-11 23:40:06       57 阅读
  4. Python语言-面向对象

    2024-07-11 23:40:06       68 阅读

热门阅读

  1. AIGC各个应用场景下的模型选择

    2024-07-11 23:40:06       24 阅读
  2. 在Linux中使用Typora将Markdown文档导出为docx格式

    2024-07-11 23:40:06       18 阅读
  3. 编程语言与数据结构的关系:深度解析与探索

    2024-07-11 23:40:06       21 阅读
  4. 华为OD机考题(HJ108 求最小公倍数)

    2024-07-11 23:40:06       18 阅读
  5. 探究kubernetes 探针参数periodSeconds和timeoutSeconds

    2024-07-11 23:40:06       24 阅读
  6. 《大语言模型》赵鑫

    2024-07-11 23:40:06       20 阅读
  7. C++ 例外处理 try throw catch

    2024-07-11 23:40:06       24 阅读
  8. ts和js的关系

    2024-07-11 23:40:06       25 阅读
  9. 单商户和多商户的区别

    2024-07-11 23:40:06       22 阅读
  10. 对比多种方法执行命令行命令

    2024-07-11 23:40:06       21 阅读
  11. 白骑士的C++教学基础篇 1.5 数据结构

    2024-07-11 23:40:06       21 阅读