中文诗歌生成

用transformer在诗歌集上训练出的模型

import os
os.environ["KERAS_BACKEND"] = "tensorflow"  # @param ["tensorflow", "jax", "torch"]
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

这是在500批次内训练的,我遵循从数据集的一部分到越来越大的训练方式

 上面是各种生成方式的结果

 这是在1500个批次上训练,每个批次64个诗歌样本

 上面是贪婪搜索,topk等搜索得到的生成结果

 

 

 下面是整个数据集,一共20多万样本,因为我过滤掉长度超过80的诗词,训练两个轮次后

 

 

 

 

 

 

 

 

 

 

相关推荐

  1. Spring Boot 生产就绪中文文档-下

    2024-07-22 13:50:02       44 阅读
  2. Spring Boot 生产就绪中文文档-上

    2024-07-22 13:50:02       52 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-22 13:50:02       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-22 13:50:02       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-22 13:50:02       45 阅读
  4. Python语言-面向对象

    2024-07-22 13:50:02       55 阅读

热门阅读

  1. Python @staticmethod、super().__init__()和self

    2024-07-22 13:50:02       18 阅读
  2. WHAT - 通过 shadcn 组件源码学习 React

    2024-07-22 13:50:02       14 阅读
  3. 探索 PHP 与 JD 详情 API 接口的连接奥秘

    2024-07-22 13:50:02       21 阅读
  4. 多个返回值QT/C++

    2024-07-22 13:50:02       17 阅读
  5. C# --- .Net Framework中的Binding Redirect

    2024-07-22 13:50:02       20 阅读
  6. 深入语音识别:贝叶斯准则的细致解析

    2024-07-22 13:50:02       18 阅读
  7. 从统计学、到机器学习和ChatGPT

    2024-07-22 13:50:02       18 阅读
  8. MobaXterm远程工具

    2024-07-22 13:50:02       21 阅读