[论文笔记] PAI-Megatron中qwen和mistral合并到Megtron-LM

一、千问

        关于tokenizer的改动:

1.1、更改build_tokenizer中tokenizer类的加载。

        /mnt/nas/pretrain/code/Megatron-LM/megatron/tokenizer/__init__.py 或者 tokenizer.py

        在build_tokenizer.py函数中:

​
    elif args.tokenizer_type == "QwenTokenizer":
        assert args.tokenizer_name_or_path is not None
        from .tokenization_qwen import QWenTokenizer
        tokenizer = QWenTokenizer.from_pretrained(
            args.tokenizer_name_or_path,
            model_max_length=args.seq_length,
            padding_side='right',
            use_fast=False,
        )
        tokenizer.pad_token_id = tokenizer.pad_id
        tokenizer.eos_token_id = tokenizer.eod_id
        args.padded_vocab_size = tokenizer.vocab_size + args.extra_vocab_size

​

 1.2、dlc时创建主函数.sh文件 or debug时更改主函数参数命名

        debug时

最近更新

  1. TCP协议是安全的吗?

    2024-01-13 11:08:03       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-13 11:08:03       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-13 11:08:03       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-13 11:08:03       18 阅读

热门阅读

  1. openssl3.2 - 官方demo学习 - client-conf.c

    2024-01-13 11:08:03       31 阅读
  2. Python中的图像处理和计算机视觉应用

    2024-01-13 11:08:03       35 阅读
  3. PyQt UI 信号槽函数重复执行问题

    2024-01-13 11:08:03       35 阅读
  4. Spring面试题目

    2024-01-13 11:08:03       31 阅读
  5. vue实现小球掉落

    2024-01-13 11:08:03       41 阅读
  6. opencv在linux上的编译

    2024-01-13 11:08:03       33 阅读
  7. 数据结构之基本数据类型(Python)

    2024-01-13 11:08:03       34 阅读