NLP经典入门论文

1.基础部分

Word2Vec

Efficient Estimation of Word Representations in Vector Space

https://arxiv.org/abs/1301.3781v3

Transformer

attention is all you need

https://arxiv.org/abs/1706.03762

BERT

Pre-training of Deep Bidirectional Transformers for Language Understanding

https://arxiv.org/abs/1810.04805

ERNIE

https://arxiv.org/pdf/1904.09223

GPT

gpt1: Improving Language Understanding by Generative Pre-Training 

gpt2: Language Models are Unsupervised Multitask Learners

gpt3: Language Models are Few-Shot Learners

2.进阶部分

roberta模型

RoBERTa: A Robustly Optimized BERT Pretraining Approach

相关推荐

  1. NLP经典入门论文

    2024-05-11 11:12:06       13 阅读
  2. NLP9-Transformer经典案例】

    2024-05-11 11:12:06       18 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-05-11 11:12:06       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-05-11 11:12:06       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-05-11 11:12:06       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-05-11 11:12:06       20 阅读

热门阅读

  1. 蓝桥杯备战4.双子数

    2024-05-11 11:12:06       10 阅读
  2. 程序员必须学会的道理,少走十年弯路!

    2024-05-11 11:12:06       13 阅读
  3. c#文心接口应用举例

    2024-05-11 11:12:06       12 阅读
  4. 从零开始学习MySQL 事务处理

    2024-05-11 11:12:06       10 阅读
  5. ubuntu 查看 postgresql 用户

    2024-05-11 11:12:06       12 阅读
  6. 商品购物车数据以店铺id为key,组合对应的数据

    2024-05-11 11:12:06       12 阅读
  7. 1、搭建TS开发环境(利用rollup)

    2024-05-11 11:12:06       13 阅读
  8. python dict赋值时有逗号自动变成元组

    2024-05-11 11:12:06       12 阅读
  9. 每天一个数据分析题(三百一十九)-图表

    2024-05-11 11:12:06       10 阅读
  10. 【前端每日一题】 day3

    2024-05-11 11:12:06       13 阅读
  11. 深度学习中超参数设置

    2024-05-11 11:12:06       10 阅读