吴恩达 x Open AI ChatGPT ——如何写出好的提示词视频核心笔记

核心知识点脑图如下:

61e3f6438a13b00316b5a5b833081117.png

1、第一讲:课程介绍

  • 要点1:

13a1c789349524b21b2d4adb490ee273.png

上图展示了两种大型语言模型(LLMs)的对比:基础语言模型(Base LLM)和指令调整语言模型(Instruction Tuned LLM)。

基础语言模型(Base LLM)

功能:基础语言模型能够预测下一个单词,这种预测是基于文本训练数据。

例子:图中提供了一个故事的开头:“Once upon a time, there was a unicorn that lived in a magical forest with all her unicorn friends(中文释义:从前,有一只独角兽和她所有的独角兽朋友住在魔法森林里)”,这展示了模型如何根据给定的文本继续生成故事。问答能力:它能够回答基础的问题,例如“法国的首都是什么?”,但它可能会产生问题文本,如有害输出,这些输出与基础语言模型的性质有关,因为它们仅基于预测下一个最可能的单词,而不是遵循特定的指令。

指令调整语言模型(Instruction Tuned LLM)

  • 功能:这种模型试图遵循指令,它通过在指令上进行微调(fine-tuning,周鸿祎大佬经常讲),并在尝试遵循这些指令时进行优化。

  • 微调方法:使用RLHF(Reinforcement Learning with Human Feedback,中文释义:人类反馈强化学习)进行微调,即结合强化学习和人类反馈。

313682619e9dd0c09d039847e285f742.jpeg

  • 三H原则:帮助(Helpful)、诚实(Honest)、无害(Harmless)。

例子:当问到“法国的首都是什么?”时,指令调整的模型会更准确地回答“法国的首都是巴黎”。

总结来说,图中的主要区别在于基础模型侧重于文本数据的下一个词预测,而指令调整模型则侧重于理解和遵循指令,提供更准确、更有用、更安全的输出。

2、第二讲:使用准则

  • 要点1:好提示词的第一个原则——写出清晰且准确的提示

49d5ff10dc0419905e89ae494f5963a5.png

指令必须清晰的三个核心原因:

核心一——避免歧义:清晰的指令让机器没有猜测的空间,可以直接执行。

核心二——提高效率:清晰的指令可以让机器快速理解并采取行动,节约时间。

核心三——确保结果准确:指令清晰可以确保机器提供的结果是我们所期待的。

aea74f28c19d5c3b3bf88ac4249ac62f.png
  • 要点2:好提示词的第一个原则——给大模型思考的时间

3496e31bfe0627dbaa5f00f825c7cd72.png

要点2所说的“给大模型思考的时间”,其实是在指导我们如何更高效地与大型语言模型(如我)进行交互。

下面是三个核心要点的解读:

119dd85b47b52a5806852075350f1830.jpeg

(1)等待模型回应:

模型需要时间处理你的请求和生成回答,就像你向朋友提问后要等待他们思考并回答一样。

(2)避免打断:

在模型回答之前不要急于提出新问题,这就像不打断别人说话,给对方完成表达的机会。

这个一般模型也不允许。

(3)逐步提问

如果有复杂的问题,可以分步骤提问,让模型逐一解决,就像解难题一样,一步一个脚印来解答。

这是最核心的,大问题务必精准拆解成小问题,且根据回复逐步调优

3、第三讲:提示词不是一步到位的,而通过反复迭代逐步完善的。

97d74eba42d22ccb8dde629b3b253f45.png

吴恩达老师“这幅图展示了一个名为“迭代式提示开发”的循环流程图,它代表一个反馈循环,用于改进和完善提示(可能是编程、数据输入或任何需要精确指示的场合)的质量。流程由四个主要部分组成:

eb3db229a52ecdae9d9c8e8c692a14da.jpeg

1、Idea(想法): 这是流程的开始阶段,你需要有一个初始想法或设计,这将成为你的起始点。

2、Implementation (code/data) Prompt(实现(代码/数据)提示): 根据想法,你会创建一个初步的提示,如果是编程领域,可能是编写代码或准备数据输入。

3、Experimental result(实验结果): 使用你的提示进行实验后,你将获得某些结果,这些结果可能会或不会符合你的预期。

4、Error Analysis(错误分析): 如果结果不符合预期,你需要进行错误分析,查找为什么会出现这样的结果,可能是提示不够清晰、具体或存在逻辑错误。

这个过程是迭代的,意味着你会不断重复这个循环,每一次都根据之前的反馈来调整和改进你的提示,直到实验结果符合你的预期。

图下方的“Prompt guidelines”列出了优化提示时应遵循的指导原则:

1、Be clear and specific(要清晰和具体): 提示需要有足够的详细信息,避免歧义——这点反复强调过了。

2、Analyze why result does not give desired output(分析为什么结果不符合预期输出): 当结果不如意时,深入分析原因(模型会分析,咱们也不要坐等,要结合经验进行分析),理解导致结果偏差的因素。

3、Refine the idea and the prompt(改进想法和提示): 根据分析结果调整你的想法和提示。

4、Repeat(重复): 不断重复这一过程(反复迭代),每次都尝试提高提示的有效性。

这个流程是设计思维和敏捷开发的典型,强调持续改进和适应性。

4、第四讲:最兴奋的功能——文本总结

为大段文本形成摘要,以便我们快速的获取信息。

新版GPT4最多能让用户输入3万2千token(大概50页英文文字长度,网上说法大约25000字)。

5、第五讲:模型推理:

省去了早期开发需要自己训练模型的工作,现在一个API搞定!

49414c772b6fcf4b0b601abf71b68e2d.png

6、第六讲:格式转化 Transforming

cac746cff1da136ac8736f055e1fa318.png
  • Html 转 JSON等各种转换:原来咱们用复杂的正则,现在大模型API快速搞定。

  • 校对写的所有内容:论文、评论、文稿等。

  • 支持各种语言的翻译

  • GPT4 的图片转文本,文本转图片功能也非常强大。

af4232a59827e674db38142b6c928689.jpeg

7、第7讲:文本扩写

31331db014e5874342d29b3fb893daf2.png
  • Chatgpt可以作为头脑风暴的伙伴,基于我们的提示词展开文本扩写。

  • 建议负责任的使用,比如:不要生成垃圾邮件。

  • 可用于文档助理,比如:邮件助理。

b21616a11d8bcb1744d9d62a1b0db3b4.jpeg

8、第8讲:自定义聊天机器人

623a4b8c8f10867618a0219d49e68ae6.png

用途举例:

  • AI 客服助理;

  • 餐厅AI接单员

等等......

注意:角色的设定很重要。

9、小结

4738237a8420a8775faf1daaa4115a86.png

9.1 写出好的提示词的两个核心要点

  • 1、写出清晰和具体指令的重要性

  • 2、给予模型足够的时间来“思考”。

9.2 迭代式提示开发

这是一种通过不断优化和细化提示来改进模型响应的方法。

9.3 模型的几项能力

  • 总结

  • 推断

  • 转换

  • 扩展信息。

这些能力在构建聊天机器人时尤为重要,它们使得机器人能够处理各种任务,从理解和回应用户输入到生成新的内容。

5288e5a260f6cca6a545b567bf49175f.png

模型非常有趣,可以放心去玩!!——咱们就是得多用,才能知道怎么更好得使用用!

0e6a072f87049d3d7f3243353ecb36f6.jpeg

10、中英文字母视频地址

https://www.bilibili.com/video/BV1s24y1F7eq

最近更新

  1. TCP协议是安全的吗?

    2024-03-15 07:54:02       19 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-03-15 07:54:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-03-15 07:54:02       20 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-03-15 07:54:02       20 阅读

热门阅读

  1. js 限制字数机器提示

    2024-03-15 07:54:02       19 阅读
  2. AI人工智能小程序系统开发

    2024-03-15 07:54:02       16 阅读
  3. mysql通过binlog恢复数据示例

    2024-03-15 07:54:02       15 阅读
  4. mybatis中$和#的区别以及各自的使用场景

    2024-03-15 07:54:02       19 阅读
  5. C++ 多路音频pcm混音算法

    2024-03-15 07:54:02       17 阅读
  6. 分布式微服务 - 4.服务增强 - 1.概念

    2024-03-15 07:54:02       19 阅读
  7. Memcached

    Memcached

    2024-03-15 07:54:02      19 阅读
  8. 27-1 文件上传漏洞基础

    2024-03-15 07:54:02       15 阅读
  9. 头歌-贪心算法

    2024-03-15 07:54:02       16 阅读