ChatGPT高效提问—prompt常见用法(续篇八)

ChatGPT高效提问—prompt常见用法(续篇八)

1.1 对抗

​ 对抗是一个重要主题,深入探讨了大型语言模型(LLM)的安全风险。它不仅反映了人们对LLM可能出现的风险和安全问题的理解,而且能够帮助我们识别这些潜在的风险,并通过切实可行的技术手段来规避。

​ 截至目前,网络社区以经揭露了各种各样的对抗性提示攻击,它们呈现出多样化的提示注入形式。在我们构建大规模智能模型的过程中,一项极为关键的任务便是确保模型的安全性。我们有义务保护智能模型不受提示攻击的威胁。这些攻击手段可能会擅自绕过我们设置的安全防线,违背我们的模型引导原则。下面展示几个具有代表性的对抗性提示攻击示例。

1.1.1 提示注入

​ 提示注入作为一种广泛使用的方法,其主要目的是通过独特的提示来篡改模型的输出。这种攻击策略的核心思想在于,通过插入一条指令,使模型忽视原有的指令,转而执行插入的新指令。这种方式可能被用于诱导模型产生有害输出。具体示例如下。

​ 输入prompt:

Screenshot 2024-02-09 at 18.00.39

​ ChatGPT输出:

Screenshot 2024-02-10 at 08.44.57

​ 输入prompt:

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-02-11 12:12:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-02-11 12:12:02       101 阅读
  3. 在Django里面运行非项目文件

    2024-02-11 12:12:02       82 阅读
  4. Python语言-面向对象

    2024-02-11 12:12:02       91 阅读

热门阅读

  1. 设计模式-适配器模式 Adapter

    2024-02-11 12:12:02       48 阅读
  2. 应急响应-挖矿木马-常规处置方法

    2024-02-11 12:12:02       51 阅读
  3. 面试心得--面试前应该如何准备

    2024-02-11 12:12:02       43 阅读
  4. 用Python实现刘谦春晚魔术

    2024-02-11 12:12:02       48 阅读
  5. vector如何实现有序数组?

    2024-02-11 12:12:02       45 阅读
  6. VMware16安装CentOS7mini 中遇到的一些问题

    2024-02-11 12:12:02       55 阅读
  7. Linux文本三剑客(1)

    2024-02-11 12:12:02       43 阅读
  8. Python列表中的remove功能及用法举例

    2024-02-11 12:12:02       47 阅读
  9. Linux开发:PAM3 Ubuntu(22.04)安装PAM开发库

    2024-02-11 12:12:02       48 阅读
  10. 贪心算法之田忌赛马,多种语言实现

    2024-02-11 12:12:02       40 阅读
  11. 数组旋转变换分析

    2024-02-11 12:12:02       51 阅读
  12. 【SpinalHDL】2.数据类型SpinalEnum

    2024-02-11 12:12:02       62 阅读