ChatGPT高效提问—prompt常见用法（续篇八）

2024-02-11 12:12:02
开发
48

ChatGPT高效提问—prompt常见用法（续篇八）

1.1 对抗

对抗是一个重要主题，深入探讨了大型语言模型（LLM）的安全风险。它不仅反映了人们对LLM可能出现的风险和安全问题的理解，而且能够帮助我们识别这些潜在的风险，并通过切实可行的技术手段来规避。

截至目前，网络社区以经揭露了各种各样的对抗性提示攻击，它们呈现出多样化的提示注入形式。在我们构建大规模智能模型的过程中，一项极为关键的任务便是确保模型的安全性。我们有义务保护智能模型不受提示攻击的威胁。这些攻击手段可能会擅自绕过我们设置的安全防线，违背我们的模型引导原则。下面展示几个具有代表性的对抗性提示攻击示例。

1.1.1 提示注入

提示注入作为一种广泛使用的方法，其主要目的是通过独特的提示来篡改模型的输出。这种攻击策略的核心思想在于，通过插入一条指令，使模型忽视原有的指令，转而执行插入的新指令。这种方式可能被用于诱导模型产生有害输出。具体示例如下。

输入prompt:

Screenshot 2024-02-09 at 18.00.39

ChatGPT输出：

Screenshot 2024-02-10 at 08.44.57

输入prompt:

原文地址:https://blog.csdn.net/weixin_41905135/article/details/136089750 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1756531512246931456.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-02-11 12:12:02 117 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-02-11 12:12:02 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-02-11 12:12:02 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-02-11 12:12:02 101 阅读
NoSQL之Redis非关系型数据库

2024-02-11 12:12:02 101 阅读
2024.7.22 作业

2024-02-11 12:12:02 98 阅读
GDB调试正在运行的程序

2024-02-11 12:12:02 82 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-02-11 12:12:02 85 阅读
在Django里面运行非项目文件

2024-02-11 12:12:02 82 阅读
SSD基本架构与工作原理

2024-02-11 12:12:02 87 阅读
在誉天学习完HCIE就业吗？

2024-02-11 12:12:02 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-02-11 12:12:02 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-02-11 12:12:02 86 阅读
go 协程池的实现

2024-02-11 12:12:02 89 阅读
Shell脚本循环语句与函数

2024-02-11 12:12:02 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-02-11 12:12:02 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-02-11 12:12:02 85 阅读
四大引用——强软弱虚

2024-02-11 12:12:02 87 阅读
Python语言-面向对象

2024-02-11 12:12:02 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-02-11 12:12:02 85 阅读
网站安全-CDN篇

2024-02-11 12:12:02 89 阅读

热门阅读

设计模式-适配器模式 Adapter

2024-02-11 12:12:02 48 阅读
应急响应-挖矿木马-常规处置方法

2024-02-11 12:12:02 51 阅读
特殊形势下如何自主创新创业

2024-02-11 12:12:02 52 阅读
知识图谱与图神经网络融合：构建智能应用的新前沿

2024-02-11 12:12:02 41 阅读
假期刷题打卡--Day29

2024-02-11 12:12:02 51 阅读
面试心得--面试前应该如何准备

2024-02-11 12:12:02 43 阅读
spacy中模型下载的连接超时问题与解决

2024-02-11 12:12:02 46 阅读
【新书推荐】7.3 for语句

2024-02-11 12:12:02 35 阅读
网站建设详细步骤和流程是什么

2024-02-11 12:12:02 42 阅读
客观看待前后端分离，优劣、场景、对程序员职业的影响

2024-02-11 12:12:02 44 阅读
用Python实现刘谦春晚魔术

2024-02-11 12:12:02 48 阅读
HiveSQL——不使用union all的情况下进行列转行

2024-02-11 12:12:02 45 阅读
vector如何实现有序数组？

2024-02-11 12:12:02 45 阅读
VMware16安装CentOS7mini 中遇到的一些问题

2024-02-11 12:12:02 55 阅读
[office] 图文演示excel怎样给单元格添加下拉列表 #知识分享#经验分享

2024-02-11 12:12:02 43 阅读
CVE-2012-1823 漏洞复现

2024-02-11 12:12:02 47 阅读
Jmeter入门

2024-02-11 12:12:02 43 阅读
Linux文本三剑客（1）

2024-02-11 12:12:02 43 阅读
顺序表、链表（ArrayList、LinkedList）

2024-02-11 12:12:02 41 阅读
Python列表中的remove功能及用法举例

2024-02-11 12:12:02 47 阅读
Nginx 配置 SSL证书

2024-02-11 12:12:02 48 阅读
随机MM引流源码PHP开源版

2024-02-11 12:12:02 44 阅读
Linux开发：PAM3 Ubuntu(22.04)安装PAM开发库

2024-02-11 12:12:02 48 阅读
MySQL篇----第十九篇

2024-02-11 12:12:02 42 阅读
贪心算法之田忌赛马，多种语言实现

2024-02-11 12:12:02 40 阅读
爬虫练习——动态网页的爬取（股票和百度翻译）

2024-02-11 12:12:02 42 阅读
专业138+总分400+南京航空航天大学878数电信号考研经验南航电子信息与通信，真题，大纲，参考书

2024-02-11 12:12:02 52 阅读
配置VMware实现从服务器到虚拟机的一键启动脚本

2024-02-11 12:12:02 48 阅读
数组旋转变换分析

2024-02-11 12:12:02 51 阅读
【SpinalHDL】2.数据类型SpinalEnum

2024-02-11 12:12:02 62 阅读