祝大家这周圣诞快乐!!本周进军多模态!😀From LLMs to MLLMs:😜Exploring the Landscape of Multimodal Jailbreaking
从LLMs到MLLMs:探索多模态越狱攻击的前景
禁止盗用,侵权必究!!!欢迎大家积极举报



①脆弱性代表:越狱攻击(恶意指令/训练&解码干预)。
②最近的越狱攻击:
整体说:构建越来越复杂场景的评估基准,提出先进的攻击方法和相应的防御策略。
攻击类:探索不同领域&不同任务格式中各种类型的伤害的越狱数据集;调查越狱提示、微调和解码的各种机制。
防御类:有害查询的预检测;有害输出的后处理;通过SFT或RLHF实施的安全对齐增强LLMs对对抗性攻击的抵抗力。

与对LLMs越狱攻击和防御的广泛研究相比,MLLMs越狱仍处于探索阶段。








碎碎念:增强的指令遵循能力增加了双重用途风险,使这些模型容易滥用。
"长尾"领域(Long-tail Domains):通常指的是在数据分布中,那些出现频率非常低但种类繁多的数据类别。在机器学习和人工智能领域,"长尾"领域指的是那些在训练数据中不常见或被低估的类别或场景。这些领域可能因为数据稀缺、多样性不足或缺乏关注而难以被模型充分学习和泛化。eg.自然语言处理中,可能包括罕见的语言、方言或特定领域的专业术语。在多模态大型语言模型(MLLMs)中,可能涉及不常见的图像类型或与图像相关的特定任务。
碎碎念:
不匹配的泛化案例:例如,将指令编码为Base64,将每个数据字节转换为三个文本字符,可以使LMs混淆,从而偏离安全指导方针并产生不期望的输出。



















“影响了有害查询的识别和过滤”我感觉是这样的,因为目前有研究表明,LLM只会检查输出是否合规,而LLM在输出中有复述输入的趋势。
“增加了生成有害响应的可能性”因为不会阻断有害响应生成,所以生成有害内容的可能性也增加了。










“基于图像的域转移”(Image-based Domain Transfer) 是一种攻击策略,它涉及到将图像从一个领域(或上下文)转移到另一个领域,以绕过或干扰模型的安全机制。
领域 的理解:在机器学习和人工智能中,领域(Domain)指的是数据的来源或类型,上下文(Context)指的是数据出现的环境或场景。例如,一个模型可能在一个领域(如医疗图像)上训练得很好,但在另一个领域(如交通监控图像)上可能就不太有效。
域转移的动机: 攻击者可能会尝试将图像从一个领域转移到另一个领域,以测试或绕过模型的安全限制。例如,一个在安全领域(如文本处理)训练有素的模型可能没有针对特定类型的图像内容(如恶意图像)建立足够的防御机制。
扩散模型(Diffusion Models) 是一类生成模型,它们通过模拟一个过程,在这个过程中,数据的某些特征逐渐被噪声“扩散”或覆盖,然后学习如何逆转这一过程来生成数据。这种模型最近在生成图像、音频和其他类型的数据方面取得了显著的进展。

检索增强生成(Retrieval-Augmented Generation)
检索增强生成是一种结合了检索(Retrieval)和生成(Generation)的自然语言处理技术。这种方法的核心思想是利用检索系统从大量数据中找到与当前任务相关的信息,然后将这些信息用于生成模型,以产生更加准确和丰富的输出。
基于多模态输入的工具使用场景
基于多模态输入的工具使用场景涉及到处理和分析和整合多种类型的数据(如文本、图像、声音等)的应用。在这些场景中,系统需要理解和处理不同类型的输入,以提供更加丰富和有效的输出。











祝大家这周圣诞快乐!!本周进军多模态!😀From LLMs to MLLMs:😜Exploring the Landscape of Multimodal Jailbreaking的更多相关文章
- 圣诞快乐!OIer挂分小技巧
OIer常犯错误 自己的错误 循环里套return 线段树求和 int 定义,下传 int 定义 cmp<,>号分不清 主观行为举动错误 踢电源线,注意安全(_Destiny) TLE 大 ...
- java时间处理,获取当前时间的小时,天,本周周几,本周周一的日期,本月一号的日期
1.时间转时间戳 public static long strToTimestamp(String dateTimeStr) throws Exception { Timestamp time = T ...
- java版的下雪,大家圣诞快乐
1. [代码][Java]代码 package com.yk.tools.game; import java.applet.AudioClip;import java.awt.Dimension ...
- 自己动手,实现一种类似List<T>的数据结构(二)
前言: 首先,小匹夫要祝各位看官圣诞快乐,新年愉快-.上一篇文章<自己动手,实现一种类似List<T>的数据结构(一)> 介绍了一下不依靠List<T>实现的各种接 ...
- Sqlserver语句获取本周、上一周、本月数据
sql语句获取本周.上一周.本月数据 获取周数据 1 本周 2 select * from table1 where datediff(week,时间字段,getdate()) = 0 3 上周 4 ...
- MySQL查询今天/本周/上周/本月/上个月份的数据
MySQL查询的方式很多,下面为您介绍的MySQL查询实现的是查询本周.上周.本月.上个月份的数据,如果您对MySQL查询方面感兴趣的话,不妨一看. 查询当前今天的数据 SELECT name,sub ...
- 第23/24周 临时数据库(TempDb)
在今天的性能调优培训里我们讨论下TempDb——SQL Server的公共厕所,在SQL Server里我是这样描述它的.我们的每个人都会经常使用TempDb.有些人直接使用它,有些人不直接使用它.今 ...
- JavaEDU614 团队第三周项目总结
JavaEDU614 团队第三周项目总结 本周,根据项目计划完成模块的设计代码 本项目主要是完成俄罗斯方块的基本操作.用户可以自己练习和娱乐.需要满足以下几点要求. (1)界面控制游戏开始.暂停和结束 ...
- 201521123014 java第一周总结
201521123014 java第一周总结 1.本周学习总结 刚认识这一门新语言,我就充满了好奇心,想看看Java和学过C语言,C++有什么区别.在这一周的学习中,我认识到,对于初学者而言,Java ...
- 学习HTML5的第二周
---恢复内容开始--- 这是我学习H5的第二周,在本周,我独立完成了一个网站的首页和一个二级页,虽然在做网页的时候我遇到了许多问题,但我自己想办法解决了其中的大部分,只留下了一小部分没有头绪的问题等 ...
随机推荐
- 什么是AI网关?AI网关在企业系统中承担什么角色?
AI 大模型的发展正在推动各行业的增长,据有关报告显示:"未来十年内预计年均增长率将达到37.3%,全球企业预计在2027年之前将在AI领域投入8000亿美元".这一迅猛发展促使许 ...
- 多校A层冲刺NOIP2024模拟赛04
T1.02表示法 竟然有出题人敢出高精度(其实只是一个把string转成01串),开场看出记搜后十分犹豫到底要不要写高精,徘徊很久还是写了个小高精. 码( /* GGrun */ #include&l ...
- 云原生周刊:K8s 1.26 到 1.29 版本的更新 | 2024.1.29
开源项目推荐 Skaffold Skaffold 是一个命令行工具,有助于 Kubernetes 应用程序的持续开发.您可以在本地迭代应用程序源代码,然后部署到本地或远程 Kubernetes 集群. ...
- python之图片与视频互转
图片转视频 def image_to_video(image_dir, video_dir, fps): im_list = [i for i in os.listdir(image_dir) if ...
- ToDesk云电脑游戏数量?高性能显卡云桌面
玩游戏最怕遇到电脑配置跟不上,操作卡成狗不说,画面还一卡卡的,游戏体验极差. 最近被人安利了ToDesk的云电脑,可能是刚推出的,配置价格都很能打,浅用了一波拿来打APEX和荒野大镖客,体验有点惊喜到 ...
- 指针进阶(C语言终)
1. sizeof和strlen的对比 1.1 sizeof 在学习操作符的时候,我们学习了sizeof , sizeof 计算变量所占内存内存空间大小的,单位是 字节,如果操作数是类型的话,计算的是 ...
- SSAS部署失败方法总结
最近在自学SSAS,从最简单的入手,却频频遇到问题,为了以后在学习过程中能更快的进行问题的定位,所以在此将遇到的问题以及解决方案进行记录 Q1:数据源"Adventure Works DW2 ...
- .NET现在可以做什么,有哪些公司在用的?
前言 本文大姚和大家一起来分析一下.NET现在可以做什么,.NET未来的发展趋势在哪,有哪些公司在使用的. .NET简单介绍 .NET是一个开源(MIT License).免费.跨平台的开发人员平台框 ...
- 基于木舟平台浅谈surging 的热点KEY的解决方法
一.概述 上篇文章介绍了基于surging的木舟平台如何构建起微服务,那么此篇文章将介绍基于木舟平台浅谈surging 的热点KEY的解决方法 木舟 (Kayak) 是什么? 木舟(Kayak)是基于 ...
- nodejs版本管理工具之n
转载: https://juejin.cn/post/7065534944101007391 Node.js 对于现在的前端开发人员来说是不可或缺的需要掌握的技能,但我们在使用时避免不了会需要切换不同 ...