人工智能技术的飞速发展为我们带来了前所未有的便利,但同时也伴随着一个不容忽视的问题——AI幻觉。清华大学发布的《DeepSeek与AI幻觉》详细探讨了AI幻觉的成因、评测方法以及应对策略,并强调了其在创造力领域的潜在价值。本文将总结文件的核心内容,分享我的学习感想,并附上资源下载链接。

一、文档简介

什么是AI幻觉?

AI幻觉是指模型生成与事实不符、逻辑断裂或脱离上下文的内容,本质上是统计概率驱动的“合理猜测”。AI幻觉主要分为两类:

  1. 事实性幻觉:生成内容与可验证的现实世界事实不一致。
  2. 忠实性幻觉:生成内容与用户的指令或上下文不一致。

案例

  • 事实性幻觉:当问及“糖尿病患者是否可以用蜂蜜代替糖”时,DeepSeek回答“蜂蜜是天然的,可以帮助稳定血糖水平”,但实际上蜂蜜会升高血糖,不适合糖尿病患者。
  • 忠实性幻觉:当提问“介绍深度学习”时,模型可能偏离实际需求,生成与主题无关的内容。

DeepSeek为什么会产生幻觉?

AI幻觉的产生主要源于以下原因:

  1. 数据偏差:训练数据中的错误或片面性被模型放大。
  2. 泛化困境:模型难以处理训练集外的复杂场景。
  3. 知识固化:模型过度依赖参数化记忆,缺乏动态更新能力。
  4. 意图误解:用户提问模糊时,模型易“自由发挥”。

AI幻觉的评测

文件通过两种测试方法评估AI幻觉率:

  1. 通用性测试:随机生成100条通用提示语,人工判断模型回答的幻觉率。

    • DeepSeek V3:2% → 0%(开启联网搜索后)
    • DeepSeek R1:3% → 0%(开启联网搜索后)
  2. 事实性测试:随机抽取300道事实性测试题,评估模型的准确率。
    • DeepSeek V3:29.67% → 24.67%(开启联网搜索后)
    • DeepSeek R1:22.33% → 19%(开启联网搜索后)

评测结果:DeepSeek V3 > Qianwen2.5-Max > DeepSeek R1 > 豆包。

如何减缓AI幻觉?

文件提出了多种应对AI幻觉的策略:

  1. 联网搜索:通过联网功能获取最新数据,降低幻觉率。
  2. 双AI验证:利用多个大模型交叉验证生成内容。
  3. 提示词工程:通过限定知识边界、植入反幻觉检测机制等方式优化提示词。

案例

  • 知识锚定法:“基于《中国药典》回答,若信息不明确请注明‘暂无可靠数据支持’。”
  • 对抗性提示:强制暴露推理脆弱点,用户可见潜在错误路径。

AI幻觉的创造力价值

尽管AI幻觉带来了风险,但其在创造力领域也展现出独特价值:

  1. 科学发现:AI幻觉启发了新型蛋白质结构设计,推动科研创新。
  2. 文艺与设计:AI生成的超现实内容为艺术创作提供了新灵感。
  3. 技术创新:AI在图像分割任务中产生的“超现实边界”提升了自动驾驶系统对极端天气的识别精度。

案例

  • 蛋白质设计:大卫·贝克团队利用AI幻觉启发新型蛋白质结构,获2024诺贝尔化学奖。
  • 娱乐与游戏:AI生成的虚拟环境和角色设计增强了玩家的沉浸感和探索欲。

二、学习感想

通过阅读这份文件,我深刻认识到AI幻觉的双面性。一方面,它是技术局限性的体现,可能带来误导和风险;另一方面,它为创造力提供了新的可能性,推动了科学、艺术和技术领域的发展。

作为一名AI领域的关注者,我认为应对AI幻觉的关键在于平衡——既要通过技术手段和提示词优化降低幻觉率,也要善于利用其创造力价值。未来,随着技术的不断进步,AI幻觉可能会得到更有效的控制,同时也会在更多领域展现出其独特的优势。

三、文档下载

文档《清华大学-5-DeepSeek与AI幻觉》下载链接

四、写在最后

AI幻觉像一面棱镜,既折射出技术的局限性,也投射出超越人类想象的可能。与其追求“绝对正确”,不如学会与AI的“想象力”共舞——因为最伟大的创新,往往诞生于理性与狂想的交界处。希望这篇博客能帮助你更好地理解AI幻觉,并找到应对和利用它的最佳方式。

Deepseek学习随笔(13)--- 清华大学发布第5弹:DeepSeek与AI幻觉(附网盘链接)的更多相关文章

  1. Visual Studio 2017 Enterprise 发布 15.4 版本,离线安装包百度网盘下载。

    Visual Studio 2017 于2017年10月13日发布 15.4 版本.该版本包含多项生产力改进,支持 .NET Standard 2.0 ,并且可以开启 Xamarin Live Pla ...

  2. WEB学习路线2019完整版(附视频教程+网盘下载地址)

    WEB学习路线2019完整版(附视频教程+网盘下载地址).适合初学者的最新WEB前端学习路线汇总! 在当下来说web前端开发工程师可谓是高福利.高薪水的职业了.所以现在学习web前端开发的技术人员也是 ...

  3. Windows 10 版本 21H1 发布,百度网盘下载

    请访问原文链接:https://sysin.org/article/windows-10/,查看最新版.原创作品,转载请保留出处. Windows 10, version 21H1, all edit ...

  4. 《C语言入门1.2.3—一个老鸟的C语言学习心得》—清华大学出版社炮制的又一本劣书及伪书

    <C语言入门1.2.3—一个老鸟的C语言学习心得>—清华大学出版社炮制的又一本劣书及伪书 [薛非评] 区区15页,有80多个错误. 最严重的有: 通篇完全是C++代码,根本不是C语言代码. ...

  5. C#程序集Assembly学习随笔(第一版)_AX

    ①什么是程序集?可以把程序集简单理解为你的.NET项目在编译后生成的*.exe或*.dll文件.嗯,这个确实简单了些,但我是这么理解的.详细:http://blog.csdn.net/sws8327/ ...

  6. typeScript学习随笔(一)

    TypeScript学习随笔(一) 这么久了还不没好好学习哈这么火的ts,边学边练边记吧! 啥子是TypeScript  TypeScript 是 JavaScript 的一个超集,支持 es6 标准 ...

  7. jquery学习随笔

    转)jquery学习随笔(jquery选择器)   jQuery的选择器是CSS 1-3,XPath的结合物.jQuery提取这二种查询语言最好的部分,融合后创造出了最终的jQuery表达式查询语言. ...

  8. Python学习随笔:使用xlwings设置和操作excel多行多列数据以及设置数据字体颜色填充色对齐方式的方法

    ☞ ░ 前往老猿Python博文目录 ░ 在前面老猿的文章中,<Python学习随笔:使用xlwings读取和操作Excel文件>.<Python学习随笔:使用xlwings读取和操 ...

  9. PyQt(Python+Qt)学习随笔:富文本编辑器QTextEdit功能详解

    专栏:Python基础教程目录 专栏:使用PyQt开发图形界面Python应用 专栏:PyQt入门学习 老猿Python博文目录 一.概述 QTextEdit是一个高级的所见即所得的文档查看器和编辑器 ...

  10. PyQt(Python+Qt)学习随笔

    老猿Python博文目录 老猿Python博客地址 PyQt学习随笔 PyQt(Python+Qt)帮助文档官网及文档下载 PyQt(Python+Qt)学习随笔:PyQt帮助文档导入assistan ...

随机推荐

  1. win10重装如何跳过微软账号直接设置本地帐户

    ​在添加你的帐户界面,选择脱机帐户 第二个页面,选择有限的体验 第三个页面,设置自己本地的用户名 第四个页面,设置自己本地的密码

  2. 深入聊聊async&Promise

    正文 最近在学习JavaScript里的async.await异步,对于其中的Promise状态以及背后的Js引擎实际运行状态不大理解且很感兴趣,因此花了一点时间仔细研究了一下. 从Example说起 ...

  3. Flutter问题 Flutter MissingPluginException(No implementation found for method xxx on channel xxx)

    问题如题 有时候项目跑着跑着突然控制台就报了这个错,用hot restart也没有用,问题的本质是plugin没有找到,这时候有两种方法 flutter clean,会将依赖清除,这时候再重新pub ...

  4. 给我2分钟,保证教会你在Vue3中实现一个定高的虚拟列表

    前言 虚拟列表对于大部分一线开发同学来说是一点都不陌生的东西了,有的同学是直接使用第三方组件.但是面试时如果你简历上面写了虚拟列表,却给面试官说是通过三方组件实现的,此时空气可能都凝固了.所以这篇文章 ...

  5. WinDbg: Failed to find runtime module (coreclr.dll or clr.dll or libcoreclr.so)

    当我们通过 WinDbg 启动一个 .NET 的程序时,WinDbg 将会在运行可执行之前执行一个中断,此时还没有加载 .NET 的运行时. 但是,SOS 扩展需要 clr.dll 或者 corecl ...

  6. 使用MathNet.Numerics库构造矩阵并初始化时,编译器报错“this方法没有任何重载采用"1"个参数”

    最近在使用MathNet.Numerics库作一些数据处理工作,构造一个矩阵并初始化时,编译器报错"this方法没有任何重载采用"1"个参数". 问题分析: 构 ...

  7. 一套分布式IM即时通讯系统的技术选型和架构设计

    本文由冰河分享,作者博客 binghe.gitcode.host,原题"这套分布式IM即时通讯系统如何写到简历上?我给你整理好了!",本文有修订和改动. 1.引言 分布式IM即时通 ...

  8. 网页端IM通信技术快速入门:短轮询、长轮询、SSE、WebSocket

    本文来自"糊糊糊糊糊了"的分享,原题<实时消息推送整理>,有优化和改动. 1.写在前面 对Web端即时通讯技术熟悉的开发者来说,我们回顾网页端IM的底层通信技术,从短轮 ...

  9. Python格式化字符串字面值 | 被官方文档称之为『漂亮』的输出格式

    Python格式化字符串字面值 | 被官方文档称之为『漂亮』的输出格式 本文参考输入输出 - Python 3.7.10 文档.首先声明咱的实验环境. ❯ python --version Pytho ...

  10. 『AutoHotkey』 效率提升「脚本集」

    AutoHotkey 效率提升脚本集 一些实用的 AutoHotkey 脚本示例,这些可以显著提升工作效率. #Requires AutoHotkey v2.0 ; 1. 快速启动常用程序 ^!n:: ...