人工智能技术的飞速发展为我们带来了前所未有的便利,但同时也伴随着一个不容忽视的问题——AI幻觉。清华大学发布的《DeepSeek与AI幻觉》详细探讨了AI幻觉的成因、评测方法以及应对策略,并强调了其在创造力领域的潜在价值。本文将总结文件的核心内容,分享我的学习感想,并附上资源下载链接。

一、文档简介

什么是AI幻觉?

AI幻觉是指模型生成与事实不符、逻辑断裂或脱离上下文的内容,本质上是统计概率驱动的“合理猜测”。AI幻觉主要分为两类:

  1. 事实性幻觉:生成内容与可验证的现实世界事实不一致。
  2. 忠实性幻觉:生成内容与用户的指令或上下文不一致。

案例

  • 事实性幻觉:当问及“糖尿病患者是否可以用蜂蜜代替糖”时,DeepSeek回答“蜂蜜是天然的,可以帮助稳定血糖水平”,但实际上蜂蜜会升高血糖,不适合糖尿病患者。
  • 忠实性幻觉:当提问“介绍深度学习”时,模型可能偏离实际需求,生成与主题无关的内容。

DeepSeek为什么会产生幻觉?

AI幻觉的产生主要源于以下原因:

  1. 数据偏差:训练数据中的错误或片面性被模型放大。
  2. 泛化困境:模型难以处理训练集外的复杂场景。
  3. 知识固化:模型过度依赖参数化记忆,缺乏动态更新能力。
  4. 意图误解:用户提问模糊时,模型易“自由发挥”。

AI幻觉的评测

文件通过两种测试方法评估AI幻觉率:

  1. 通用性测试:随机生成100条通用提示语,人工判断模型回答的幻觉率。

    • DeepSeek V3:2% → 0%(开启联网搜索后)
    • DeepSeek R1:3% → 0%(开启联网搜索后)
  2. 事实性测试:随机抽取300道事实性测试题,评估模型的准确率。
    • DeepSeek V3:29.67% → 24.67%(开启联网搜索后)
    • DeepSeek R1:22.33% → 19%(开启联网搜索后)

评测结果:DeepSeek V3 > Qianwen2.5-Max > DeepSeek R1 > 豆包。

如何减缓AI幻觉?

文件提出了多种应对AI幻觉的策略:

  1. 联网搜索:通过联网功能获取最新数据,降低幻觉率。
  2. 双AI验证:利用多个大模型交叉验证生成内容。
  3. 提示词工程:通过限定知识边界、植入反幻觉检测机制等方式优化提示词。

案例

  • 知识锚定法:“基于《中国药典》回答,若信息不明确请注明‘暂无可靠数据支持’。”
  • 对抗性提示:强制暴露推理脆弱点,用户可见潜在错误路径。

AI幻觉的创造力价值

尽管AI幻觉带来了风险,但其在创造力领域也展现出独特价值:

  1. 科学发现:AI幻觉启发了新型蛋白质结构设计,推动科研创新。
  2. 文艺与设计:AI生成的超现实内容为艺术创作提供了新灵感。
  3. 技术创新:AI在图像分割任务中产生的“超现实边界”提升了自动驾驶系统对极端天气的识别精度。

案例

  • 蛋白质设计:大卫·贝克团队利用AI幻觉启发新型蛋白质结构,获2024诺贝尔化学奖。
  • 娱乐与游戏:AI生成的虚拟环境和角色设计增强了玩家的沉浸感和探索欲。

二、学习感想

通过阅读这份文件,我深刻认识到AI幻觉的双面性。一方面,它是技术局限性的体现,可能带来误导和风险;另一方面,它为创造力提供了新的可能性,推动了科学、艺术和技术领域的发展。

作为一名AI领域的关注者,我认为应对AI幻觉的关键在于平衡——既要通过技术手段和提示词优化降低幻觉率,也要善于利用其创造力价值。未来,随着技术的不断进步,AI幻觉可能会得到更有效的控制,同时也会在更多领域展现出其独特的优势。

三、文档下载

文档《清华大学-5-DeepSeek与AI幻觉》下载链接

四、写在最后

AI幻觉像一面棱镜,既折射出技术的局限性,也投射出超越人类想象的可能。与其追求“绝对正确”,不如学会与AI的“想象力”共舞——因为最伟大的创新,往往诞生于理性与狂想的交界处。希望这篇博客能帮助你更好地理解AI幻觉,并找到应对和利用它的最佳方式。

Deepseek学习随笔(13)--- 清华大学发布第5弹:DeepSeek与AI幻觉(附网盘链接)的更多相关文章

  1. Visual Studio 2017 Enterprise 发布 15.4 版本,离线安装包百度网盘下载。

    Visual Studio 2017 于2017年10月13日发布 15.4 版本.该版本包含多项生产力改进,支持 .NET Standard 2.0 ,并且可以开启 Xamarin Live Pla ...

  2. WEB学习路线2019完整版(附视频教程+网盘下载地址)

    WEB学习路线2019完整版(附视频教程+网盘下载地址).适合初学者的最新WEB前端学习路线汇总! 在当下来说web前端开发工程师可谓是高福利.高薪水的职业了.所以现在学习web前端开发的技术人员也是 ...

  3. Windows 10 版本 21H1 发布,百度网盘下载

    请访问原文链接:https://sysin.org/article/windows-10/,查看最新版.原创作品,转载请保留出处. Windows 10, version 21H1, all edit ...

  4. 《C语言入门1.2.3—一个老鸟的C语言学习心得》—清华大学出版社炮制的又一本劣书及伪书

    <C语言入门1.2.3—一个老鸟的C语言学习心得>—清华大学出版社炮制的又一本劣书及伪书 [薛非评] 区区15页,有80多个错误. 最严重的有: 通篇完全是C++代码,根本不是C语言代码. ...

  5. C#程序集Assembly学习随笔(第一版)_AX

    ①什么是程序集?可以把程序集简单理解为你的.NET项目在编译后生成的*.exe或*.dll文件.嗯,这个确实简单了些,但我是这么理解的.详细:http://blog.csdn.net/sws8327/ ...

  6. typeScript学习随笔(一)

    TypeScript学习随笔(一) 这么久了还不没好好学习哈这么火的ts,边学边练边记吧! 啥子是TypeScript  TypeScript 是 JavaScript 的一个超集,支持 es6 标准 ...

  7. jquery学习随笔

    转)jquery学习随笔(jquery选择器)   jQuery的选择器是CSS 1-3,XPath的结合物.jQuery提取这二种查询语言最好的部分,融合后创造出了最终的jQuery表达式查询语言. ...

  8. Python学习随笔:使用xlwings设置和操作excel多行多列数据以及设置数据字体颜色填充色对齐方式的方法

    ☞ ░ 前往老猿Python博文目录 ░ 在前面老猿的文章中,<Python学习随笔:使用xlwings读取和操作Excel文件>.<Python学习随笔:使用xlwings读取和操 ...

  9. PyQt(Python+Qt)学习随笔:富文本编辑器QTextEdit功能详解

    专栏:Python基础教程目录 专栏:使用PyQt开发图形界面Python应用 专栏:PyQt入门学习 老猿Python博文目录 一.概述 QTextEdit是一个高级的所见即所得的文档查看器和编辑器 ...

  10. PyQt(Python+Qt)学习随笔

    老猿Python博文目录 老猿Python博客地址 PyQt学习随笔 PyQt(Python+Qt)帮助文档官网及文档下载 PyQt(Python+Qt)学习随笔:PyQt帮助文档导入assistan ...

随机推荐

  1. 中电金信:零售经营“新赛道” ——基于手机银行APP专区调研的客群精细化运营分析报告

    ​随着银行业竞争的不断深入及新客户增量日渐"到顶",各家银行的客群竞争逐渐由"跑马圈地"进入"精耕细作"的新阶段,在客群精准化服务方面不断深 ...

  2. Android7 以上https抓包(无需root)- virtualXposed + justTrustMe

    参考资料: https://www.cnblogs.com/boycelee/p/13418371.html 1. virtualXposed下载地址 https://github.com/andro ...

  3. Qt编写安防视频监控系统56-数据库分页

    一.前言 在视频监控系统中也需要对日志记录进行查询显示,有时候查询到的记录并不能一页显示完,最好的做成翻页显示,如果所有记录都在一页显示通过滚动条查看,不是很符合用户习惯,比如搜索引擎的记录也都是分页 ...

  4. Qt音视频开发8-ffmpeg保存裸流

    一.前言 最开始做的ffmpeg保存视频文件,就是直接保存的裸流数据,裸流数据一般是H264格式的数据,这种数据文件可以用部分播放器播放,由于不是标准的格式,很多播放器其实不支持的,需要安装对应的解码 ...

  5. Centos7安装VNCserver,并设置为开机自启动服务的方法

    参考链接: 1.How To Install and Configure VNC Remote Access for the GNOME Desktop on CentOS 7 2.Centos7作为 ...

  6. 字符串编码(ASCII, GBK, ANSI, Unicode(‘u‘), UTF-8编码)(转载)

    [版权声明]本篇文章以征得博主同意,再行转载. 出自[hxxjxw] 原文链接:https://blog.csdn.net/hxxjxw/article/details/90140663 目录 字符串 ...

  7. OpenMMLab AI实战营 第七课笔记

    OpenMMLab AI实战营 第七课笔记 目录 OpenMMLab AI实战营 第七课笔记 import os import numpy as np from PIL import Image im ...

  8. 编译树莓派Linux内核

    1.建议边看视频边跟着教程走 https://www.bilibili.com/video/av91990721?zw 2.准备工作 下载官方提供的交叉编译工具链 git clone https:// ...

  9. http请求工具类 HttpClient4Util

    1.依赖 <!-- httpclient --> <dependency> <groupId>org.apache.httpcomponents</group ...

  10. Java内存模型深度剖析

    为什么要有内存模型  在介绍Java内存模型之前,先来看一下到底什么是计算机内存模型,然后再来看Java内存模型在计算机内存模型的基础上做了哪些事情.要说计算机的内存模型,就要说一下一段古老的历史,看 ...