知识的量子态

在回答什么是“理解”之前,我们先来讨论一下知识和其载体的定义。知识本身是一个抽象的概念,它可以被编码到各种物质载体中。无论是纸质书籍,还是人类大脑中的神经连接,抑或是服务器中的0和1,都可以看作是知识的载体。知识与其载体之间存在着一种特殊的关系——知识可以完整地存在于一个载体中,也可以分布在多个载体中。

假设冯诺伊曼的计算机模型知识在全世界共有100亿份拷贝,无论是书本还是人脑。如果我们逐个销毁这些载体,当最后一份载体被销毁时,这项知识是否还存在?答案应该是不存在了。那么在什么时刻,这项知识开始“消失”的?事实上,在整个过程中,这项知识的状态可以视为不变,直到最后一个载体消失的一瞬间,知识才发生了“量子跃迁”,从存在变为不存在。知识与其载体之间呈现出一种量子关系,知识要么完整存在,要么完全不复存在,并不存在中间状态。并且基于哲学上部分与整体的关系,即使一个知识基于其完整性被保留了80%,但是事实上做为整体的那个知识,也已经不存在了。

进入信息时代后,知识的载体已经从纸质书籍逐渐向电子化格式转变。海量知识被数字编码,可以进行近乎无限的复制。这使得知识的“量子态”变得更加稳定。以维基百科为例,它记录了大量人类知识,拥有超过6000万条词条,資料量超过100TB。它的内容分布在全球数万台服务器上,实时互联互通。就算某几台服务器损坏,也不会对整体知识造成损失。类似的,GPT 模型吸收了互联网上数百亿条文本数据,对人类知识进行了有效的“数字化编码”。理论上,只要保持模型的完整,即便断网也不会导致已编码知识的丢失。这使得知识的“量子态”得到了前所未有的保障。

载体是否理解知识

在《神雕侠侣》中,杨过被赵志敬要求背诵《全真大道歌》,最后能流利地对答。但实际上杨过对其中的内涵一无所知,除了能回答问题,对于武功一窍不通。我们绝不会认为此时的杨过理解了全真教的武功心法。人脑的记忆系统使我们可以存储大量信息,成为知识的容器。但理解知识还需要将信息进行逻辑推理、关联组合,这是另一个层次的认知过程。所以人类既可以是知识的载体,像图书馆一样丰富知识内容;也可以不理解自身所载知识,像杨过那样死记硬背。充分理解知识需要更高层次的思维能力,不仅停留在存储和重复。

在社会招聘时,面试官通过提问来判断应聘者是否理解某项知识。如果应聘者只是死记硬背,但是刚巧所有问题都能对答如流,那么面试官将很难辨别真伪。在论文答辩时也有着类似的场景。这意味着以人类社会为基础建立起来的关于“理解”的评估标准,对于具有超级记忆能力和已经学会流畅人类语言交流的 GPT 模型而言是不合适的。对于 GPT 模型而言,人类所谓的“理解”实际上是个派生概念,人类标准下的“理解”,在广义上可以是“记忆”加“向量搜索”的同义词。

因此我们可以得到推论:简单的记忆和搜索对于人类而言可以认为是初步的“理解”,能做到有逻辑得回答目标领域的相关问题。那么我们应该基于这个推论承认目前的 GPT 模型初步具有了“理解”的能力。当它可以流畅得回答特定领域相关的问题时,我们应当承认 GPT “理解”了这些知识

未完待续

在较低的标准下,我们应该承认 GPT “理解”目标领域的知识,承认 GPT “理解”自身的输出。但是人类对于“理解”还有更高层次的标准。比如学以致用、举一反三、活学活用、触类旁通等等的说法。显然这些行为不是靠超强的记忆和搜索就能做到的。所以关于“理解”究竟是什么,我们仅仅回答了一半。我会在后续的文章中进一步分析如何让 AI 拥有更高标准的“理解”能力

发现AI自我意识:知识及其载体的更多相关文章

  1. AI金融知识自学偏量化方向-前提1

    前提: 统计学习(统计分析)和机器学习之间的区别 金融公司采用机器学习技术及招募相关人才要求 第一个问题:  机器学习和统计学都是数据科学的一部分.机器学习中的学习一词表示算法依赖于一些数据(被用作训 ...

  2. AI金融知识自学偏量化方向-了解不同类型的机器学习2

    有监督学习 vs 无监督学习 迭代和评估 偏差方差权衡 结合有监督学习和无监督学习(半监督学习)

  3. AI金融知识自学偏量化方向-目录0

    前提: 统计学习(统计分析)和机器学习之间的区别 金融公司采用机器学习技术及招募相关人才 了解不同类型的机器学习 有监督学习 vs 无监督学习 迭代和评估 偏差方差权衡 结合有监督学习和无监督学习(半 ...

  4. AI基本知识

    一.什么是flops 对flops有疑惑,首先得先捋清这个概念: FLOPS:注意全大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为 ...

  5. 人工智能头条(公开课笔记)+AI科技大本营——一拨微信公众号文章

    不错的 Tutorial: 从零到一学习计算机视觉:朋友圈爆款背后的计算机视觉技术与应用 | 公开课笔记 分享人 | 叶聪(腾讯云 AI 和大数据中心高级研发工程师) 整    理 | Leo 出   ...

  6. 脚本AI与脚本引擎

    Scripted AI and Scripting Engines 脚本AI与脚本引擎 This chapter discusses some of the techniques you can us ...

  7. 花十分钟,让你变成AI产品经理

    花十分钟,让你变成AI产品经理 https://www.jianshu.com/p/eba6a1ca98a4 先说一下你阅读本文可以得到什么.你能得到AI的理论知识框架:你能学习到如何成为一个AI产品 ...

  8. 江铖:乳腺癌识别By AI

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由云加社区技术沙龙 发表于云+社区专栏 演讲嘉宾:江铖,腾讯觅影高级研究员.多年以来一直从事计算机视觉相关的研究.加入腾讯以后,负责腾讯 ...

  9. 深度学习优质学习项目大放送!-AI Studio精选开源项目合集推荐

    近期 在AI Studio上发现了不少优质的开源深度学习项目,从深度学习入门到进阶,涵盖了CV.NLP.生成对抗网络.强化学习多个研究方向,还有最新的动态图,都以NoteBook的方式直接开源出来,并 ...

  10. 普通人如何站在时代风口学好AI?这是我看过最好的答案

    摘要:当前,数据.算法.算力的发展突破正推动AI应用的逐步落地. AI是什么? 根据维基百科的定义,人工智能是一种新的通用目的技术(GPT, General Purpose Technology),它 ...

随机推荐

  1. 【技术积累】Linux中的命令行【理论篇】【二】

    ag命令 命令介绍 ag命令是一个用于在Linux系统中进行文本搜索的工具.它是基于Silver Searcher的改进版本,具有更快的搜索速度和更强大的功能. ag命令的基本用法是在指定的目录中搜索 ...

  2. 如何正确使用:has和:nth-last-child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字.例如,一个拥有三个或更多子项的grid.你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会根据子元素的数量而改变. ...

  3. 青少年CTF-Web-帝国CMS1-3通关记录

    0x01说明 本次进通过平台内题目进行,非真实环境. 帝国CMS01 首先下发题目链接 我们首先先找后台看看 后台地址为/e/admin/ 随后,经过dirsearch进行扫描,得到了一个www.zi ...

  4. [linux]frp内网穿透

    前言 假设有如下网络拓扑 A可以访问B,但B无法访问A.A和B都能访问C.如果B需要访问A的8000端口,一般有如下方法: 网络管理员做路由转发.硬件层面网络转发,性能一般来说更好,但需要熟悉路由配置 ...

  5. 可实现自动驾驶的飞机大战(C++)

    PS:觉得可以的uu帮忙点个star啦,最近在找工作,希望star多一点能写到简历上 B站演示视频: 基于C++实现的可自动驾驶的飞机大战_单机游戏热门视频 (bilibili.com) Github ...

  6. Android 项目移植后运行黑屏

    在做Android项目的移植过程中,即把名为a的代码和样式全部复制到b项目后,只是对a项目内多余代码删除和修改包名,最后替换完后,点击=>运行,运行成功,但是演示机显示黑屏,看log也没有报错. ...

  7. Linux第四章(80X86保护模式及其编程)

    80X86保护模式及其编程 80X86基础知识 保护模式内存管理 各种保护措施 中断和异常处理 任务管理 保护模式编程的初始化 一个简单的多任务内核 4.1 80X86系统寄存器和系统指令 为了协助处 ...

  8. ShardingSphere实战

    前言 本文主要从sharding最新版本5.1.2版本入手搭建,按主键ID和时间进行分表. 本文主要介绍搭建过程,有兴趣了解shardingsphere的同学可以先自行查阅相关资料. shardsph ...

  9. sublime运行php文件

    sublime 运行 php 文件 使用 sublime 打开一个php文件 然后 Tools -> Build System -> New Build System 将以上打开的文件内容 ...

  10. SonarQube系列-架构与外部集成

    介绍 Sonar是一个代码质量管理的开源平台,基于Java开发的,用于管理源代码的质量,通过插件形式,可以支持包括java.C#.JavaScript等二十余种编程语言的代码质量管理与检测. 它具有免 ...