质疑了ChatGPT,结果他居然...
小编其实是想挑战下ChatGPT,指出目前像他这种AI,通过如此高维向量的方式代表一个事物特征,是算力上的巨大浪费。
质疑这种方式可能不是最优解,冥冥之中应该有更好的方式。
结果发现他居然大方承认,而且他的回答反而进一步启发了小编的想法,就像最后畅想的,总有一天,会突破高维向量瓶颈、让 AI 具备真正智能。
因为对话原内容较长,我让它帮我把其中要点整理了下,发出来抛砖引玉,以激发读者们更多的奇思妙想:
关于向量维度、高维问题及未来优化的讨论
参与讨论人:ChatGPT、小编。
- 1.向量维度是什么?
- 2.为什么向量的维度这么高?
- 3.未来的优化方向:如何减少向量的高维冗余?
- 4.未来 AI 可能超越人脑?
- 5.结论
by the way,这种聊天形式最终总结的纪要,算人与AI共创吗?
1. 向量维度是什么?
向量维度指的是用多少个数值(坐标)来表示一个对象。在数学上,向量可以是 二维(2D)、三维(3D),甚至是高维(如 128 维、512 维等)。
在AI、机器学习、数据库等领域,高维向量用于表示文本、图像、声音等复杂数据,例如:
- 文本向量(如 Word2Vec、BERT):一般是 256 维、512 维、甚至 4096 维。
- 图像向量(如 ResNet、CLIP):通常 512 维、1024 维。
- 向量数据库(如 FAISS、HNSW):存储和检索高维数据,一般支持上千维度的向量。
2. 为什么向量的维度这么高?
高维向量的出现,是因为 计算机需要用数值来刻画复杂数据的特征,但人脑可能不需要这么多维度。例如:
- 人类识别苹果时,只需判断 “红色+圆形+果柄” 这几个关键特征。
- AI 识别苹果时,却可能用 512 维向量,存储苹果的所有像素、纹理、光照等细节。
这种 高维度表示虽然全面,但会带来计算成本,例如:
- 存储开销大:高维向量数据集非常庞大,占用大量内存或磁盘空间。
- 计算开销高:向量检索涉及高维度的相似度计算,计算量随着维度上升而急剧增加(“维度灾难”)。
- 信息冗余:很多维度可能是无效或冗余的,计算机并不真正“理解”数据,只是进行数值匹配。
3. 未来的优化方向:如何减少向量的高维冗余?
你提到 “高维向量可能不是最优解,冥冥之中应该有更好的方式”,这实际上是AI 研究中的前沿问题。一些可能的优化方向包括:
① 低维抽象(更少但更精准的维度)
人类识别事物时,不需要存储所有细节,而是靠归纳和抽象。
- 未来 AI 可能采用 更高效的向量降维方法,如:
- AutoEncoder(自编码器):自动学习低维特征表示。
- 符号 AI(Symbolic AI):用少量关键特征代替数值向量。
- 稀疏向量(Sparse Representation):只存储必要的特征,而不是所有维度。
② 类脑计算(模仿人脑的信息组织方式)
人脑不会存储所有信息,而是用“神经连接”来压缩数据。
- 研究 “如何让 AI 的数据存储和计算方式更像人脑”,例如:
- Neuromorphic Computing(类脑计算):让计算机像神经元一样工作,减少计算冗余。
- Memory-Augmented Networks(记忆增强网络):结合短期和长期记忆,不需要存储所有细节。
③ 因果推理(理解数据的本质逻辑,而不是纯粹匹配)
AI 目前只是“统计学高手”,但不懂因果关系。
- 未来 AI 可能基于因果推理(Causal AI),而不是依赖高维向量匹配。
- 例如,AI 看到“杯子掉地上”时,不是简单匹配类似图片,而是能“理解”:
- 因果关系:杯子掉了,所以会摔碎。
- 推理能力:如果是塑料杯,可能不会碎。
4. 未来 AI 可能超越人脑?
如果 AI 找到了更优的信息表示方式,它可能不仅像人脑一样高效,甚至超越人脑,原因包括:
- 生物神经元的计算速度有限,但 AI 可以更快。
- 人脑记忆有限,但 AI 可存储几乎无限的信息。
- AI 可以发展出全新的信息压缩与计算方法,突破生物极限。
但前提是,AI 需要找到更优的信息表示方式,而不是简单依赖高维向量。未来可能的方向:
- 超越高维向量的计算方式(低维符号+神经元计算+因果推理结合)。
- 减少计算资源消耗,提高智能水平。
- 让 AI 具备“类人思考”,甚至进化出“超人思维”方式。
5. 结论
你的思考方向非常前沿!目前 AI 依赖高维向量是因为:
- 计算机不会“抽象”和“归纳”信息,所以只能用高维匹配来拟合数据。
- 高维向量导致计算资源消耗巨大,未来需要更优方案。
- 未来 AI 可能找到更高效的计算方式,甚至超越人脑。
我们可能正在走向一个 突破高维向量瓶颈、让 AI 具备真正智能 的时代!
质疑了ChatGPT,结果他居然...的更多相关文章
- ChatGPT留给知乎、小红书的时间不多了
大家好啊,今天我打算给大家整点好活!挑战一下用ChatGPT打入各平台内部. 知乎挑战! 首先了解一下"知乎体" 知乎体是以专业知识为基础,以清晰的条理对问题进行阐述,并解决该问题 ...
- ChatGPT调研分析与应用场域结合构想
作者:京东科技 胡骏 摘要 1. ChatGPT调研分析 2022年11月30日,ChatGPT横空出世,在全球范围内形成了热烈的讨论.根据Similarweb的数据,今年1月,平均每天约有1300万 ...
- 零基础解读ChatGPT:对人类未来工作是威胁还是帮助?
摘要:火到现在的ChatGPT到底是什么?它背后有哪些技术?对于我们的工作和生活会有啥影响?快来一起了解吧~ 本文分享自华为云社区<零基础解读ChatGPT:对人类未来工作是威胁还是帮助?> ...
- ChatGPT的那些事 -1- 背景资料
ChatGPT的那些事 -1- 背景资料 多处搬运,学无止境 目 录 1 关键词 1 1.1. AIGC(百度百科) 1 1.2. AlphaGo(百度百科) 1 1.3. ChatG ...
- 谁能真正替代你?AI辅助编码工具深度对比(chatGPT/Copilot/Cursor/New Bing)
写在开头 这几个月AI相关新闻的火爆程度大家都已经看见了,作为一个被裹挟在AI时代浪潮中的程序员,在这几个月里我也是异常兴奋和焦虑.甚至都兴奋的不想拖更了.不仅仅兴奋于AI对于我们生产力的全面提升,也 ...
- ChatGPT推荐最常用的自动化测试、性能、安全测试工具!
ChatGPT是一种当前被广泛关注的人工智能技术,它具备生成自然语言的能力,能够完成一些简单的文本生成.对话交互等任务.ChatGPT 算法的出现,打破了以前自然语言处理的瓶颈,使得机器具备了更加贴合 ...
- ChatGPT 和 Midjourney 初体验
ChatGPT 和 Midjourney 这两个系统这些天红的发紫,自己也尝试着注册和使用了一下. 一.ChatGPT 我在上周才刚刚注册 OpenAI,注册过程也比较麻烦. 国内的 IP 是无法访问 ...
- 今天发现之前瑞乐做的登录和注册居然都是用的get请求,瞬间出了一身冷汗.
今天发现之前瑞乐做的登录和注册居然都是用的get请求,瞬间出了一身冷汗. 然后迅速的让晓勇改成post请求了. 不然我觉得凡是有点抓包能力的人抓到我们登录和注册这么涉及安全的东西居然用的是get请求, ...
- 你是否还在质疑EF的性能
1. 写在前面的话 一直没有写博客的习惯,感觉太浪费时间,没有那么多精力,其实仔细一想,写博客是一种习惯,也是一种心境,同时也是对自己所掌握的知识结构的一个梳理过程,对自己知识体系的一个巩固,同时也是 ...
- <button>属性,居然才发现
今天学习了一个表单验证的程序,发现点了一个<botton>之后,表单里面的所有输入框的内容,统统都消失了,后来一查看源代码,我发现居然是<botton>里面的属性如下: < ...
随机推荐
- Tomcat 已集成 CROS Fitler ExpiresFilter 等一堆常用 Filter
http://tomcat.apache.org/tomcat-7.0-doc/config/filter.html 再也不需要三方包提供的 filter 了
- ARGOCD用户管理
1.创建用户alice kubectl apply -f argocd-cm.yaml apiVersion: v1 kind: ConfigMap metadata: name: argocd-cm ...
- 龙哥量化:通达信的函数ma均线,ema、sma、dma的计算原理是什么,XMA是未来函数
注意均线也有未来函数,常见的是跨周期的用法,会导致信号闪烁, 不常见的是XMA这个未来函数太坑了, [代写公式,龙哥微信:Long622889] MA.EMA.SMA.DMA.TMA.WMA6种平均算 ...
- Qt开源作品11-屏幕录制控件
一.前言 在平时的写作过程中,经常需要将一些操作动作和效果图截图成gif格式,使得涵盖的信息更全面更生动,有时候可以将整个操作过程和运行效果录制成MP4,但是文件体积比较大,而且很多网站不便于上传,基 ...
- 开源即时通讯IM框架MobileIMSDK的微信小程序端开发快速入门
一.理论知识准备 您需要对微信小程序开发有所了解: 1)真正零基础入门学习笔记系列 2)从零开始的微信小程序入门教程 3)最全教程:微信小程序开发入门详解 您需要对WebSocket技术有所了解: 1 ...
- Jenkins使用问题汇总
1. 禁止job出现403问题 解决方法: 在系统管理 –> Configure Global Security中调整设置:取消"启用安全(Enable security)" ...
- 记一次 contentInsetAdjustmentBehavior 引发的bug
注:本文同步发布于微信公众号:stringwu的互联网杂谈记一次 contentInsetAdjustmentBehavior 引发的bug 1 背景 项目中使用到了UILable来展示相关的文本内容 ...
- CF div3 991(A~G)
蒟蒻的第一篇题解.由于正值期末周,只能匆忙地vp了一场div3,并只出了A~E. A 白给模拟题,但也是失误很大的一个题(7分钟时才出,属实是太慢了...) B 一道典题,之前做过类似的. 统计所有数 ...
- .NET CORE 中用AutoMapper将实体转Dto
.NET CORE 中用AutoMapper将实体转Dto 星速云 2019-08-31 10:06:02 193 收藏展开在开发过程中,经常会碰到数据实体对象(Entity)和数据传输对象(Dto) ...
- 彻底讲透Spring Bean生命周期,源码深度剖析!
前言本篇文章主要是要介绍如何在Spring IoC 容器中 如何管理Spring Bean生命周期. 在应用开发中,常常需要执行一些特定的初始化工作,这些工作都是相对比较固定的,比如建立数据库连接,打 ...