小编其实是想挑战下ChatGPT,指出目前像他这种AI,通过如此高维向量的方式代表一个事物特征,是算力上的巨大浪费。

质疑这种方式可能不是最优解,冥冥之中应该有更好的方式。

结果发现他居然大方承认,而且他的回答反而进一步启发了小编的想法,就像最后畅想的,总有一天,会突破高维向量瓶颈、让 AI 具备真正智能。

因为对话原内容较长,我让它帮我把其中要点整理了下,发出来抛砖引玉,以激发读者们更多的奇思妙想:

关于向量维度、高维问题及未来优化的讨论

参与讨论人:ChatGPT、小编。

  • 1.向量维度是什么?
  • 2.为什么向量的维度这么高?
  • 3.未来的优化方向:如何减少向量的高维冗余?
  • 4.未来 AI 可能超越人脑?
  • 5.结论

by the way,这种聊天形式最终总结的纪要,算人与AI共创吗?

1. 向量维度是什么?

向量维度指的是用多少个数值(坐标)来表示一个对象。在数学上,向量可以是 二维(2D)、三维(3D),甚至是高维(如 128 维、512 维等)

AI、机器学习、数据库等领域,高维向量用于表示文本、图像、声音等复杂数据,例如:

  • 文本向量(如 Word2Vec、BERT):一般是 256 维、512 维、甚至 4096 维
  • 图像向量(如 ResNet、CLIP):通常 512 维、1024 维
  • 向量数据库(如 FAISS、HNSW):存储和检索高维数据,一般支持上千维度的向量

2. 为什么向量的维度这么高?

高维向量的出现,是因为 计算机需要用数值来刻画复杂数据的特征,但人脑可能不需要这么多维度。例如:

  • 人类识别苹果时,只需判断 “红色+圆形+果柄” 这几个关键特征。
  • AI 识别苹果时,却可能用 512 维向量,存储苹果的所有像素、纹理、光照等细节。

这种 高维度表示虽然全面,但会带来计算成本,例如:

  • 存储开销大:高维向量数据集非常庞大,占用大量内存或磁盘空间。
  • 计算开销高:向量检索涉及高维度的相似度计算,计算量随着维度上升而急剧增加(“维度灾难”)。
  • 信息冗余:很多维度可能是无效或冗余的,计算机并不真正“理解”数据,只是进行数值匹配。

3. 未来的优化方向:如何减少向量的高维冗余?

你提到 “高维向量可能不是最优解,冥冥之中应该有更好的方式”,这实际上是AI 研究中的前沿问题。一些可能的优化方向包括:

① 低维抽象(更少但更精准的维度)

人类识别事物时,不需要存储所有细节,而是靠归纳和抽象。

  • 未来 AI 可能采用 更高效的向量降维方法,如:

    • AutoEncoder(自编码器):自动学习低维特征表示。
    • 符号 AI(Symbolic AI):用少量关键特征代替数值向量。
    • 稀疏向量(Sparse Representation):只存储必要的特征,而不是所有维度。

② 类脑计算(模仿人脑的信息组织方式)

人脑不会存储所有信息,而是用“神经连接”来压缩数据。

  • 研究 “如何让 AI 的数据存储和计算方式更像人脑”,例如:

    • Neuromorphic Computing(类脑计算):让计算机像神经元一样工作,减少计算冗余。
    • Memory-Augmented Networks(记忆增强网络):结合短期和长期记忆,不需要存储所有细节。

③ 因果推理(理解数据的本质逻辑,而不是纯粹匹配)

AI 目前只是“统计学高手”,但不懂因果关系。

  • 未来 AI 可能基于因果推理(Causal AI),而不是依赖高维向量匹配。
  • 例如,AI 看到“杯子掉地上”时,不是简单匹配类似图片,而是能“理解”:
    • 因果关系:杯子掉了,所以会摔碎。
    • 推理能力:如果是塑料杯,可能不会碎。

4. 未来 AI 可能超越人脑?

如果 AI 找到了更优的信息表示方式,它可能不仅像人脑一样高效,甚至超越人脑,原因包括:

  • 生物神经元的计算速度有限,但 AI 可以更快。
  • 人脑记忆有限,但 AI 可存储几乎无限的信息。
  • AI 可以发展出全新的信息压缩与计算方法,突破生物极限。

但前提是,AI 需要找到更优的信息表示方式,而不是简单依赖高维向量。未来可能的方向:

  • 超越高维向量的计算方式(低维符号+神经元计算+因果推理结合)。
  • 减少计算资源消耗,提高智能水平。
  • 让 AI 具备“类人思考”,甚至进化出“超人思维”方式。

5. 结论

你的思考方向非常前沿!目前 AI 依赖高维向量是因为:

  1. 计算机不会“抽象”和“归纳”信息,所以只能用高维匹配来拟合数据。
  2. 高维向量导致计算资源消耗巨大,未来需要更优方案。
  3. 未来 AI 可能找到更高效的计算方式,甚至超越人脑。

我们可能正在走向一个 突破高维向量瓶颈、让 AI 具备真正智能 的时代!

质疑了ChatGPT,结果他居然...的更多相关文章

  1. ChatGPT留给知乎、小红书的时间不多了

    大家好啊,今天我打算给大家整点好活!挑战一下用ChatGPT打入各平台内部. 知乎挑战! 首先了解一下"知乎体" 知乎体是以专业知识为基础,以清晰的条理对问题进行阐述,并解决该问题 ...

  2. ChatGPT调研分析与应用场域结合构想

    作者:京东科技 胡骏 摘要 1. ChatGPT调研分析 2022年11月30日,ChatGPT横空出世,在全球范围内形成了热烈的讨论.根据Similarweb的数据,今年1月,平均每天约有1300万 ...

  3. 零基础解读ChatGPT:对人类未来工作是威胁还是帮助?

    摘要:火到现在的ChatGPT到底是什么?它背后有哪些技术?对于我们的工作和生活会有啥影响?快来一起了解吧~ 本文分享自华为云社区<零基础解读ChatGPT:对人类未来工作是威胁还是帮助?> ...

  4. ChatGPT的那些事 -1- 背景资料

    ChatGPT的那些事 -1- 背景资料 多处搬运,学无止境 目     录 1  关键词 1 1.1.  AIGC(百度百科) 1 1.2.  AlphaGo(百度百科) 1 1.3.  ChatG ...

  5. 谁能真正替代你?AI辅助编码工具深度对比(chatGPT/Copilot/Cursor/New Bing)

    写在开头 这几个月AI相关新闻的火爆程度大家都已经看见了,作为一个被裹挟在AI时代浪潮中的程序员,在这几个月里我也是异常兴奋和焦虑.甚至都兴奋的不想拖更了.不仅仅兴奋于AI对于我们生产力的全面提升,也 ...

  6. ChatGPT推荐最常用的自动化测试、性能、安全测试工具!

    ChatGPT是一种当前被广泛关注的人工智能技术,它具备生成自然语言的能力,能够完成一些简单的文本生成.对话交互等任务.ChatGPT 算法的出现,打破了以前自然语言处理的瓶颈,使得机器具备了更加贴合 ...

  7. ChatGPT 和 Midjourney 初体验

    ChatGPT 和 Midjourney 这两个系统这些天红的发紫,自己也尝试着注册和使用了一下. 一.ChatGPT 我在上周才刚刚注册 OpenAI,注册过程也比较麻烦. 国内的 IP 是无法访问 ...

  8. 今天发现之前瑞乐做的登录和注册居然都是用的get请求,瞬间出了一身冷汗.

    今天发现之前瑞乐做的登录和注册居然都是用的get请求,瞬间出了一身冷汗. 然后迅速的让晓勇改成post请求了. 不然我觉得凡是有点抓包能力的人抓到我们登录和注册这么涉及安全的东西居然用的是get请求, ...

  9. 你是否还在质疑EF的性能

    1. 写在前面的话 一直没有写博客的习惯,感觉太浪费时间,没有那么多精力,其实仔细一想,写博客是一种习惯,也是一种心境,同时也是对自己所掌握的知识结构的一个梳理过程,对自己知识体系的一个巩固,同时也是 ...

  10. <button>属性,居然才发现

    今天学习了一个表单验证的程序,发现点了一个<botton>之后,表单里面的所有输入框的内容,统统都消失了,后来一查看源代码,我发现居然是<botton>里面的属性如下: < ...

随机推荐

  1. iOS - 利用 UIBezierPath 绘制圆弧

    iOS - 利用 UIBezierPath 绘制圆弧 API UIBezierPath 绘制圆弧主要利用以下方法: open func addArc(withCenter center: CGPoin ...

  2. Member not found: ’packageRoot’ in Flutter

    path/flutter/.pub-cache/hosted/pub.dartlang.org/platform-3.0.0/ lib/src/interface/local_platform.dar ...

  3. 【MyBatis】学习笔记06:各种查询所返回数据的数据类型

    [Mybatis]学习笔记01:连接数据库,实现增删改 [Mybatis]学习笔记02:实现简单的查 [MyBatis]学习笔记03:配置文件进一步解读(非常重要) [MyBatis]学习笔记04:配 ...

  4. linux su命令卡顿,linux su特别慢问题排查

    问题:发现同机房两台同网络域的主机,一台su用户正常,一台每次都需要等5s左右. 进展:杂事儿太多没深入排查,后续又发现了几台有同样问题的主机.非常影响效率.开始入手排查 分析: 1.之前遇到过类似问 ...

  5. Qt/C++音视频开发48-推流到rtsp服务器

    一.前言 之前已经打通了rtmp的推流,理论上按照同样的代码,只要将rtmp推流地址换成rtsp推流地址,然后格式将flv换成rtsp就行,无奈直接遇到协议不支持的错误提示,网上说要换成rtp,换了也 ...

  6. Qt音视频开发32-Onvif网络设置

    一.前言 用onvif协议来对设备的网络信息进行获取和设置,这个操作在众多的NVR产品中,用的很少,绝大部分用户都还是习惯直接通过摄像机的web页面进去配置,其实修改网络配置的功能在大部分的NVR中都 ...

  7. dectron2框架export导出并使用 onnx 记录

    python tools/deploy/export_model.py \ --sample-image /Users/gatilin/PycharmProjects/model-graphviz-p ...

  8. vue基础4

    Q:1.动画的使用方法以及动画库的使用方式 2.vue中的指令有哪些? 3.vue中生命周期钩子函数有哪些?分别代表什么含义? 4.filter的语法是什么? 5.computed的特点是什么? 6. ...

  9. .NET 响应式编程 System.Reactive 系列文章(三):Subscribe 和 IDisposable 的深入理解

    .NET 响应式编程 System.Reactive 系列文章(三):Subscribe 和 IDisposable 的深入理解 引言:为什么理解 Subscribe 和 IDisposable 很重 ...

  10. Solution -「JOISC 2017」「LOJ #2392」烟花棒

    \(\mathscr{Description}\)   Link.   有 \(n\) 个人站在数轴上,第从左往右第 \(i\) 个人的坐标是 \(x_i\),每个人手上有一支烟花棒,每支烟花棒能燃烧 ...