小编其实是想挑战下ChatGPT,指出目前像他这种AI,通过如此高维向量的方式代表一个事物特征,是算力上的巨大浪费。

质疑这种方式可能不是最优解,冥冥之中应该有更好的方式。

结果发现他居然大方承认,而且他的回答反而进一步启发了小编的想法,就像最后畅想的,总有一天,会突破高维向量瓶颈、让 AI 具备真正智能。

因为对话原内容较长,我让它帮我把其中要点整理了下,发出来抛砖引玉,以激发读者们更多的奇思妙想:

关于向量维度、高维问题及未来优化的讨论

参与讨论人:ChatGPT、小编。

  • 1.向量维度是什么?
  • 2.为什么向量的维度这么高?
  • 3.未来的优化方向:如何减少向量的高维冗余?
  • 4.未来 AI 可能超越人脑?
  • 5.结论

by the way,这种聊天形式最终总结的纪要,算人与AI共创吗?

1. 向量维度是什么?

向量维度指的是用多少个数值(坐标)来表示一个对象。在数学上,向量可以是 二维(2D)、三维(3D),甚至是高维(如 128 维、512 维等)

AI、机器学习、数据库等领域,高维向量用于表示文本、图像、声音等复杂数据,例如:

  • 文本向量(如 Word2Vec、BERT):一般是 256 维、512 维、甚至 4096 维
  • 图像向量(如 ResNet、CLIP):通常 512 维、1024 维
  • 向量数据库(如 FAISS、HNSW):存储和检索高维数据,一般支持上千维度的向量

2. 为什么向量的维度这么高?

高维向量的出现,是因为 计算机需要用数值来刻画复杂数据的特征,但人脑可能不需要这么多维度。例如:

  • 人类识别苹果时,只需判断 “红色+圆形+果柄” 这几个关键特征。
  • AI 识别苹果时,却可能用 512 维向量,存储苹果的所有像素、纹理、光照等细节。

这种 高维度表示虽然全面,但会带来计算成本,例如:

  • 存储开销大:高维向量数据集非常庞大,占用大量内存或磁盘空间。
  • 计算开销高:向量检索涉及高维度的相似度计算,计算量随着维度上升而急剧增加(“维度灾难”)。
  • 信息冗余:很多维度可能是无效或冗余的,计算机并不真正“理解”数据,只是进行数值匹配。

3. 未来的优化方向:如何减少向量的高维冗余?

你提到 “高维向量可能不是最优解,冥冥之中应该有更好的方式”,这实际上是AI 研究中的前沿问题。一些可能的优化方向包括:

① 低维抽象(更少但更精准的维度)

人类识别事物时,不需要存储所有细节,而是靠归纳和抽象。

  • 未来 AI 可能采用 更高效的向量降维方法,如:

    • AutoEncoder(自编码器):自动学习低维特征表示。
    • 符号 AI(Symbolic AI):用少量关键特征代替数值向量。
    • 稀疏向量(Sparse Representation):只存储必要的特征,而不是所有维度。

② 类脑计算(模仿人脑的信息组织方式)

人脑不会存储所有信息,而是用“神经连接”来压缩数据。

  • 研究 “如何让 AI 的数据存储和计算方式更像人脑”,例如:

    • Neuromorphic Computing(类脑计算):让计算机像神经元一样工作,减少计算冗余。
    • Memory-Augmented Networks(记忆增强网络):结合短期和长期记忆,不需要存储所有细节。

③ 因果推理(理解数据的本质逻辑,而不是纯粹匹配)

AI 目前只是“统计学高手”,但不懂因果关系。

  • 未来 AI 可能基于因果推理(Causal AI),而不是依赖高维向量匹配。
  • 例如,AI 看到“杯子掉地上”时,不是简单匹配类似图片,而是能“理解”:
    • 因果关系:杯子掉了,所以会摔碎。
    • 推理能力:如果是塑料杯,可能不会碎。

4. 未来 AI 可能超越人脑?

如果 AI 找到了更优的信息表示方式,它可能不仅像人脑一样高效,甚至超越人脑,原因包括:

  • 生物神经元的计算速度有限,但 AI 可以更快。
  • 人脑记忆有限,但 AI 可存储几乎无限的信息。
  • AI 可以发展出全新的信息压缩与计算方法,突破生物极限。

但前提是,AI 需要找到更优的信息表示方式,而不是简单依赖高维向量。未来可能的方向:

  • 超越高维向量的计算方式(低维符号+神经元计算+因果推理结合)。
  • 减少计算资源消耗,提高智能水平。
  • 让 AI 具备“类人思考”,甚至进化出“超人思维”方式。

5. 结论

你的思考方向非常前沿!目前 AI 依赖高维向量是因为:

  1. 计算机不会“抽象”和“归纳”信息,所以只能用高维匹配来拟合数据。
  2. 高维向量导致计算资源消耗巨大,未来需要更优方案。
  3. 未来 AI 可能找到更高效的计算方式,甚至超越人脑。

我们可能正在走向一个 突破高维向量瓶颈、让 AI 具备真正智能 的时代!

质疑了ChatGPT,结果他居然...的更多相关文章

  1. ChatGPT留给知乎、小红书的时间不多了

    大家好啊,今天我打算给大家整点好活!挑战一下用ChatGPT打入各平台内部. 知乎挑战! 首先了解一下"知乎体" 知乎体是以专业知识为基础,以清晰的条理对问题进行阐述,并解决该问题 ...

  2. ChatGPT调研分析与应用场域结合构想

    作者:京东科技 胡骏 摘要 1. ChatGPT调研分析 2022年11月30日,ChatGPT横空出世,在全球范围内形成了热烈的讨论.根据Similarweb的数据,今年1月,平均每天约有1300万 ...

  3. 零基础解读ChatGPT:对人类未来工作是威胁还是帮助?

    摘要:火到现在的ChatGPT到底是什么?它背后有哪些技术?对于我们的工作和生活会有啥影响?快来一起了解吧~ 本文分享自华为云社区<零基础解读ChatGPT:对人类未来工作是威胁还是帮助?> ...

  4. ChatGPT的那些事 -1- 背景资料

    ChatGPT的那些事 -1- 背景资料 多处搬运,学无止境 目     录 1  关键词 1 1.1.  AIGC(百度百科) 1 1.2.  AlphaGo(百度百科) 1 1.3.  ChatG ...

  5. 谁能真正替代你?AI辅助编码工具深度对比(chatGPT/Copilot/Cursor/New Bing)

    写在开头 这几个月AI相关新闻的火爆程度大家都已经看见了,作为一个被裹挟在AI时代浪潮中的程序员,在这几个月里我也是异常兴奋和焦虑.甚至都兴奋的不想拖更了.不仅仅兴奋于AI对于我们生产力的全面提升,也 ...

  6. ChatGPT推荐最常用的自动化测试、性能、安全测试工具!

    ChatGPT是一种当前被广泛关注的人工智能技术,它具备生成自然语言的能力,能够完成一些简单的文本生成.对话交互等任务.ChatGPT 算法的出现,打破了以前自然语言处理的瓶颈,使得机器具备了更加贴合 ...

  7. ChatGPT 和 Midjourney 初体验

    ChatGPT 和 Midjourney 这两个系统这些天红的发紫,自己也尝试着注册和使用了一下. 一.ChatGPT 我在上周才刚刚注册 OpenAI,注册过程也比较麻烦. 国内的 IP 是无法访问 ...

  8. 今天发现之前瑞乐做的登录和注册居然都是用的get请求,瞬间出了一身冷汗.

    今天发现之前瑞乐做的登录和注册居然都是用的get请求,瞬间出了一身冷汗. 然后迅速的让晓勇改成post请求了. 不然我觉得凡是有点抓包能力的人抓到我们登录和注册这么涉及安全的东西居然用的是get请求, ...

  9. 你是否还在质疑EF的性能

    1. 写在前面的话 一直没有写博客的习惯,感觉太浪费时间,没有那么多精力,其实仔细一想,写博客是一种习惯,也是一种心境,同时也是对自己所掌握的知识结构的一个梳理过程,对自己知识体系的一个巩固,同时也是 ...

  10. <button>属性,居然才发现

    今天学习了一个表单验证的程序,发现点了一个<botton>之后,表单里面的所有输入框的内容,统统都消失了,后来一查看源代码,我发现居然是<botton>里面的属性如下: < ...

随机推荐

  1. 明察秋毫--用ss工具统计网络栈内存使用

    前言 本文介绍了用ss工具来统计一下当前网络栈的内存使用情况 环境准备 组件 版本 操作系统 Ubuntu 22.04.4 LTS 查看socket内存相关参数,-m 参数 ss -tm State ...

  2. 中电金信:“人工智能+”首次写入政府工作报告,各大企业何以破局AI模型挑战

    ​2024年全球新一轮技术变革加速来临,大模型作为人工智能发展的核心引擎,正引发一场全新的工业革命.今年全国两会期间,人工智能成为最热话题之一."人工智能+"首次被写入政府工作报告 ...

  3. Terraform Aliyun 创建ecs, kubernetes 实例

    Terraform Aliyun 创建ecs, kubernetes 实例 terraform demo for aliyun 创建vpc, 网关, EIP, ecs, kubernetes, Ser ...

  4. 用SQL命令查看Mysql数据库大小 统计数据库空间占用

    -- 1. 进入information_schema 数据库(存放了其他的数据库的信息) use information_schema; -- 2. 查询所有数据的大小: select concat( ...

  5. NJU ICS2024 PA 作业心得(三)

    NJU ICS2024 PA 作业心得(三) 需要参考的内容 RISC-V ABIs Specification:是一组规则和规范,定义了在 RISC-V 架构上编写和链接程序的方式.它确保了不同语言 ...

  6. Qt支持RKMPP硬解的视频监控系统/性能卓越界面精美/实时性好延迟低/录像存储和回放/云台控制

    一.前言 之前做的监控系统,已经实现了在windows上硬解码比如dxva2和d3d11va,后续又增加了linux上的硬解vdpau的支持,这几种方式都是跨系统的硬解实现方案,也是就是如果都是win ...

  7. Qt编写视频监控系统73-不同视频流不同类型的判断和解析(http/m3u8/rtsp/rtmp等)

    一.前言 这套视频监控系统大概从2018年起步整体框架,一步步积累到现在,中间经历了无数次的各种视频文件.视频流.视频设备的播放测试,比如光视频文件就有mp4/wmv/rmvb/mkv/avi等格式, ...

  8. Android-studio-ide-201.7042882-windows-4.1.2项目卡在Gradle: Download gradle-6.5-bin.zip

    现象描述: Android-studio-ide-201.7042882-windows-4.1.2项目卡在Gradle: Download gradle-6.5-bin.zip,如下所示: 原因分析 ...

  9. 【问题解决记录】vue解决低版本安卓与ios10以下系统兼容性问题

    问题描述: 项目中的企业微信内部应用,使用Vue-cli搭建的H5页面web,在低版本的安卓手机或ios8.0.9.0中出现接口数据访问失败,HTTP状态码返回0的问题,无法正常使用系统.安卓手机主要 ...

  10. .net core 用 identitymodel 请求token。

    identitymodel  也有在Nuget里搜索和安装. identitymodel 扩展了HttpClient的一些方法用于token请求. 例如:client.RequestTokenAsyn ...