一个疑问:foundation models , 现在已经有了视觉的大模型也有了语言大模型,那么什么时候会有强化学习大模型,更准确的说什么时候会有强化学习的基础模型(foundation models)
一个疑问:foundation models , 现在已经有了视觉的大模型也有了语言大模型,那么什么时候会有强化学习大模型,更准确的说什么时候会有强化学习的基础模型(foundation models)
相关:
https://www.youtube.com/watch?v=QPQy7jUpmyA

首先,要声明,这是我早起赖床时候想的一个问题,可以说是完全的胡想的一个问题。
其次,必须要说明的是,我认为这个问题是一个伪命题,因为我认为视觉上不可能出现一个强化学习大模型,因为不论是语言大模型还是视觉大模型,其都是面向于具体的应用和某个具体方向的,这就像不会有监督学习大模型和无监督学习大模型一样,因为这样分类的话实在是太过于宽泛,而且要知道即使说现在大模型特别多,各种的foundation models,但是其实不同的领域和不同的应用都是有着不同的各自的大模型的,比如:生成图像的有图像大模型,生成视频的有视频大模型,对话系统的有语言大模型,识别物体的有视觉大模型,下棋的有下棋大模型,进行天气预报的有天气预报大模型,进行工业设备故障检测的有工业检测大模型,等等。可以说现在的大模型和foundation models看着很强大,但是其实各个模型都只是针对某个细化领域和具体方向的大模型,而不是像监督学习、无监督学习、强化学习那种把所有的学习类型或者某个大类的学习模型都包括,一个最简单的例子,语言大模型只是无监督模型里面的一个小部分,只是无监督学习里面的自然语言方向的对话系统中的一个模型,但是实际上无监督学习里还有其他的方向,比如无监督的视觉学习模型,等等,而且现在的语言大模型也只是对话系统大模型,而自然语言里面还有细分类别,比如:语言转文字、文字转语音、语音和语气、人物年龄、男女性别相互匹配、文章摘要总结、因果逻辑推导、文本分类、情感分析,等等,但是不得不说的是现在的对话系统的语言大模型也确实很优秀,因为现在的这个模型除了能生成比较要人满意的对话同时还能解决翻译、和简单的文字总结以及一些简单的逻辑推理问题,但是即使如此,作为人类历史上目前最优秀的语言模型现在依旧只是解决部分的NLP问题,而不是所有的NLP问题,更不用说是监督学习和无监督学习这种大分类的层面了。(据说今年年内OpenAI继推出ChatGPT后要推出AI搜索引擎,对标Google,不过这也是后话了,而且即使把搜索加上那也是两个大模型,一个是ChatGPT大模型,一个是搜索大模型,而不是把这两个产品做到一个产品里面)
最后,可以知道语言大模型(特指对话系统),其难度和所需的数据量是要远远小于视觉大模型的,NLP是人类后天创造的,这个数据数量再大也是有限的,Web级的文本数量再大那也只是以GB为单位的,但是视觉是自然觉本身就存在的,一个物体在不同的光照不同的角度下的呈现都是不同的,更何况自然界中的物体存在的数量是远远高于人类创造的语言文本的,而且视觉数据的收集难度也是远远高于文本数据的,毕竟电子化的文本数据是可以用爬虫爬下来的,而自然界中的图像数据总不能拍人一个一个的拍下来,而且还需要不同角度的拍,并且同一类物体其外表也是不尽相同的,比如苹果也还分品种、颜色、大小,等等,因此单从数据收集上来说数据大模型就很难做到语言大模型的这种程度。那么对于强化学习来说,这个数据量就更大了,甚至是最大的,自然语言是人类创造的,视觉图像是自然界中本身存在的,而强化学习是需要人类和自然界中物体进行交互的数据,这个数据量力量上来说是自然语言数据量与视觉图像数据量的乘积,注意,这里是乘积而不是加和,可以说这个难度是远远超过语言模型和视觉模型的。
上面先分析了强化学习大模型在理论上就不可能出现,然后又出数据量收集和学习难度上来分析强化学习大模型存在的不现实性,下面就该说说未来可能存在的“强化学习大模型”,注意这里指的是pseudo foundation models for Reinforcement Learning。
我认为未来的强化学习大模型肯定是存在的,当然这里是指“pseudo”版本的,也就是面向于某种特定场景的大模型,比如分拣系统的强化学习大模型,这种foundation models可以快速的适用这一类的问题,比如可以适应苹果分拣的场景,也可以快速适应梨的分拣,还能解决工件的分拣,还能解决垃圾分拣,等等。未来的强化学习大模型应该就是该种形式的,只是面向某一类场景下的大模型,这种大模型虽然感觉好像low一些,但是其价值是不会比语言大模型和视觉大模型差的,甚至更有实际价值,因为我们的各种科技,各种AI大模型最后都是要服务于实体经济的,不能落地的科技还是不完整的,还是对未来这种pseudo版本的强化学习大模型抱有期待的。
一个疑问:foundation models , 现在已经有了视觉的大模型也有了语言大模型,那么什么时候会有强化学习大模型,更准确的说什么时候会有强化学习的基础模型(foundation models)的更多相关文章
- ThinkPHP 学习笔记 ( 三 ) 数据库操作之数据表模型和基础模型 ( Model )
//TP 恶补ing... 一.定义数据表模型 1.模型映射 要测试数据库是否正常连接,最直接的办法就是在当前控制器中实例化数据表,然后使用 dump 函数输出,查看数据库的链接状态.代码: publ ...
- 一个标准的,兼容性很好的div仿框架的基础模型!
<!DOCTYPE html> <html > <head> <meta http-equiv="Content-Type" conten ...
- linux下bus、devices和platform的基础模型
转自:http://blog.chinaunix.net/uid-20672257-id-3147337.html 一.kobject的定义:kobject是Linux2.6引入的设备管理机制,在内核 ...
- [您有新的未分配科技点]博弈论进阶:似乎不那么恐惧了…… (SJ定理,简单的基础模型)
这次,我们来继续学习博弈论的知识.今天我们会学习更多的基础模型,以及SJ定理的应用. 首先,我们来看博弈论在DAG上的应用.首先来看一个小例子:在一个有向无环图中,有一个棋子从某一个点开始一直向它的出 ...
- linux下bus、devices和platform的基础模型 【转】
转自:http://blog.chinaunix.net/uid-20672257-id-3147337.html 一.kobject的定义:kobject是Linux2.6引入的设备管理机制,在内核 ...
- 百度DMLC分布式深度机器学习开源项目(简称“深盟”)上线了如xgboost(速度快效果好的Boosting模型)、CXXNET(极致的C++深度学习库)、Minerva(高效灵活的并行深度学习引擎)以及Parameter Server(一小时训练600T数据)等产品,在语音识别、OCR识别、人脸识别以及计算效率提升上发布了多个成熟产品。
百度为何开源深度机器学习平台? 有一系列领先优势的百度却选择开源其深度机器学习平台,为何交底自己的核心技术?深思之下,却是在面对业界无奈时的远见之举. 5月20日,百度在github上开源了其 ...
- odoo开发基础--模型之基本字段类型
定义模型的时候,和python的其他框架类似,可以对比Django,同样是一个模型即:一个class对应生成数据库中的一张表, 只是odoo的继承机制比较复杂一点,在日常的开发中,定义模型的时候, 基 ...
- ThinkPHP 数据库操作之数据表模型和基础模型 ( Model )
一.定义数据表模型 1.模型映射 要测试数据库是否正常连接,最直接的办法就是在当前控制器中实例化数据表,然后使用 dump 函数输出,查看数据库的链接状态.代码: public function te ...
- [20180713]关于hash join 测试中一个疑问.txt
[20180713]关于hash join 测试中一个疑问.txt --//上个星期做的测试,链接: http://blog.itpub.net/267265/viewspace-2157424/-- ...
- 一款基础模型的JS打飞机游戏特效代码
<!DOCTYPE html> <html lang="en"> <head> <title>一款基础模型的JS打飞机游戏特效代码& ...
随机推荐
- 用 Easysearch 帮助大型车企降本增效
最近某头部汽车集团需要针对当前 ES 集群进行优化,背景如下: ES 用于支撑包括核心营销系统.管理支持系统.财务类.IT 基础设施类.研发.自动驾驶等多个重要应用,合计超 50 余套集群,累计数据超 ...
- 使用final shell 连接使用 ubuntu server linux
书接上回,VM 安装ubuntu server:https://www.cnblogs.com/runliuv/p/16880599.html 1.从 https://www.hostbuf.com/ ...
- 前端使用 Konva 实现可视化设计器(14)- 折线 - 最优路径应用【代码篇】
话接上回<前端使用 Konva 实现可视化设计器(13)- 折线 - 最优路径应用[思路篇]>,这一章继续说说相关的代码如何构思的,如何一步步构建数据模型可供 AStar 算法进行路径规划 ...
- 一款.NET开源、功能强大、跨平台的绘图库 - OxyPlot
前言 今天大姚给大家分享一款.NET开源(MIT License).免费.跨平台.功能强大的绘图库,支持多平台使用(包括:WPF.UWP.WinForm.Silverlight.Xamarin.iOS ...
- Java8 - sum求和,将 List 集合转为 Map,key去重(groupingBy),sorted排序
Java8 - sum求和,将 List 集合转为 Map,key去重(groupingBy),sorted排序 package com.example.core.mydemo.java8; publ ...
- windows nexus-3.20安装
1.Nexus官网:https://www.sonatype.com/download-oss-sonatype 2.环境变量NEXUS_HOME = D:\nexus-3.20.1-01-win64 ...
- 【已结束】阿珏Blog三周年特别纪念活动
Tips:当你看到这个提示的时候,说明当前的文章是由原emlog博客系统搬迁至此的,文章发布时间已过于久远,编排和内容不一定完整,还请谅解` [已结束]阿珏Blog三周年特别纪念活动 日期:2019- ...
- 看李沐的 ViT 串讲
ViT 概括 论文题目:AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE 论文地址:https:// ...
- C++判断当前程序是否运行在Windows展台(Kiosk)模式下
Windows有一个展台(Kiosk)模式.展台模式可以使Windows作为数字标牌进行使用.具体请参考Windows 展台 配置完展台模式,重启设备后,Windows会以全屏的方式运行展台应用,无法 ...
- 2. 标签上 title 与 alt 属性的区别是什么?
1. alt 是给搜索引擎识别,在图像无法显示时的替代文本2. title 是关于元素的注释信息,主要是给用户解读.3.当鼠标放到文字或是图片上时有 title 文字显示.(因为 IE 不标准)在 I ...