一个疑问:foundation models , 现在已经有了视觉的大模型也有了语言大模型,那么什么时候会有强化学习大模型,更准确的说什么时候会有强化学习的基础模型(foundation models)
一个疑问:foundation models , 现在已经有了视觉的大模型也有了语言大模型,那么什么时候会有强化学习大模型,更准确的说什么时候会有强化学习的基础模型(foundation models)
相关:
https://www.youtube.com/watch?v=QPQy7jUpmyA
首先,要声明,这是我早起赖床时候想的一个问题,可以说是完全的胡想的一个问题。
其次,必须要说明的是,我认为这个问题是一个伪命题,因为我认为视觉上不可能出现一个强化学习大模型,因为不论是语言大模型还是视觉大模型,其都是面向于具体的应用和某个具体方向的,这就像不会有监督学习大模型和无监督学习大模型一样,因为这样分类的话实在是太过于宽泛,而且要知道即使说现在大模型特别多,各种的foundation models,但是其实不同的领域和不同的应用都是有着不同的各自的大模型的,比如:生成图像的有图像大模型,生成视频的有视频大模型,对话系统的有语言大模型,识别物体的有视觉大模型,下棋的有下棋大模型,进行天气预报的有天气预报大模型,进行工业设备故障检测的有工业检测大模型,等等。可以说现在的大模型和foundation models看着很强大,但是其实各个模型都只是针对某个细化领域和具体方向的大模型,而不是像监督学习、无监督学习、强化学习那种把所有的学习类型或者某个大类的学习模型都包括,一个最简单的例子,语言大模型只是无监督模型里面的一个小部分,只是无监督学习里面的自然语言方向的对话系统中的一个模型,但是实际上无监督学习里还有其他的方向,比如无监督的视觉学习模型,等等,而且现在的语言大模型也只是对话系统大模型,而自然语言里面还有细分类别,比如:语言转文字、文字转语音、语音和语气、人物年龄、男女性别相互匹配、文章摘要总结、因果逻辑推导、文本分类、情感分析,等等,但是不得不说的是现在的对话系统的语言大模型也确实很优秀,因为现在的这个模型除了能生成比较要人满意的对话同时还能解决翻译、和简单的文字总结以及一些简单的逻辑推理问题,但是即使如此,作为人类历史上目前最优秀的语言模型现在依旧只是解决部分的NLP问题,而不是所有的NLP问题,更不用说是监督学习和无监督学习这种大分类的层面了。(据说今年年内OpenAI继推出ChatGPT后要推出AI搜索引擎,对标Google,不过这也是后话了,而且即使把搜索加上那也是两个大模型,一个是ChatGPT大模型,一个是搜索大模型,而不是把这两个产品做到一个产品里面)
最后,可以知道语言大模型(特指对话系统),其难度和所需的数据量是要远远小于视觉大模型的,NLP是人类后天创造的,这个数据数量再大也是有限的,Web级的文本数量再大那也只是以GB为单位的,但是视觉是自然觉本身就存在的,一个物体在不同的光照不同的角度下的呈现都是不同的,更何况自然界中的物体存在的数量是远远高于人类创造的语言文本的,而且视觉数据的收集难度也是远远高于文本数据的,毕竟电子化的文本数据是可以用爬虫爬下来的,而自然界中的图像数据总不能拍人一个一个的拍下来,而且还需要不同角度的拍,并且同一类物体其外表也是不尽相同的,比如苹果也还分品种、颜色、大小,等等,因此单从数据收集上来说数据大模型就很难做到语言大模型的这种程度。那么对于强化学习来说,这个数据量就更大了,甚至是最大的,自然语言是人类创造的,视觉图像是自然界中本身存在的,而强化学习是需要人类和自然界中物体进行交互的数据,这个数据量力量上来说是自然语言数据量与视觉图像数据量的乘积,注意,这里是乘积而不是加和,可以说这个难度是远远超过语言模型和视觉模型的。
上面先分析了强化学习大模型在理论上就不可能出现,然后又出数据量收集和学习难度上来分析强化学习大模型存在的不现实性,下面就该说说未来可能存在的“强化学习大模型”,注意这里指的是pseudo foundation models for Reinforcement Learning。
我认为未来的强化学习大模型肯定是存在的,当然这里是指“pseudo”版本的,也就是面向于某种特定场景的大模型,比如分拣系统的强化学习大模型,这种foundation models可以快速的适用这一类的问题,比如可以适应苹果分拣的场景,也可以快速适应梨的分拣,还能解决工件的分拣,还能解决垃圾分拣,等等。未来的强化学习大模型应该就是该种形式的,只是面向某一类场景下的大模型,这种大模型虽然感觉好像low一些,但是其价值是不会比语言大模型和视觉大模型差的,甚至更有实际价值,因为我们的各种科技,各种AI大模型最后都是要服务于实体经济的,不能落地的科技还是不完整的,还是对未来这种pseudo版本的强化学习大模型抱有期待的。
一个疑问:foundation models , 现在已经有了视觉的大模型也有了语言大模型,那么什么时候会有强化学习大模型,更准确的说什么时候会有强化学习的基础模型(foundation models)的更多相关文章
- ThinkPHP 学习笔记 ( 三 ) 数据库操作之数据表模型和基础模型 ( Model )
//TP 恶补ing... 一.定义数据表模型 1.模型映射 要测试数据库是否正常连接,最直接的办法就是在当前控制器中实例化数据表,然后使用 dump 函数输出,查看数据库的链接状态.代码: publ ...
- 一个标准的,兼容性很好的div仿框架的基础模型!
<!DOCTYPE html> <html > <head> <meta http-equiv="Content-Type" conten ...
- linux下bus、devices和platform的基础模型
转自:http://blog.chinaunix.net/uid-20672257-id-3147337.html 一.kobject的定义:kobject是Linux2.6引入的设备管理机制,在内核 ...
- [您有新的未分配科技点]博弈论进阶:似乎不那么恐惧了…… (SJ定理,简单的基础模型)
这次,我们来继续学习博弈论的知识.今天我们会学习更多的基础模型,以及SJ定理的应用. 首先,我们来看博弈论在DAG上的应用.首先来看一个小例子:在一个有向无环图中,有一个棋子从某一个点开始一直向它的出 ...
- linux下bus、devices和platform的基础模型 【转】
转自:http://blog.chinaunix.net/uid-20672257-id-3147337.html 一.kobject的定义:kobject是Linux2.6引入的设备管理机制,在内核 ...
- 百度DMLC分布式深度机器学习开源项目(简称“深盟”)上线了如xgboost(速度快效果好的Boosting模型)、CXXNET(极致的C++深度学习库)、Minerva(高效灵活的并行深度学习引擎)以及Parameter Server(一小时训练600T数据)等产品,在语音识别、OCR识别、人脸识别以及计算效率提升上发布了多个成熟产品。
百度为何开源深度机器学习平台? 有一系列领先优势的百度却选择开源其深度机器学习平台,为何交底自己的核心技术?深思之下,却是在面对业界无奈时的远见之举. 5月20日,百度在github上开源了其 ...
- odoo开发基础--模型之基本字段类型
定义模型的时候,和python的其他框架类似,可以对比Django,同样是一个模型即:一个class对应生成数据库中的一张表, 只是odoo的继承机制比较复杂一点,在日常的开发中,定义模型的时候, 基 ...
- ThinkPHP 数据库操作之数据表模型和基础模型 ( Model )
一.定义数据表模型 1.模型映射 要测试数据库是否正常连接,最直接的办法就是在当前控制器中实例化数据表,然后使用 dump 函数输出,查看数据库的链接状态.代码: public function te ...
- [20180713]关于hash join 测试中一个疑问.txt
[20180713]关于hash join 测试中一个疑问.txt --//上个星期做的测试,链接: http://blog.itpub.net/267265/viewspace-2157424/-- ...
- 一款基础模型的JS打飞机游戏特效代码
<!DOCTYPE html> <html lang="en"> <head> <title>一款基础模型的JS打飞机游戏特效代码& ...
随机推荐
- 实例讲解多处理器下的计算机启动(xv6的启动过程)
启动 启动方面的文章之前也写过,那是我的第一篇文章,本文在前文的基础之上完善,然后增加了多处理器启动的情况,废话不多说直接来看. 启动可以分为两种,一种为冷启动,是指计算机在关机状态下按 POWER ...
- Keil一键添加.c文件和头文件路径脚本--可遍历添加整个文件夹
最近想移植个LVGL玩玩,发现文件实在是太多了,加的手疼都没搞完,实在不想搞了就去找脚本和工具,基本没找到一个...... 主要是自己也懒得去研究写脚本,偶然搜到了一个博主写的脚本,原博客地址:htt ...
- Easysearch:语义搜索、知识图和向量数据库概述
什么是语义搜索? 语义搜索是一种使用自然语言处理算法来理解单词和短语的含义和上下文以提供更准确的搜索结果的搜索技术.旨在更好地理解用户的意图和查询内容,而不仅仅是根据关键词匹配,还通过分析查询的语义和 ...
- 反外挂 DDos UDP 攻击只需客户端 开着游戏客户端
#include<WINSOCK2.H> #include<iostream> #include<string> using namespace std; #inc ...
- Jx9 虚拟机
一.Jx9 虚拟机的生命周期 加载 Jx9 脚本 jx9_compile() 或 jx9_compile_file(),加载编译成功后,Jx9 引擎将自动创建一个实例 (jx9_vm) 并且返回指向此 ...
- spring之NamedParameterJdbcTemplate返回自增列值
以前使用JdbcTemplate来获取自增列的值,现在发现NamedParameterJdbcTemplate也可以,而且后者大部分情况下,其实更加方便. 这种方便主要是在于代码维护方面:我们更加习惯 ...
- 使用Python爬取公众号的合集内容
使用Python爬取公众号的合集 前言 ...最近老是更新关于博客的文章,很久没更新其他的了,然后写一下如何爬取微信公众号里面的图片吧! 先看看微信公众号的样子吧: 我爬取的是公众号的合集内容 讲解 ...
- ZYNQ:使用 PetaLinux 构建Linux项目
参考文档:ug1144-petalinux-tools-reference-guide.pdf 环境安装 tofrodos iproute2 gawk gcc g++ git make net-too ...
- 如何将自己的网站从 HTTP 的转换为 HTTPS 的
1. 获取 SSL/TLS 证书 首先,你需要获得一个 SSL/TLS 证书.你可以从以下来源之一获取证书: 免费证书: Let's Encrypt:一个免费的.自动化的证书颁发机构(CA),广泛使用 ...
- 韦东山freeRTOS系列教程之【第八章】事件组(event group)
目录 系列教程总目录 概述 8.1 事件组概念与操作 8.1.1 事件组的概念 8.1.2 事件组的操作 8.2 事件组函数 8.2.1 创建 8.2.2 删除 8.2.3 设置事件 8.2.4 等待 ...