上期内容咱们提到了埃隆马斯克的特斯拉是自动驾驶领域的领导者,大家可能近些年也都有从各类渠道听到过Tesla自动驾驶有关的新闻。不同于像包括Google子公司Waymo在内的大多数使用激光雷达来实现自动驾驶的公司,特斯拉采用的是只需要视频输入就能理解汽车周围环境,并实现自动驾驶的方法。在2021年的计算机视觉和模式识别会议CVPR 2021的自动驾驶研讨会,特斯拉首席人工智能科学家Andrej Karpathy详细介绍了特斯拉的这套基于深度学习的自动驾驶系统。

神经网络算法,如deep neural networks等,是自动驾驶领域的主要技术,但是深度学习在检测图像中的物体时也会出错。反对纯计算机视觉方法的主要论点是,神经网络是否可以在没有激光雷达深度图帮助的情况下进行测距和深度估计存在不确定性。为了解决现有深度学习框架识别图像不够准确的问题,特斯拉找到的第一剂灵丹妙药是他们包含数百万视频的、而且经过精心标注的庞大数据集。

为了更高效的处理和标注数据,特斯拉开发了一套具有巧妙分工的半自动数据标记系统,其中神经网络执行重复性工作,该技术涉及神经网络、雷达数据和人工审查的组合,而人类负责高级认知问题和极端情况。特斯拉在全球销售了数百万辆配备摄像头的汽车,在收集训练汽车计算机视觉深度学习模型所需的数据方面处于统治性地位。特斯拉自动驾驶团队积累了1.5 PB的数据,其中包括一百万个10秒视频和60亿个带有边界框、深度和速度注释的对象。

下面这段视频展示了在远距离、灰尘、或者是雨雪天气中物体都能被一致的检测到的效果,就是图中的那个粉色方块。

特斯拉构建的基于RNN的深度学习模型是一套非常复杂的多层神经网络系统,它通过大概这么几个步骤来实现了利用安装在汽车周围的八个摄像头的自动驾驶。首先是需要能够处理摄像头采集到的图片,比如从中识别出汽车、行人、交通灯等。然后,来自多个摄像头的图像需要能够被拼接在一起,形成这样的向量空间Vector Space,就是现实世界的一个3D投影。这段录像就展示了在缝合到一起的影像中检测机动车道的效果,里面的蓝线就是不同摄像头采集到的图片的分界线。第三,有了这些处理好的数据之后,就要对它们进行特征处理,这里除了视频之外合理还要引入汽车的速度、加速度、所处的空间位置、时间等因素。最终,这些处理好的特征会被输入基于RNN的深度学习神经网络里,RNN会及时跟踪任何时间点发生的事情,并有能力选择性地读取和处理这些数据,当汽车在行驶时,它只会高效的更新汽车附近和汽车能见范围内的部分。这里对于算法的细节省略了一万句,有兴趣的小伙伴可以在公众号后台留言获取详细的引用资料。





图 5. 相机连接到 3D 向量空间(来自Tesla AI Day)



图 6. 缝合到 3D 空间中的车道检测(来自Tesla AI Day)



图 11. 空间 RNN(来自Tesla AI Day)

简单总结回顾一下就是,首先进行单个视频的采集和处理,然后缝合多个摄像头采集的图像,之后进行特征处理,最后通过RNN实现最终的处理。虽然特斯拉在这个领域取得了不小的突破,但当前业界得到的深度学习模型依然有它的局限,比如说它很难进行逻辑推理,也就是举一反三,处理训练数据集中完全没有出现过的新情况的能力不足。

这是一段由人工智能加工整理的内容,怕学AI太难,那我们就先和AI玩起来。聊完特斯拉,下期内容我们再来聊聊SpaceX。再见。


可交互的可视化机器学习开源教程 - https://github.com/ocademy-ai/machine-learning

x.ai还是OpenAI?埃隆·马斯克的AI帝国【2】的更多相关文章

  1. AI时代大点兵-国内外知名AI公司2018年最新盘点

    AI时代大点兵-国内外知名AI公司2018年最新盘点 导言 据腾讯研究院统计,截至2017年6月,全球人工智能初创企业共计2617家.美国占据1078家居首,中国以592家企业排名第二,其后分别是英国 ...

  2. 报告指SpaceX估值已达到1000亿美元,埃隆马斯克以此回击其接受政府补贴的批判

    SpaceX首席执行官埃隆-马斯克(Elon Musk)表示,名下的航天发射服务供应商市值已达到1000亿美元.该金额是根据上个月的评估报告确认的,标志着SpaceX在完成最新一轮融资,并筹集超过10 ...

  3. KubeEdge SIG AI发布首个分布式协同AI Benchmark调研

    摘要:AI Benchmark旨在衡量AI模型的性能和效能. 本文分享自华为云社区<KubeEdge SIG AI发布首个分布式协同AI Benchmark调研>,作者:KubeEdge ...

  4. 3星|《AI极简经济学》:AI的预测、决策、战略等方面的应用案例介绍

    AI极简经济学 主要内容是AI的各种应用案例介绍.作者把这些案例分到五个部分介绍:预测.决策.工具.战略.社会. 看书名和介绍以为会从经济学的角度解读AI,有更多的新鲜的视角和观点,读后比较失望,基本 ...

  5. 【转载】 如何看待 2019 年 CS PhD 现扎堆申请且大部分为 AI 方向?未来几年 AI 泡沫会破裂吗?

    原贴地址: https://www.zhihu.com/question/316135639 作为一个 AI 方向的在读博士生,实在是过的蛮闹心,无意中逛知乎发现了这个帖子,发现很适合现在的自己,于是 ...

  6. 腾讯云AI应用产品总监王磊:AI 在传统产业的最佳实践

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 背景:5月23-24日,以"焕启"为主题的腾讯"云+未来"峰会在广州召开,广东省各级政府机构领导.海 ...

  7. Flask&&人工智能AI -- 6 人工智能初识,百度AI,图灵机器人

    一.人工智能初识,百度AI的创建与应用 参考连接:https://www.cnblogs.com/xiao987334176/p/9620113.html 1. 百度ai开放平台 2. AipSpee ...

  8. AI 制作 3D 素材|基于 AI 5 天创建一个农场游戏,第 3 天

    欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏.到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中.本文将向您展示如何将 A ...

  9. 【转载】 “强化学习之父”萨顿:预测学习马上要火,AI将帮我们理解人类意识

    原文地址: https://yq.aliyun.com/articles/400366 本文来自AI新媒体量子位(QbitAI)     ------------------------------- ...

  10. AI 经典书单 | 人工智能学习该读哪些书

    转载 2018年01月16日 00:00:00   人工智能相关岗位中,涉及到的内容包含: 算法.深度学习.机器学习.自然语言处理.数据结构.Tensorflow.Python .数据挖掘.搜索开发. ...

随机推荐

  1. MapReduce Shuffle源码解读

    MapReduce Shuffle源码解读 相信很多小伙伴都背过shuffle的八股文,但一直不是很理解shuffle的过程,这次我通过源码来解读下shuffle过程,加深对shuffle的理解,但是 ...

  2. 剑指 offer 第 25 天

    第 25 天 模拟(中等) 剑指 Offer 29. 顺时针打印矩阵 输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字. 示例 1: 输入:matrix = [[1,2,3],[4,5,6 ...

  3. 【Deep Learning】DDPM

    DDPM 1. 大致流程 1.1 宏观流程 1.2 训练过程 1.3 推理过程 2. 对比GAN 2.1 GAN流程 2.2 相比GAN优点 训练过程更稳定,损失函数指向性更强(loss数值大小指示训 ...

  4. C++/Qt网络通讯模块设计与实现(六)

    前面章节主要讲述网络通讯客户端的实现,各位小伙伴需认真阅读以及理解,理会其中的思想,有疑问的地方可及时给我私信,我都会非常认真地解答大家的疑惑. C++/Qt网络通讯模块设计与实现(一) C++/Qt ...

  5. Java面向对象--接口和多态

    final 关键字 最终修饰符 可以修饰 类 方法 变量 被final修饰后不能被继承 重写 二次赋值 修饰类时 该类不可以被继承 修饰方法时 该方法不能被重写 修饰变量时, 该变量只能赋值一次, 不 ...

  6. spring-boot-starter-parent not found

    项目开始的springboot版本为2.6.6 <parent> <groupId>org.springframework.boot</groupId> <a ...

  7. Linux(四)软件包管理

    软件包管理 1 RPM 简介 RPM(RedHat Package Manager),是红帽系linux操作系统的软件包管理工具,类似于windows中的setup.exe能够进行软件包的更新.卸载. ...

  8. C#模拟C++模板特化对类型的值的支持

    概述 C++的模板相比于C#,有很多地方都更加的灵活(虽然代价是降低了编译速度),比如C++支持变长参数模板.支持枚举.int等类型的值作为模板参数. C++支持枚举.int等类型的值作为模板参数,为 ...

  9. OpenCv人脸检测技术-(实现抖音特效-给人脸戴上墨镜)

    OpenCv人脸检测技术-(实现抖音特效-给人脸戴上墨镜) 本文章用的是Python库里的OpenCv. OpenCv相关函数说明 import cv2 # 导入OpenCv库 cv2.imread( ...

  10. java中的 \r——字符串消失了

    at java.lang.NumberFormatException.forInputString(NumberFormatException.java:65) 使用Integer.parseInt( ...