作者:韩信子@ShowMeAI

深度学习实战系列https://www.showmeai.tech/tutorials/42

本文地址https://www.showmeai.tech/article-detail/414

声明:版权所有,转载请联系平台与作者并注明出处

收藏ShowMeAI查看更多精彩内容

简介

AI 以迅速的发展,不仅仅在研究界带来了革新,在生活的方方面面也提供智能化,使我们更便利。在本篇内容中,ShowMeAI将介绍 OpenAI 的主要发展以及它们实际落地的 AI 产品应用。

OpenAI vs DeepMind,两大人工智能巨头应对不同挑战

OpenAI 的使命侧重于以安全的方式为全人类实现人工智能的可用性。OpenAI 的模型为数据提取、文本生成、语音识别、图像生成或编辑等日常任务带来了高效的解决方案。尽管它们的任务和目标不同,但它们在开发大型模型方面有着共同的努力,这些模型在当今的大多数应用中都发挥着关键的作用。

DeepMind 的使命是解决智能问题,推动科学发展并造福人类。因此,它强调通用智能,即 AI 在任何情况下都能够自行学习。这也解释了为什么 DeepMind 所有的突破都依赖于深度强化学习,即 AI 只有一个目标和一组可能的行动,需要找出实现该目标的最佳方法。

GPT3,超智能化的内容生成助手

GPT3介绍

GPT-3 是一种深度学习模型,该模型经过训练后可以预测序列中的下一个标记,并能生成流畅逼真的文本,覆盖文本分析和摘要、文案撰写、代码生成等应用场景。GPT-3 在发布后不久就掀起了全球的热潮,促进了大量应用程序和初创公司的诞生。下图为用户使用 “Grammar Correction” 开始编程的操作示例。

现实生活中的应用

OpenAI 官方表示,OpenAI API是公司第一个商业产品,自推出九个月以来,超过 300 个应用在使用 GPT-3,成千上万的开发人员在使用平台。目前平均每天生成 45 亿个单词,且生产流量继续扩大中。

如果你需要在线的文本解决方案,那可以阅读更多相关信息并自己把模型玩起来:https://beta.openai.com/playground。OpenAI 为所有新帐户提供 18 美元的信用额度。

CLIP,文本和图像的天然融合艺术

CLIP介绍

CLIP 是 OpenAI 开发的一种大型预训练语言模型,将输入的文本映射到一个连续的向量空间,并通过计算两个文本之间的距离来进行文本分类和相似度计算。与传统的语言模型不同,CLIP可以通过学习数据库中的大量文本数据来实现端到端的文本分类,而不需要任何人工标注。因此,它可以用于许多不同的文本分类任务,包括情感分析、知识图谱构建和图像标注。下图表明 CLIP 极大地改进了图像分类的结果!

现实生活中的应用

CLIP可以完成零样本图像分类、图像描述、内容审核、图像生成等。值得注意的是,CLIP 是 DALLE 的构建块之一。

DALL·E 2,优秀的艺术家

DALL·E 2介绍

DALL·E 2 是 OpenAI 公司研发的一款新的人工智能系统,不仅可以根据文本描述生成对应的逼真图像,还可以根据文本提示修改图像内容,以及根据给定的图像拓展生成多种主题风格一致的“变体”。目前公开可用,可以直接访问 OpenAI 网站,也可以调用 API(2022 年 11 月已经发布!)。

现实生活中的应用

DALL·E 2 的影响力可与 GPT3 媲美,应用场景也非常丰富,包括插图、图像摄影、NFT 生成、图像编辑等。微软已经宣布 DALL·E 2 将为其 Designer App 提供支持;Shutterstock 还宣布与 OpenAI 建立合作关系,允许用户在平台上使用 DALL·E 2 进行创作!

Whisper,听懂所有语言的智者

Whisper介绍

Whisper 是一个自动语音识别 (ASR) 系统。它使用从网络上收集的 680,000 小时多语言和多任务监督数据进行训练。使用如此庞大且多样化的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。此外,它还支持多种语言的转录,以及将这些语言翻译成英语。

现实生活中的应用

Whisper 是免费和可编程的,使用体验令人兴奋!这也使其成为现有商业语音识别服务的有力竞争者。它也可能直接挑战了当前主流的“基于云的 ASR 服务”。

由于 Whisper 模型较小,便于本地运行的移动 App 使用,从而可以避免转录前数据上传云端导致的隐私问题(已经有人行动起来了 例如下方推文)。

Codex,完美代码生成助手

Codex介绍

OpenAI Codex 是一种基于 GPT-3 的自然语言到代码系统,有助于将 自然语言指令转换为十几种流行的编码语言。Codex 于去年 8 月通过 OpenAI 的 API 发布,是 GitHub Copilot 的主要构建块。

其实,可以要求 GPT3 解释一段简单的文本代码,从代码到解释性文本这个过程GPT3也可以做得很好,理解和生成代码的能力已经编码在 GPT3 中。而 Codex 专注于生成可执行代码,使其成为开发人员的绝佳助手。由于它已经集成到 Visual Studio 中,根据经验,将它无缝集成到开发周期中。

现实生活中的应用

许多应用已经出现,包括各种代码助手 copilot、pygma 和 replit 等。

  • Copilot 编码助手能够根据指示生成代码、将注释转换为代码、生成测试并提出备选方案。
  • Pygma 使用 Codex 将 Figma 设计转换为高质量代码。
  • Replit 使用 Codex 描述选定的一段代码的作用,以便每个人都能理解其功能。

下图为 Replit 依靠 Codex 来解释部分代码。

ChatGPT,令人兴奋的AI聊天机器人

ChatGPT介绍

ChatGPT 是 OpenAI 于 11 月 30 日推出的一款聊天机器人,能根据用户的提示,在对话中生成类似人类的文本响应,完成回答问题、提供信息或参与对话等各种任务。与许多使用预定义的响应或规则生成文本的聊天机器人不同,ChatGPT 经过了训练,可以根据接收到的输入生成响应,从而生成更自然、更多样化的响应。

ChatGPT的亮点主要有哪些?

  • 新增代码理解和生成能力,对输入的理解能力和包容度高,能在绝大部分知识领域给出专业回答。
  • 加入道德原则。即ChatGPT能够识别恶意信息,识别后拒绝给出有效回答。
  • 支持连续对话。ChatGPT具有记忆能力,提高了模型的交互体验。

现实生活中的应用

ChatGPT不仅会聊天,写得了代码,修复得了bug,还能帮你写工作周报、写小说、进行考试答题,绘画,看病,甚至你还可以诱骗它规划如何毁灭人类,许多人认为,ChatGPT不仅仅是一个聊天机器人,而可能是现有搜索引擎的颠覆者。

参考资料

推荐阅读

真实世界的人工智能应用落地——OpenAI篇 ⛵的更多相关文章

  1. 【AI测试】也许这有你想知道的人工智能 (AI) 测试--第二篇

    概述此为人工智能 (AI) 测试第二篇 第一篇主要介绍了 人工智能测试.测试什么.测试数据等.第二篇主要介绍测试用例和测试报告.之后的文章可能具体介绍如何开展各项测试,以及具体项目举例如何测试.测试用 ...

  2. 九成AI企业亏损,人工智能商业落地为何这么难?

    自1956年"人工智能"一词诞生于"达特茅斯会议"后,前者就始终在不断向前推进.虽然中间经历了不少低谷和寒潮,但总算挺了过来.60多年后,人工智能在当下呈现突飞 ...

  3. GTD中落地执行篇

    前面几篇主要是分享GTD对事情进行 ”收集“,“分类”,“组织”.今天主要是想分享“落地执行” 先来看一个案例 (案例 来自于<小强升职记>) 通过这个案例我们看出 1: 当我们通过对事情 ...

  4. Python人工智能之路 - 第二篇 : 算法实在太难了有现成的直接用吧

    本节内容 预备资料: 1.FFmpeg: 链接:https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg 密码:w6hk 2.baidu-aip: pip ins ...

  5. 【AI测试】人工智能 (AI) 测试--第二篇

    测试用例 人工智能 (AI) 测试 或者说是 算法测试,主要做的有三件事. 收集测试数据 思考需要什么样的测试数据,测试数据的标注 跑测试数据 编写测试脚本批量运行 查看数据结果 统计正确和错误的个数 ...

  6. Python人工智能之路 - 第一篇 : 你得会点儿Python基础

    Python 号称是最接近人工智能的语言,因为它的动态便捷性和灵活的三方扩展,成就了它在人工智能领域的丰碑 走进Python,靠近人工智能 一.编程语言Python的基础 之 "浅入浅出&q ...

  7. Python人工智能第二篇

    Python人工智能之路 - 第二篇 : 现成的技术   预备资料: 1.FFmpeg: 链接:https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg 密码:w ...

  8. AI+教育落地,百度大脑如何让校园更智能?

    人工智能作为影响社会底层技术革命逐渐向传统行业渗透,“AI+”已经替代“互联网+”成为创业创新的新引擎,出人意料的是,在AI在教育业的率先落地并且相当火爆. 现在,人工智能教育已成为从业者心目中的“教 ...

  9. OpenPAI:大规模人工智能集群管理平台介绍及任务提交指南

    产品渊源: 随着人工智能技术的快速发展,各种深度学习框架层出不穷,为了提高效率,更好地让人工智能快速落地,很多企业都很关注深度学习训练的平台化问题.例如,如何提升GPU等硬件资源的利用率?如何节省硬件 ...

  10. 阿里云在云栖大会发布RPA最新3.4版本,将与达摩院联合探索人工智能领域

    9月26日,在2019年杭州云栖大会上,阿里云发布了RPA最新V3.4版本,全新升级了增加诸如录屏审计.JAVA应用录制能力.达摩院OCR内置组件.语法检查与智能提示能力增强等功能. RPA全名称Ro ...

随机推荐

  1. PHP全栈开发(四): HTML 学习(3. form 表单)

    form 表单标签 它表的是一个区域,而非是一个具体的某个元素,它也是作为一个容器的存在. 表单域主要是允许用户在表单域中输入内容,比如文本框,下拉列表,单选框,复选框,等等. <!DOCTYP ...

  2. 从 C# 崩溃异常 中研究页堆布局

    一:背景 1.讲故事 最近遇到一位朋友的程序崩溃,发现崩溃点在富编辑器 msftedit 上,这个不是重点,重点在于发现他已经开启了 页堆 ,看样子是做了最后的挣扎. 0:000> !analy ...

  3. Java中的多线程的创建方式

    首先理清几个基本概念: 程序:为完成特定任务,用某种语言编写的一组指令的集合.即一段静态的代码(还没运行起来) 进程:是程序的一次执行过程,也就是说程序运行起来了,加载到了内存中,并占用了cpu的资源 ...

  4. OnionArch - 如何实现更新指定字段的通用Handler

    博主最近失业在家,找工作之余,自己动手写了个洋葱架构(整洁架构)解决方案,以总结和整理以前的项目经验,起名叫OnionArch,其目的是为了更好的实现采用DDD(领域驱动分析)和命令查询职责分离(CQ ...

  5. 2022-08-21-xdm说个事啊

    layout: post cid: 15 title: xdm说个事啊 slug: 15 date: 2022/08/21 13:06:34 updated: 2022/08/21 13:06:34 ...

  6. MVVM视图模型

  7. 再有人说synchronized是重量级锁,就把这篇文章扔给他看

    synchronized作为Java程序员最常用同步工具,很多人却对它的用法和实现原理一知半解,以至于还有不少人认为synchronized是重量级锁,性能较差,尽量少用. 但不可否认的是synchr ...

  8. NLP之TextRNN(预测下一个单词)

    TextRNN @ 目录 TextRNN 1.基本概念 1.1 RNN和CNN的区别 1.2 RNN的几种结构 1.3 多对多的RNN 1.4 RNN的多对多结构 1.5 RNN的多对一结构 1.6 ...

  9. vuex和浏览器【sessionStorage,localStorage ..】 得区别

    1.Vuex的主要作用是用来共享和管理数据,那为什么不直接使用浏览器缓存呢?2.Vuex和浏览器缓存策略的根本区别是什么?3.Vuex,state仓库中的数据流是单向同步的,那为什么可以在action ...

  10. Java多线程-ThreadPool线程池(三)

    开完一趟车完整的过程是启动.行驶和停车,但老司机都知道,真正费油的不是行驶,而是长时间的怠速.频繁地踩刹车等动作.因为在速度切换的过程中,发送机要多做一些工作,当然就要多费一些油. 而一个Java线程 ...