【AI 算法评测】BERT 对 NLP 效果的改善,不负众望!

AI 在各大领域的发展有目共睹,而作为人工智能皇冠上的明珠--自然语言处理却成果了了,大多实现或者以半成品的形式躺在实验室中,或者仅仅作为某个产品的辅助功能。
而这一情况在 BERT 出现后出现了很大的改善。
本文就是通过一款工具的介绍,带大家了解下 BERT 对 NLP 实际效果带来的巨大改变。
(目前工具还在内测中,评测君暗中观察到,每隔段时间都会有非常大的更新)
话不多说,先上截图:

真的是让人惊讶!
在目前的工业 NLP 中,数个类似 词性标注、命名实体识别、实体关系抽取、内容理解、意图识别等任务虽然处于不断进步中,但依然距离实际应用有较大距离,主要是 Bad case 太多、结果太不可预测、人工干预乏力。很难相信,在这样的技术屏障下,通过使用 BERT 算法,这个工具依然实现了巨大的突破。
大家可以自行前往体验:
http://enpuz.com/The-instant-I-did-it-I-knew-I-had-made-a-mistake.=
这里提醒下,目前这个工具限制所输入的英语句子长度,经过评测君体验,不算标点差不多是 12 个单词左右,虽然足够满足学生的需求,但在现实环境中,不得不说是一个较大的限制,比较令人遗憾,希望未来会放开限制!
如下是转自 Standford Parser 的算法截图:

这里可以对应的看下使用 BERT 算法带来的变化:
能力提升:
1. 支持识别句子类型,如陈述句、疑问句、祈使句。
2. 支持分析复杂句的句子结构,如主语从句、宾语从句、定语从句、表语从句、状语从句。
3. 支持分析并列句的句子结构,如并列句、转折句、让步句。
4. 支持分析主句、从句的时态。
5. 支持分析句子中包含的核心语法、固定搭配、动词短语。
6. 支持疑问句、倒装句、省略句等特殊句子的内在结构。
7. 支持识别人名、地名。
8. 能有效处理未登录词。
9. 能给出重点短语、固定搭配的翻译
10. 能给出重点短语、固定搭配的例子、用法、语法扩展
11. 能给出重点短语、固定搭配对应的相似短语
12. 具有较强的命名实体识别能力。
13. 具有较强的关系提取能力。
14. 具有完整的意图识别能力。
15. 具有较强的推理能力。
16. 具有一定的自学习能力。
可能的不足:
1. 长度限制,只支持 12 个单词。
2. 不支持成分缺失较多的口语。
3. 单词、短语翻译覆盖率不足。
4. 缺少反义词、近义词等常见词典工具具备的数据。
5. 内容表现单一。
当然3、4、5跟算法本身关系不是特别大。
总结
作为少有的以 nlp 能力为主打的产品,尽管有诸如长度、不支持口语等限制,评测君还是比较期待这款工具未来的变化。
大家也可以去体验:http://enpuz.com/
如果评测内容不实不准,欢迎私信。
码字不易,求赞求推荐!
【AI 算法评测】BERT 对 NLP 效果的改善,不负众望!的更多相关文章
- 阿里开源新一代 AI 算法模型,由达摩院90后科学家研发
最炫的技术新知.最热门的大咖公开课.最有趣的开发者活动.最实用的工具干货,就在<开发者必读>! 每日集成开发者社区精品内容,你身边的技术资讯管家. 每日头条 阿里开源新一代 AI 算法模型 ...
- AI算法测评事项
前言 注:大概2017年-2018年国内人工智能热度达到顶峰,随后热度开始逐渐减少.2018年前人工智能被投资界.学术界.工业界和媒体炒的特别热,各大企业都想尝试一下深度学习技术在业务场景的应用.试水 ...
- H5版俄罗斯方块(3)---游戏的AI算法
前言: 算是"long long ago"的事了, 某著名互联网公司在我校举行了一次"lengend code"的比赛, 其中有一题就是"智能俄罗斯方 ...
- AI佳作解读系列(二)——目标检测AI算法集杂谈:R-CNN,faster R-CNN,yolo,SSD,yoloV2,yoloV3
1 引言 深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理.本文着重与分析目标检测领域的深度学习方法,对其中的经典模型框架进行深入分析. 目标检测可以理解为是物 ...
- 聊聊找AI算法岗工作
https://blog.csdn.net/weixin_42137700/article/details/81628028 首先,本文不是为了增加大家的焦虑感,而是站在一名学生的角度聊聊找AI算法岗 ...
- AI算法测评(二)--算法测试流程
根据算法测试过程中遇到的一些问题和管理规范, 梳理出算法测试工作需要关注的一些点: 编号 名称 描述信息 备注 1 明确算法测试需求 明确测试目的 明确测试需求, 确认测试需要的数据及场景 明确算法服 ...
- 浅析初等贪吃蛇AI算法
作为小学期程序设计训练大作业的一部分,也是自己之前思考过的一个问题,终于利用小学期完成了贪吃蛇AI的一次尝试,下作一总结. 背景介绍: 首先,我针对贪吃蛇AI这一关键词在百度和google上尽心了检索 ...
- 游戏人工智能 读书笔记 (四) AI算法简介——Ad-Hoc 行为编程
本文内容包含以下章节: Chapter 2 AI Methods Chapter 2.1 General Notes 本书英文版: Artificial Intelligence and Games ...
- Bert 时代的创新(应用篇):Bert 在 NLP 各领域的
Bert 时代的创新(应用篇):Bert 在 NLP 各领域的
随机推荐
- 【日常摘要】- RabbitMq实现延时队列
简介 什么是延时队列? 一种带有延迟功能的消息队列 过程: 使用场景 比如存在某个业务场景 发起一个订单,但是处于未支付的状态?如何及时的关闭订单并退还库存? 如何定期检查处于退款订单是否已经成功退款 ...
- 题解 洛谷 P6142 【[USACO20FEB]Delegation P】
和赛道修建类似,先对\(k\)进行二分,将最值问题转化为判定问题. 在判定一个\(k\)是否合法时,贪心去考虑,一个节点下面的若干条链在合并时,一条链肯定和另一条使它合并后恰好满足长度限制的链合并最优 ...
- python 模型的释义
CharField #字符串字段, 用于较短的字符串. #CharField 要求必须有一个参数 maxlength, 用于从数据库层和Django校验层限制该字段所允许的最大字符数. Integer ...
- Netty 学习笔记(3) ------ ChannelPipeline 和 ChannelHandler
ChannelPipeline通过责任链设计模式组织逻辑代码(ChannelHandler),ChannelHander就如同Servlet的Filter一样一层层处理Channel的读写数据. Ch ...
- gitlab的还原
源服务器: ip: 192.168.0.199 系统:CentOS7.2 内核: 3.10.0-327 gitlab版本: gitlab-ce-8.0.5 新服务器: ip: 192.168.0.19 ...
- 《谁说菜鸟不会数据分析》高清PDF全彩版|百度网盘免费下载|Python数据分析
<谁说菜鸟不会数据分析>高清PDF全彩版|百度网盘免费下载|Python数据分析 提取码:p7uo 内容简介 <谁说菜鸟不会数据分析(全彩)>内容简介:很多人看到数据分析就望而 ...
- 下载excel模板,导入数据时需要用到
页面代码: <form id="form1" enctype="multipart/form-data"> <div style=" ...
- [草稿]Skill 中如何读取一个文件并打印出来
https://www.cnblogs.com/yeungchie/ path = "~/hello" file = infile(path) while(gets(x file) ...
- LOJ #10222. 「一本通 6.5 例 4」佳佳的 Fibonacci 题解
题目传送门 如果之前推过斐波那契数列前缀和就更好做(所以题目中给出了). 斐波那契数列前缀和题目链接 先来推一下斐波那契数列前缀和: \[\sum\limits_{i=1}^nf(i) \] 其中 \ ...
- python 调用百度接口 做人脸识别
操作步骤差不多,记得要在百度AIPI中的控制台中创建对应的工单 创建工单成功后 会生成两个key 这个两个key是要生成tokn 用 这里大家可以用 def函数 将token返回 供下面的接口使用 ...