​自然语言处理(NLP)是人工智能领域一个十分重要的研究方向.NLP研究的是实现人与计算机之间用自然语言进行有效沟通的各种理论与方法. 本文整理了NLP领域常用的16个术语,希望可以帮助大家更好地理解这门学科. 1.自然语言处理(NLP) 自然语言处理,简单来说就是构建人与机器之间沟通的桥梁,以实现人机交流的目的. 自然语言处理有两大核心任务:自然语言理解(NLU)与自然语言生成(NLG). 2.Attention 机制 Attention的本质是从关注全部到关注重点.将有限的注意力集中在重点信…
算法是人工智能(AI)核心领域之一. 本文整理了算法领域常用的39个术语,希望可以帮助大家更好地理解这门学科. 本文为下半部分,上半部分见本账号上一篇文章. 19.迁移学习(Transfer Learning)​ 迁移学习是一种机器学习的方法,指的是一个预训练的模型被重新用在另一个任务中. 20.长短期记忆网络(LSTM) LSTM是一种特殊的循环神经网络,能够学习长期依赖性. 21.生成对抗网络(GAN) 生成对抗网络(GAN, Generative Adversarial Networks…
​算法是人工智能(AI)核心领域之一. 本文整理了算法领域常用的39个术语,希望可以帮助大家更好地理解这门学科. 1. Attention 机制 Attention的本质是从关注全部到关注重点.将有限的注意力集中在重点信息上,从而节省资源,快速获得最有效的信息. 2. Encoder-Decoder 和 Seq2Seq Encoder-Decoder 模型主要是 NLP 领域里的概念.它并不特指某种具体的算法,而是一类算法的统称.Encoder-Decoder 算是一个通用的框架,在这个框架下可…
机器学习是人工智能(AI)的核心,是使计算机具有智能的根本途径.​ 本文整理了一下机器学习领域常用的15个术语,希望可以帮助大家更好的理解这门涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多个领域的庞杂学科. 1. AdaBoost(Adaptive Boosting) AdaBoost是Adaptive Boosting的缩写. AdaBoost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器). 2…
​语音交互是基于语音输入的新一代交互模式,比较典型的应用场景是各类语音助手. 本文整理了语音交互领域常用的4个术语,希望可以帮助大家更好地理解这门学科. 1. 语音合成标记语言(SSML) 语音合成标记语言的英文全称是Speech Synthesis Markup Language,这是一种基于XML的标记语言,可让开发人员指定如何使用文本转语音服务将输入文本转换为合成语音. 与纯文本相比,SSML可让开发人员微调音节.发音.语速.音量以及文本转语音输出的其他属性. SSML可自动处理正常的停顿…
​2019年,国内人工智能领域的投融资热情大幅降低,相当数量的AI企业彻底消失在了历史的长河中,“人工智能寒潮已至”甚至成为行业年度热词. 与前几年创业与投资热情齐头并进的盛况相比,近段时间的AI行业显然萧条了很多. 究其原因,“AI落地难”要负主要责任. 从自动化时代到智能化时代,人工智能创造的价值在不断增长.与此同时,业务场景的精细度与复杂度也在不断提升,为人工智能技术的落地带来一系列挑战. 以国内人工智能企业为例.目前国内几个较大的人工智能独角兽企业,商业化落地主要集中在金融.安防监控.手…
根据艾瑞咨询发布的行业白皮书显示,2018年中国人工智能基础数据服务市场规模为25.86亿元,预计2025年市场规模将突破113亿元,行业年复合增长率达到了23.5%.​ 作为人工智能产业的基石,数据标注行业正在从幕后走向前台,未来前景无限广阔. 然而,正如黎明前是一片无尽的黑暗一样,数据标注行业在蓬勃发展的背后也面临着诸多困局,这些困局已成为阻碍行业发展最大的绊脚石. 1. 人力成本突出 数据标注虽然披着人工智能的“外衣”,但是本质上仍然属于劳动密集型产业. 目前,国内从事数据标注行业的人群已…
​ 1. 两年前,来自山东农村的王磊成为了一位数据标注员.彼时的他,工作内容非常简单且枯燥:识别图片中人的性别. 然而,一段时间之后,他注意到分配给他的任务开始变得越来越复杂:从识别性别到年龄,从框选2D物体到3D物体,图片场景从白天到深夜,甚至出现了多雾天气,用他自己的话来形容,就是“越来越奇怪了”. 小赵今年25岁,别看年龄不大,但是她已经做了足足8年的餐厅服务员.她的人生计划是再做几年服务员,攒上一笔钱就回到老家开一家只属于自己的餐厅.然而,2017年随着她所在的餐厅因质检不合格而关停后,…
谈及数据,绕不开的一个话题就是数据隐私与数据安全.随着数字化进程加快,数据安全事件频发,据Risk Based Security统计,去年国际数据泄露事件近5000起,被泄露数据近41亿条,数据造成的潜在重大危害和巨额损失迫使国家.行业.企业等各层面更加重视数据安全. 数据安全已成为国家社会发展面临的重要议题之一.2021年7月4日,"某知名出行App"因存在严重违法违规收集使用个人信息问题,被国家互联网信息办公室依据<中华人民共和国网络安全法>相关规定下架.针对数据滥用.…
近期新型冠状病毒肺炎的疫情,牵动着全国上下人民的心. 截止2月11日上午10点,全国确诊人数已达42708人,疑似病例21675人. 突发的疫情让部分地区的快速诊疗能力出现了结构性的缺失,为了打赢这场抗击疫情的攻坚战,众多AI企业充分发挥人工智能赋能技术和智能产品优势,发挥AI技术在辅助新型冠状病例的大规模筛查与诊疗的能力,及时发现潜在患者,加强防控. 以下是AI技术在防疫工作中的部分具体应用: 1. 智能识别:快速识别疑似患者 利用深度学习.图像识别等AI技术,可以实现自动目标检测.目标跟踪.…
监督学习是机器学习中一种十分重要的算法.与无监督学习相比,监督学习有明确的目标.​ 分类与回归是监督学习两个主要任务,常见的监督学习算法主要有以下9种: 1 朴素贝叶斯 分类 2 决策树 分类 3 支持向量机 分类 4 逻辑回归 分类 5 线性回归 回归 6 回归树 回归 7 K邻近 分类+回归 8 Adaboost 分类+回归 9 神经网络 分类+回归 1. 朴素贝叶斯(Naive Bayes Classifier) 朴素贝叶斯算法(NBC) 是应用最为广泛的分类算法之一.NBC假设了数据集属…
​深度学习(Deep Learning)是机器学习(Machine Learning)领域中一个新的研究方向,引领了第三次人工智能的浪潮. 本文整理了深度学习领域3种典型的算法,希望可以帮助大家更好地理解深度学习这门极具深度的学科. 1.卷积神经网络(CNN) 卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习的代表算法之一. 卷积神经网络仿造生物…
深度学习(Deep Learning)是机器学习的一种,而机器学习是实现人工智能的必经途径. 目前大部分表现优异的AI应用都使用了深度学习技术,引领了第三次人工智能的浪潮. 一. 深度学习的概念 深度学习是机器学习中一种基于对数据进行表征学习的方法. 其属于机器学习的范畴,可以说是在传统神经网络基础上的升级,约等于神经网络.它的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征. 深度学习是机器学习研究中的一个新的领域,其动机在于建立.模拟人脑进行分析学习的神经网络,它…
word2vec 本来就是用来解决自然语言处理问题的,它在 NLP 中的应用是显然的. 比如,你可以直接用它来寻找相关词.发现新词.命名实体识别.信息索引.情感分析等:你也可以将词向量作为其他模型的输入,用于诸如文本分类.聚类等各种自然语言处理问题. 事实上,word2vec 的思想和工具,还可以应用于自然语言处理之外的其他领域.一个词,无非就是个符号:句子是词的序列,无非也就是个符号序列.如果我们能够在其他的应用场景中,构造出一些符号,还有这些符号形成的序列,那我们就可以试一把 word2ve…
http://3g.163.com/all/article/DM995J240511AQHO.html 选自the Gradient 作者:Sebastian Ruder 机器之心编译 计算机视觉领域常使用在 ImageNet 上预训练的模型,它们可以进一步用于目标检测.语义分割等不同的 CV 任务.而在自然语言处理领域中,我们通常只会使用预训练词嵌入向量编码词汇间的关系,因此也就没有一个能用于整体模型的预训练方法.Sebastian Ruder 表示语言模型有作为整体预训练模型的潜质,它能由浅…
工业界 腾讯人工智能实验室(Tencent AI Lab) 百度自然语言处理(Baidu NLP):对外提供了百度AI开放平台,王海峰(现任百度副总裁,AI技术平台体系AIG总负责人) 微软亚洲研究院自然语言计算组(Natural Language Computing - Microsoft Research).在NLP方向与哈工大.清华有联合实验室 科大讯飞(与哈工大的语言认知计算联合实验室) 搜狗实验室(Sogou Labs) 头条人工智能实验室(Toutiao AI Lab) 华为诺亚方舟…
1. 什么是NLP 自然语言处理 (Natural Language Processing) 是人工智能(AI)的一个子领域.自然语言处理是研究在人与人交互中以及在人与计算机交互中的语言问题的一门学科.为了建设和完善语言模型,自然语言处理建立计算框架,提出相应的方法来不断的完善设计各种实用系统,并探讨这些实用系统的评测方法. 2. NLP主要研究方向 信息抽取:从给定文本中抽取重要的信息,比如时间.地点.人物.事件.原因.结果.数字.日期.货币.专有名词等等.通俗说来,就是要了解谁在什么时候.什…
正如我在<2019年总结>里说提到的, 我将开始一系列自然语言处理(NLP)的笔记. 很多人都说, AI并不难啊, 调现有库和云的API就可以啦. 然而实际上并不是这样的. 首先, AI这个领域十分十分大, 而且从1950年图灵提出图灵测试, 1956年达特茅斯会议开始, AI已经发展了五十多年了, 学术界有的认为有六个时期, 有的认为有三起二落. 所以Ai发展到今天, 已经有相当的规模了, 不可能有一个人熟悉AI的所有领域, 最多也就是熟悉相关联的几个领域, 比如NLP和OCR以及知识图谱相…
 国内外自然语言处理(NLP)研究组 *博客地址 http://blog.csdn.net/wangxinginnlp/article/details/44890553 *排名不分先后.收集不全,欢迎留言完善. 中国大陆地区: 微软亚洲研究院自然语言计算组 Natural Language Computing (NLC) Group https://www.microsoft.com/en-us/research/group/natural-language-computing/ 清华大学自然语…
本文首发于微信公众号「对白的算法屋」,来一起学AI叭 大家好,卷王们and懂王们好,我是对白. 本次我挑选了ICLR2021中NLP领域下的六篇文章进行解读,包含了文本生成.自然语言理解.预训练语言模型训练和去偏.以及文本匹配和文本检索.从这些论文的思想中借鉴了一些idea用于公司自身的业务中,最终起到了一个不错的效果. 1.Contrastive Learning with Adversarial Perturbations for Conditional Text Generation 任务…
自然语言处理NLP快速入门 https://mp.weixin.qq.com/s/J-vndnycZgwVrSlDCefHZA [导读]自然语言处理已经成为人工智能领域一个重要的分支,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法.本文提供了一份简要的自然语言处理介绍,帮助读者对自然语言处理快速入门. 作者 | George Seif 编译 | Xiaowen An easy introduction to Natural Language Processing Using c…
Attention 机制. 参考:https://blog.csdn.net/xiewenbo/article/details/79382785 要是关注深度学习在自然语言处理方面的研究进展,我相信你一定听说过Attention Model(后文有时会简称AM模型)这个词.AM模型应该说是过去一年来NLP领域中的重要进展之一,在很多场景被证明有效.听起来AM很高大上,其实它的基本思想是相当直观简洁的. 1.引言 机器学习领域中的Attention Model这个名字,是从认知心理学里面的人脑注意…
http://blog.csdn.net/jdbc/article/details/53292414 过去半年以来,自然语言处理领域进化出了一件神器.此神器乃是深度神经网络的一种新模式,该模式分为:embed.encode.attend.predict四部分.本文将对这四个部分娓娓道来,并且剖析它在两个实例中的用法. 人们在谈论机器学习带来的提升时,往往只想到了机器在效率和准确率方面带给人们的提升,然而最重要的一点却是机器学习算法的通用性.如果你想写一段程序来识别社交媒体平台上的侮辱性帖子,就把…
正如我在<自然语言处理(NLP) - 数学基础(1) - 总述>一文中所提到的NLP所关联的概率论(Probability Theory)知识点是如此的多, 饭只能一口一口地吃了, 我们先开始最为大家熟知和最基础的知识点吧, 排列组合. 虽然排列组合这个知识点大家是相当地熟知, 也是相当地基础, 但是却是十分十分十分地重要. NLP届掌门人斯坦福大学的Daniel Jurafsky(D. 朱夫斯凯)和科罗拉多大学James H. Martin(J. H. 马丁)在其NLP巨作<自然语言处…
AI应用在金融领域,如何能够在商业上有所突破 如今,随着社会不断发展,技术不断进步,国内外各大金融机构已经在大数据.人工智能.区块链等新技术上有很多尝试,智能客服.智能投顾等新金融形式也早已不新鲜.那么,这些前沿新科技遇到严肃谨慎的金融业,究竟是"黑科技"般的存在,还是技术宅们的另一场狂欢呢? 以下是氪信联合创始人杨玢玢在<当金融遇上黑科技>线下主题沙龙活动的精彩分享: 大家好!我是氪信杨玢玢,负责氪信产品研发.氪信的全称是氪信信息技术有限公司(CreditX),最近刚刚完…
作者简介 周明,微软亚洲研究院首席研究员.ACL候任主席(president).中国计算机学会中文信息技术专委会主任.中国中文信息学会常务理事.哈工大.天津大学.南开大学.山东大学等多所学校博士导师.1985年毕业于重庆大学,1991年获哈工大博士学位.1991-1993年清华大学博士后,随后留校任副教授.1996-1999访问日本高电社公司主持中日机器翻译研究.他是中国第一个中英翻译系统.日本最有名的中日机器翻译产品J-北京的发明人.1999年加入微软研究院并随后负责自然语言研究组,主持研制了…
苹果语音助手Siri的工作流程: 听 懂 思考 组织语言 回答 这其中每一步骤涉及的流程为: 语音识别 自然语言处理 - 语义分析 逻辑分析 - 结合业务场景与上下文 自然语言处理 - 分析结果生成自然语言文本 语音合成 自然语言处理的常用处理过程: 先针对训练文本进行分词处理(词干提取.原型提取),统计词频,通过词频-逆文档频率算法获得该词对样本语义的贡献,根据每个词的贡献力度,构建有监督分类模型.把测试样本交给模型处理,得到测试样本的语义类别. 自然语言工具包 - NLTK nltk.dow…
前言 先来看一些demo,来一些直观的了解. 自然语言处理: 可以做中文分词,词性分析,文本摘要等,为后面的知识图谱做准备. http://xiaosi.trs.cn/demo/rs/demo 知识图谱: https://www.sogou.com/tupu/person.html?q=刘德华 还有2个实际应用的例子,加深对NLP的理解 九歌机器人: https://jiuge.thunlp.cn/ 微软对联机器人: http://duilian.msra.cn/ NLP概述: 自然语言处理,是…
Sebastian Ruder 博士的答辩 PPT<Neural Transfer Learning for Natural Language Processing>介绍了面向自然语言的迁移学习的动机.研究现状.缺陷以及自己的工作. Sebastian Ruder 博士在 PPT 中阐述了使用迁移学习的动机: state-of-the-art 的有监督学习算法比较脆弱: 易受到对抗样本的影响 易受到噪音数据的影响 易受到释义的影响 现实中的自然语言处理面临着多领域.多语种上的多种类型的任务,为…
自然语言处理(NLP Natural Language Processing)是一种专业分析人类语言的人工智能.就是在机器语⾔和⼈类语言之间沟通的桥梁,以实现人机交流的目的. 在人工智能出现之前,机器智能处理结构化的数据(例如Excel里的数据).但是网络中 大部分的数据都是非结构化的,例如:文章.图片.音频.视频... 在非结构数据中,文本的数量是最多的,他虽然没有图片和视频占用的空间大,但是他的 信息量是最大的. 为了能够分析和利用这些文本信息,我们就需要利用NLP技术,让机器理解这些文本信…