​ 1. 两年前,来自山东农村的王磊成为了一位数据标注员.彼时的他,工作内容非常简单且枯燥:识别图片中人的性别. 然而,一段时间之后,他注意到分配给他的任务开始变得越来越复杂:从识别性别到年龄,从框选2D物体到3D物体,图片场景从白天到深夜,甚至出现了多雾天气,用他自己的话来形容,就是“越来越奇怪了”. 小赵今年25岁,别看年龄不大,但是她已经做了足足8年的餐厅服务员.她的人生计划是再做几年服务员,攒上一笔钱就回到老家开一家只属于自己的餐厅.然而,2017年随着她所在的餐厅因质检不合格而关停后,…
根据艾瑞咨询发布的行业白皮书显示,2018年中国人工智能基础数据服务市场规模为25.86亿元,预计2025年市场规模将突破113亿元,行业年复合增长率达到了23.5%.​ 作为人工智能产业的基石,数据标注行业正在从幕后走向前台,未来前景无限广阔. 然而,正如黎明前是一片无尽的黑暗一样,数据标注行业在蓬勃发展的背后也面临着诸多困局,这些困局已成为阻碍行业发展最大的绊脚石. 1. 人力成本突出 数据标注虽然披着人工智能的“外衣”,但是本质上仍然属于劳动密集型产业. 目前,国内从事数据标注行业的人群已…
​2019年,国内人工智能领域的投融资热情大幅降低,相当数量的AI企业彻底消失在了历史的长河中,“人工智能寒潮已至”甚至成为行业年度热词. 与前几年创业与投资热情齐头并进的盛况相比,近段时间的AI行业显然萧条了很多. 究其原因,“AI落地难”要负主要责任. 从自动化时代到智能化时代,人工智能创造的价值在不断增长.与此同时,业务场景的精细度与复杂度也在不断提升,为人工智能技术的落地带来一系列挑战. 以国内人工智能企业为例.目前国内几个较大的人工智能独角兽企业,商业化落地主要集中在金融.安防监控.手…
谈及数据,绕不开的一个话题就是数据隐私与数据安全.随着数字化进程加快,数据安全事件频发,据Risk Based Security统计,去年国际数据泄露事件近5000起,被泄露数据近41亿条,数据造成的潜在重大危害和巨额损失迫使国家.行业.企业等各层面更加重视数据安全. 数据安全已成为国家社会发展面临的重要议题之一.2021年7月4日,"某知名出行App"因存在严重违法违规收集使用个人信息问题,被国家互联网信息办公室依据<中华人民共和国网络安全法>相关规定下架.针对数据滥用.…
近期新型冠状病毒肺炎的疫情,牵动着全国上下人民的心. 截止2月11日上午10点,全国确诊人数已达42708人,疑似病例21675人. 突发的疫情让部分地区的快速诊疗能力出现了结构性的缺失,为了打赢这场抗击疫情的攻坚战,众多AI企业充分发挥人工智能赋能技术和智能产品优势,发挥AI技术在辅助新型冠状病例的大规模筛查与诊疗的能力,及时发现潜在患者,加强防控. 以下是AI技术在防疫工作中的部分具体应用: 1. 智能识别:快速识别疑似患者 利用深度学习.图像识别等AI技术,可以实现自动目标检测.目标跟踪.…
算法是人工智能(AI)核心领域之一. 本文整理了算法领域常用的39个术语,希望可以帮助大家更好地理解这门学科. 本文为下半部分,上半部分见本账号上一篇文章. 19.迁移学习(Transfer Learning)​ 迁移学习是一种机器学习的方法,指的是一个预训练的模型被重新用在另一个任务中. 20.长短期记忆网络(LSTM) LSTM是一种特殊的循环神经网络,能够学习长期依赖性. 21.生成对抗网络(GAN) 生成对抗网络(GAN, Generative Adversarial Networks…
深度学习(Deep Learning)是机器学习的一种,而机器学习是实现人工智能的必经途径. 目前大部分表现优异的AI应用都使用了深度学习技术,引领了第三次人工智能的浪潮. 一. 深度学习的概念 深度学习是机器学习中一种基于对数据进行表征学习的方法. 其属于机器学习的范畴,可以说是在传统神经网络基础上的升级,约等于神经网络.它的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征. 深度学习是机器学习研究中的一个新的领域,其动机在于建立.模拟人脑进行分析学习的神经网络,它…
​算法是人工智能(AI)核心领域之一. 本文整理了算法领域常用的39个术语,希望可以帮助大家更好地理解这门学科. 1. Attention 机制 Attention的本质是从关注全部到关注重点.将有限的注意力集中在重点信息上,从而节省资源,快速获得最有效的信息. 2. Encoder-Decoder 和 Seq2Seq Encoder-Decoder 模型主要是 NLP 领域里的概念.它并不特指某种具体的算法,而是一类算法的统称.Encoder-Decoder 算是一个通用的框架,在这个框架下可…
​自然语言处理(NLP)是人工智能领域一个十分重要的研究方向.NLP研究的是实现人与计算机之间用自然语言进行有效沟通的各种理论与方法. 本文整理了NLP领域常用的16个术语,希望可以帮助大家更好地理解这门学科. 1.自然语言处理(NLP) 自然语言处理,简单来说就是构建人与机器之间沟通的桥梁,以实现人机交流的目的. 自然语言处理有两大核心任务:自然语言理解(NLU)与自然语言生成(NLG). 2.Attention 机制 Attention的本质是从关注全部到关注重点.将有限的注意力集中在重点信…
机器学习是人工智能(AI)的核心,是使计算机具有智能的根本途径.​ 本文整理了一下机器学习领域常用的15个术语,希望可以帮助大家更好的理解这门涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多个领域的庞杂学科. 1. AdaBoost(Adaptive Boosting) AdaBoost是Adaptive Boosting的缩写. AdaBoost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器). 2…
​语音交互是基于语音输入的新一代交互模式,比较典型的应用场景是各类语音助手. 本文整理了语音交互领域常用的4个术语,希望可以帮助大家更好地理解这门学科. 1. 语音合成标记语言(SSML) 语音合成标记语言的英文全称是Speech Synthesis Markup Language,这是一种基于XML的标记语言,可让开发人员指定如何使用文本转语音服务将输入文本转换为合成语音. 与纯文本相比,SSML可让开发人员微调音节.发音.语速.音量以及文本转语音输出的其他属性. SSML可自动处理正常的停顿…
监督学习是机器学习中一种十分重要的算法.与无监督学习相比,监督学习有明确的目标.​ 分类与回归是监督学习两个主要任务,常见的监督学习算法主要有以下9种: 1 朴素贝叶斯 分类 2 决策树 分类 3 支持向量机 分类 4 逻辑回归 分类 5 线性回归 回归 6 回归树 回归 7 K邻近 分类+回归 8 Adaboost 分类+回归 9 神经网络 分类+回归 1. 朴素贝叶斯(Naive Bayes Classifier) 朴素贝叶斯算法(NBC) 是应用最为广泛的分类算法之一.NBC假设了数据集属…
​深度学习(Deep Learning)是机器学习(Machine Learning)领域中一个新的研究方向,引领了第三次人工智能的浪潮. 本文整理了深度学习领域3种典型的算法,希望可以帮助大家更好地理解深度学习这门极具深度的学科. 1.卷积神经网络(CNN) 卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习的代表算法之一. 卷积神经网络仿造生物…
NewLife.XCode是一个有15年历史的开源数据中间件,支持netcore/net45/net40,由新生命团队(2002~2019)开发完成并维护至今,以下简称XCode. 整个系列教程会大量结合示例代码和运行日志来进行深入分析,蕴含多年开发经验于其中,代表作有百亿级大数据实时计算项目. 开源地址:https://github.com/NewLifeX/X(求star, 938+) XCode是重度充血模型,以单表操作为核心,不支持多表关联Join,复杂查询只能在where上做文章,整个…
前言:宜信技术人物专访是宜信技术学院推出的系列性专题,我们邀请软件研发行业的优秀技术人,分享自己在软件研发领域的实践经验和前瞻性观点. 第一期专访我们邀请到宜信科技中心AI中台负责人王东老师,从大数据和AI赋能金融业务的角度,分享了中台.大数据.AI等软件研发趋势为业务赋能的经验与思路. 王东老师从技术视角到业务视角,在中台的落地契机.AI与大数据关系.AI和大数据技术的落地等方面提出了自己的看法. 记者:很多人将金融行业的发展划分为三个阶段:信息金融时代,主要指银行卡的出现,银行开始做集中的数…
本文由云+社区发表 作者:堵俊平 在数据爆炸与智能革命的新时代,新的平台与应用层出不穷,开源项目推动了前沿技术和业界生态快速发展.本次分享将以技术和生态两大视角来看大数据和人工智能技术的发展,通过分析当下热门的开源产品和技术,来梳理未来的行业生态以及技术趋势. 我们今天的主题分为三块,第一是从开源的角度看技术.产品和生态,第二,我们从腾讯云大数据的角度梳理开源的实践,并跟大家分享一下我们最近一段时间或者最近一年以来我们的贡献和成果.最后会跟大家一起探讨一下开源的大数据以及AI这个生态当中的一些热…
本文由云+社区发表 作者:堵俊平 在数据爆炸与智能革命的新时代,新的平台与应用层出不穷,开源项目推动了前沿技术和业界生态快速发展.本次分享将以技术和生态两大视角来看大数据和人工智能技术的发展,通过分析当下热门的开源产品和技术,来梳理未来的行业生态以及技术趋势. 我们今天的主题分为三块,第一是从开源的角度看技术.产品和生态,第二,我们从腾讯云大数据的角度梳理开源的实践,并跟大家分享一下我们最近一段时间或者最近一年以来我们的贡献和成果.最后会跟大家一起探讨一下开源的大数据以及AI这个生态当中的一些热…
大数据和AI怎么与现代教育相结合? 比尔·盖茨曾预言,"5年以后,你将可以在网上免费获取世界上最好的课程,而且这些课程比任何一个单独大学提供的课程都要好." 现在看来,虽然并不是每个网上课程都能强过大学教程,但是在线教育已经成为现实,据业内人士估算,目前中国在线教育用户数量过亿,市场规模达数千亿元,而且线上学习者也是受益良多. 不仅在线教育成为了新的风口,同时在大数据与人工智能的加持下,教育行业的相关应用正在进入深水期,现代教育的形式正在悄然改变. 大数据 AI赋能教育 目前,大数据…
大数据.AI“武装”企业服务:风控.检索.安全 小饭桌创业课堂2017-05-06 15:26:42阅读(127)评论(0) + - 文|吴杨可月 - - 小饭桌创业研究院出品 - 两件秘闻,将美国大数据公司Palantir从幕后推向前台—— 一是,Palantir的旗下产品在整合40年的记录及海量数据并充分挖掘之后,找到了前纳斯达克主席麦道夫“庞氏骗局”的大量确凿证据: 二是,通过其大数据挖掘能力,Palantir帮美国政府找到本拉登的老巢. 人们这才惊叹的发现,这家低调且离大众很远的公司,估…
在今天召开的 Connect(); 2017 开发者大会上,微软宣布了 Azure.数据.AI 开发工具的内容.这是第一天的 Connect(); 2017 的主题演讲. 在开场视频中霍金又来了.你记得这个Intel为他开发的系统使用了C#,而且是开源的,在Github上地址:https://github.com/intel/acat 另外API Gateway Ocelot https://github.com/TomPallister/Ocelot 也出现在视频中: ​​​​ 开场视频过后红…
服务端.实时.大数据.AI计算,各种各样的计算,计算机本质是什么,计算机的本质是 利用compute的计算速度为人提供更优的计算结果. 所以实时也好,准实时.离线.AI本质上是两个维度,实时准实时强调计算的速度,大数据 AI强调数据量以及速度. 1.实时计算,扩量的两个方式多线程多核计算,以及多个机器.每个机器多线程多核计算. 2.大数据.AI强调数据量更多多机器进行计算,来处理多个机器计算.…
1.关系 人工智能>机器学习>神经网络>深度学习 2.机器学习-两个过程 训练/学习过程:样本数据.学习器.模型参数 测试/预测过程:预测.预测值 3.神经网络 机器学习模拟人脑神经元构成神经网络学习算法 数百亿的神经元,链接构成神经网络,受制于数据量和计算能力 得益于大数据.云计算的发展和普及 4.深度学习 极其复杂的模型.自动提取特征.海量/全样本.GPU加速 传统机器学习依赖数据特征工程.人工规则 5.人工智能应用领域 语音识别:Siri.小啦.小冰.智能音响........ 图像…
Azure.数据.AI开发工具 在今天召开的 Connect(); 2017 开发者大会上,微软宣布了 Azure.数据.AI 开发工具的内容.这是第一天的 Connect(); 2017 的主题演讲. 在开场视频中霍金又来了.你记得这个Intel为他开发的系统使用了C#,而且是开源的,在Github上地址:https://github.com/intel/acat 另外API Gateway Ocelot https://github.com/TomPallister/Ocelot 也出现在视…
数据标注(Data Annotation)是类或类成员添加上下文信息的一种方式,在 C# 通常用特性(Attribute)类来描述.它的用途主要可以分为下面这三类: 验证 Validation:向数据添加验证规则 显示 Display:指定数据如何呈现给用户 模型 Modelling:添加关于用法和与其它类的关系信息 下面是一个用来验证和展现用户信息的一个 Model: class Kid { [Range(0, 18)] // 年龄不能超过18岁,不能为负数 public int Age {…
https://mp.weixin.qq.com/s/1EVczHp11OJ4GEjeE3z5cA 业内唯一以“AI计算”为核心的人工智能大会昨天发布了一份重要报告. 9月12日,<中国AI计算力发展报告>摘要版在2018 AICC人工智能计算大会上正式对外公布. 这份报告由浪潮集团联合IDC研究发布,报告中值得关注的地方是,北京的AI算力仅排第二,杭州成为第一:去年一年AI投资增长10倍:生物识别和智慧城市领域面临大爆发机会. 这份报告旨在通过对中国AI计算力发展的综合评估,包含计算力的区域…
Yonghong Z-Suite 除了提供优秀的前端BI工具之外,Yonghong Z-Suite让用户可以选购分布式数据集市来支持实时大数据分析. 对于这种百亿级的大数据案例,Yonghong Z-Suite有哪些技术可以保证大数据的实时响应呢?下面大致从技术上介绍下: 库内计算(In-Database Computing) Z-Suite支持各种常见的汇总,还支持几乎全部的专业统计函数.得益于库内计算技术,Z-Suite数据分析引擎将找寻出最优化的计算方案,继而把所有开销较大的.昂贵的计算都…
作者:依乐祝 原文地址:https://www.cnblogs.com/yilezhu/p/9941208.html 主讲人:大石头 时间:2018-11-10 晚上20:00 地点:钉钉群(组织代码BKMV7685)QQ群:1600800 内容:Redis基本使用及百亿数据量中的使用技巧分享 记录人:依乐祝 热场准备 熟悉的开场白,大家晚上好啊,今天给大家分享的是Redis在大数据中的使用,可能真正讲的是一些redis的使用技巧,Redis基本的一些东西. 首先给大家个地址,源码以及实例都在里…
[翻译] C# 8.0 新特性 2018-11-13 17:04 by Rwing, 1179 阅读, 24 评论, 收藏, 编辑 原文: Building C# 8.0[译注:原文主标题如此,但内容大部分为新特性介绍,所以意译标题为 "C# 8.0 新特性"] C# 的下一个主要版本是 8.0.我们已经为它工作了很长一段时间,即使我们构建并发布了次要版本 C# 7.1, 7.2 和 7.3,我仍然对 8.0 将带来的新特性感到非常兴奋. 目前的计划是 C# 8.0 将与 .NET C…
从SQL Server到MySQL,近百亿数据量迁移实战 狄敬超(3D) 2018-05-29 10:52:48 212 沪江成立于 2001 年,作为较早期的教育学习网站,当时技术选型范围并不大:Java 的版本是 1.2,C# 尚未诞生,MySQL 还没有被 Sun 收购,版本号是 3.23.工程师们选择了当时最合适的微软体系,并在日后的岁月里,逐步从 ASP 过度到 .net,数据库也跟随 SQL Server 进行版本升级. 十几年过去了,技术社区已经发生了天翻地覆的变化.沪江部分业务还…
一.Redis封装架构讲解 实际上NewLife.Redis是一个完整的Redis协议功能的实现,但是Redis的核心功能并没有在这里面,而是在NewLife.Core里面. 这里可以打开看一下,NewLife.Core里面有一个NewLife.Caching的命名空间,里面有一个Redis类,里面实现了Redis的基本功能:另一个类是RedisClient是Redis的客户端. Redis的核心功能就是有这两个类实现,RedisClient代表着Redis客户端对服务器的一个连接.Redis真…