AI 的架构与核心
AI 的架构
人工智能的架构分为三层:应用层、技术层和基础层。
应用层聚焦在人工智能和各行业各领域的结合。技术层是算法、模型和技术开发。基础层则是计算能力和数据资源。
数据收集:获取什么类型的数据,数据可以通过那些途径获取。常见的数据来源是采集、购买或其他方式获取现有数据。
比如中山大学的资深机器学习研究专家梁浩林就分享到,城市地理学领域的数据采集渠道,可以同步获取一些社交APP,比如Yahoo Flickr、Sina Webo的checkin数据,手机的信号数据,用户GPS的轨迹数据等等。
数据理解:获取到原始数据之后,分析数据里面有什么内容、数据准确性如何,为下一步的预处理做准备。
比如我们拍摄的各种照片,需要从中识别出包含人脸的照片。
数据预处理:原始数据可能会有环境影响或者干扰因素,格式化也不好,所以为了保证预测的准确性和有效性,需要进行数据的预处理。
常见的比如调整照片亮度、对比度、锐化等等。
特征提取:将数据里有用的,有典型特征的抽取出来。
比如,对几千张有效照片进行分类,特征包括性别、头发眼睛皮肤颜色、轮廓、脸型等等。
模型构建:使用适当的算法,获取预期准确的值。
常用的分类算法包括:决策树分类法(Decision Tree),朴素贝叶斯分类算法(Native Bayesian Classifier)、基于支持向量机(SVM)的分类器、神经网络法(Neural Network)、k-最近邻法(k-nearest neighbor,kNN) 语义树、知识库、各种视觉算法等等等。至于各种算法的区别,我还在学习中。
模型评估:通常对一个模型进行评估的标准有准确率、查全率。
查准率 =检索出的相关信息量/检索出的信息总量
查全率=检索出的相关信息量/系统中的相关信息总量
狭义上的理解拿人脸识别来讲,假设数据库中存在的10个用户的照片,我对这10个用户进行拍照,识别出来库中包含的人脸有7个,这7个中识别正确的有5个,那么查准率=5/10=50%;查全率就是7/10=70%。另外就是,假设我对1个用户,操作十次,出来的结果是否十次均和实际匹配。我认为也是模型评估的一个标准。
模型训练:根据模型评估的结果,对模型进行不断的训练甚至是调整,以达到更好的效果。
模型应用:将模型部署、应用到实际场景中。
可以回到AI 基本概念和应用中的人脸识别开门场景,来看看如何跟我们的 AI 架构对应的。
从AI 的结构很容易可以看出来。
人工智能的核心是基础层,即计算能力和refreshing data flow (持续的数据流)。
所以大公司愿意投入人工智能和发展人工智能的优势,因为大公司有数据。尤其是Google、Facebook、亚马逊、苹果,还有国内的BAT。于是现在有一个声音会认为:大公司不具备的医疗、基金、金融等数据,可能会是小公司、人工智能初创企业突破的机会。
技术层的核心主要在于:特征提取, 模型与算法选择。
Google 在过去两年的时间里,一直致力于 AI 的探索和转型,将机器学习和人工智能技术用到Google Lens、YouTube、Google Map上等。另外还将公司内部开发和采用的机器学习技术整理到了一起,命名为 TensorFlow,也称为第二代人工智能系统,完全开源,任何人都可以用。并且在国内也有专门的社区网站http://www.tensorfly.cn/ 。
Tensorflow 的优势
可移植:小到一部智能手机、大到数千台数据中心服务器的各种设备上运行
开放性:完全开源,任何人都可以用。
算法:支持CNN、RNN、LSTM 算法,这都是目前在Image(图像),Speech(语音)和NLP最流行的深度神经网络模型。
应用层主要考虑人工智能+教育、人工智能+医疗、人工智能+金融等的结合。
————————————————
版权声明:本文为CSDN博主「alice_tl」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/alice_tl/article/details/78566426
AI 的架构与核心的更多相关文章
- 【转帖】威盛x86 AI处理器架构、性能公布:媲美Intel 32核心
威盛x86 AI处理器架构.性能公布:媲美Intel 32核心 https://www.cnbeta.com/articles/tech/920559.htm 除了Intel.AMD,宝岛台湾的威盛也 ...
- AI基础架构Pass Infrastructure
AI基础架构Pass Infrastructure Operation Pass OperationPass : Op-Specific OperationPass : Op-Agnostic Dep ...
- 《大型网站技术架构:核心原理与案例分析》【PDF】下载
<大型网站技术架构:核心原理与案例分析>[PDF]下载链接: https://u253469.pipipan.com/fs/253469-230062557 内容简介 本书通过梳理大型网站 ...
- 大型网站技术架构(四)--核心架构要素 开启mac上印象笔记的代码块 大型网站技术架构(三)--架构模式 JDK8 stream toMap() java.lang.IllegalStateException: Duplicate key异常解决(key重复)
大型网站技术架构(四)--核心架构要素 作者:13GitHub:https://github.com/ZHENFENG13版权声明:本文为原创文章,未经允许不得转载.此篇已收录至<大型网站技 ...
- Java生鲜电商平台-SpringCloud微服务架构中核心要点和实现原理
Java生鲜电商平台-SpringCloud微服务架构中核心要点和实现原理 说明:Java生鲜电商平台中,我们将进一步理解微服务架构的核心要点和实现原理,为读者的实践提供微服务的设计模式,以期让微服务 ...
- web技术发展历程--读《大型网站技术架构_核心原理与案例分析》
1 早期的web服务 2 CGI程序的出现.发展.凋零到MVC的兴起 CGI:通用网关接口技术. 随着CGI技术的出现,web服务端可以通过不同的用户请求产生动态页面内容. web服务器将请求数据交给 ...
- 阅读《大型网站技术架构:核心原理与案例分析》第五、六、七章,结合《XXX重大技术需求征集系统》,列举实例分析采用的可用性和可修改性战术,将上述内容撰写成一篇1500字左右的博客阐述你的观点。
这三章主要讲述的是网站的可用性.伸缩性和可扩展性. 首先,网站的可用性描述网站可有效访问的特性,相比于网站的其他非功能特性,网站的可用性更容易引起人们的注意,尤其是大型网站的可用性,如果大公司的网站出 ...
- Tomcat 学习进阶历程之Tomcat架构与核心类分析
前面的http及socket两部分内容,主要是为了后面看Tomcat源代码而学习的一些网络基础.从这章開始.就開始实际深入到Tomcat的'内在'去看一看. 在分析Tomcat的源代码之前,准备先看一 ...
- 【读一本书】《昇腾AI处理器架构与编程》--神经网络基础知识(2)
1 卷积神经网络:输入层 之前提到多层感知机的参数太多,导致训练耗时长并且对图像处理也不具有优势,因此大神们 就提出了多层神经网络,其中最经典的是卷积神经网络(Convolution Neural N ...
随机推荐
- MongoDB 最近遇到的几个小问题
(1)连接数据库时报错 ERROR Topshelf.Hosts.ConsoleRunHost.Run An exception occurred System.TimeoutException: A ...
- mysql-python 安装错误 fatal error C1083: Cannot open include file: 'config-win.h': No such file or directory
安装mysql-python之前, 请先安装setuptools. https://pypi.python.org/pypi/setuptools/7.0 下载mysql-python. 下载源码包. ...
- mssql sqlserver sql脚本自动遍历重复生成指定表记录
摘要: 今天接到老板的需求,需根据一张表中列值,自动重复表中的数据行,然后显示给用户 实验环境:sqlserver 2008 R2 转自:http://www.maomao365.com/?p=841 ...
- 软件工程基础团队第二次作业(团队项目-需求分析&系统设计)成绩汇总
一.作业题目 团队第二次作业:需求分析&系统设计 二.具体要求 1.作业任务 任务一:组长组织项目组开展需求调研工作(可采取需求调查.问卷.分析已有软件.网上资料等方法).概要设计.详细设计. ...
- RAID几种方式
RAID(Redundant Array of Independent Disk 独立冗余磁盘阵列)技术是加州大学伯克利分校1987年提出,最初是为了组合小的廉价磁盘来代替大的昂贵磁盘,同时希望磁盘失 ...
- scala java 混合编译配置
参考:https://www.jianshu.com/p/f20550cd1067 pom.xml 配置 <build> <plugins> <plugin> &l ...
- Web前端开发框架大全-详述
可以说,前端技术的发展是互联网自身发展的一个缩影! 前端技术的发展经历了web1.0时代,即网页只能展示信息,几乎没有交互可言: web2.0时代,web2.0不再是单维的,逐渐发展为双向交流,另一特 ...
- powersploit简介
一.PowerSploit简介 PowerSploit是GitHub上面的一个安全项目,上面有很多powershell攻击脚本,它们主要被用来渗透中的信息侦察.权限提升.权限维持. Powershel ...
- 第04组 Alpha冲刺(6/6)
队名:new game 组长博客:戳 作业博客:戳 组员情况 鲍子涵(队长) 燃尽图 过去两天完成了哪些任务 协调了一下组内的工作 复习了一下SuffixAutomata 接下来的计划 实现更多的功能 ...
- 十、自定义ThreadPoolExecutor线程池
自定义ThreadPoolExecutor线程池 自定义线程池需要遵循的规则 [1]线程池大小的设置 1.计算密集型: 顾名思义就是应用需要非常多的CPU计算资源,在多核CPU时代,我们要让每一个CP ...