AI-Azure上的认知服务之Computer Vision(计算机视觉)

使用 Azure 的计算机视觉服务，开发人员可以访问用于处理图像并返回信息的高级算法。

主要包含如下高级算法：

标记视觉特性Tag visual features

检测对象Detect objects

图像分类Categorize an image

描述图像Describe an image

检测人脸Detect faces

检测图像类型Detect image types

检测特定领域的内容Detect domain-specific content

检测颜色方案Detect the color scheme

生成缩略图Generate a thumbnail

获取感兴趣区域Get the area of interest

从图像中提取文本Extract text from images

管理图像中的内容Moderate content in images

要使用Computer Vision，图像质量必须满足如下要求：

图像必须以 JPEG、PNG、GIF 或 BMP 格式显示
图像的文件大小必须不到 4 兆字节 (MB)
图像的尺寸必须大于 50 x 50 像素
对于 OCR，图像的尺寸必须介于 50 x 50 和 4200 x 4200 像素之间

若要分析图像，可以上传图像，也可以指定图像URL。

图像处理算法可以通过多种不同的方式分析内容，具体取决于你感兴趣的视觉功能。例如，计算机视觉可以确定图像是否包含成人内容或不雅内容，或者查找图像中的所有人脸。

可以在应用程序中使用计算机视觉，方法是：使用本机SDK，或者直接调用 REST API。 SDK中，支持最全的是C# ，部分功能包含Java，NodeJS，Python，Go SDK。

本节实战视频，如何使用Computer Vision:

https://v.qq.com/x/page/m3035yaq8lf.html

下面分别举几个例子介绍计算机视觉API的功能：

图像标记-Tags

计算机视觉在上千个可识别对象、生物、风景和操作的基础上返回标记。当标记内容不明确或者不属常识时，API 响应会提供“提示”来澄清标记在已知场景中的含义。标记不按分类来组织，且不存在继承层次结构。内容标记集合在一起，形成图像“说明”的基础。该“说明”以人类可读语言显示，采用完整句子的格式。请注意，图像说明目前只能使用英语。

上传图像或指定图像 URL 后，计算机视觉算法在对象、生物和图像中标识的操作的基础上输出标记。标记不限于主体（例如前景中的人），还包括场景（户内或户外）、家具、工具、植物、动物、配件、小器具等。

结果示例："tags": [        {            "name": "grass",            "confidence": 0.9999995231628418        },        {            "name": "outdoor",            "confidence": 0.99992108345031738        },        {            "name": "house",            "confidence": 0.99685388803482056        }]

对象检测-Detect common objects in images

对象检测类似于标记，但是 API 返回找到的每个对象的边框坐标（以像素为单位）。例如，如果图像包含狗、猫和人，检测操作将列出这些对象及其在图像中的坐标。

结果示例："objects":[      {         "rectangle":{            "x":730,            "y":66,            "w":135,            "h":85         },         "object":"kitchen appliance",         "confidence":0.501      },      {         "rectangle":{            "x":523,            "y":377,            "w":185,            "h":46         },

图像进行分类-Categorize images by subject matter

计算机视觉还返回图像中检测到的基于分类的类别。不同于标记，类别是在父/子继承层次结构中组织的，并且数量更少（86 个，与数千个标记截然相反）。所有类别名称均采用英语。它可以单独完成分类，也可以与新的标记模型共同完成。

示例结果： "faces": [        {            "age": 23,            "gender": "Female",            "faceRectangle": {                "top": 45,                "left": 194,                "width": 44,                "height": 44            }        }    ]

已支持的分类列表：

https://docs.azure.cn/zh-cn/cognitive-services/computer-vision/category-taxonomy

除了上述内容，还支持手写体识别，表单识别等等，具体请参见官网：

https://docs.azure.cn/zh-cn/cognitive-services/computer-vision/concept-detecting-image-types

接下来，我们做一个案例，对如下图像进行检测，图像位置：

https://upload.wikimedia.org/wikipedia/commons/3/3c/Shaki_waterfall.jpg

本案例步骤：

在Azure创建Computer Vison API；
使用Azure提供的 Online API 测试工具；
使用Postman进行测试；

本案例完整内容，参照本文开始视频。

可使用如下地址进行在线测试：

https://dev.cognitive.azure.cn/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa/console

其中必填项如下图所示：

Request Body和结果如下：

Postman测试如下图所示：

AI-Azure上的认知服务之Computer Vision(计算机视觉)的更多相关文章

Azure上部署FTP服务
FTP是个比较复杂的协议,其协议分为控制层和数据层,工作模式分为主动和被动两种模式. 在默认的Active模式下其工作原理如下: 可以看到,客户端发起FTP的请求道服务器端,FTP的端口是21.用户在 ...
Build 2017 | 今儿来说说火得不行的认知服务吧（内附微软开发者大会在线峰会报名地址）
Everybody,新一期的 Build 2017 大会新技术详谈又来了,今天小编给大家带来了一个既智能又有趣的技术,你一定喜欢!不卖关子了,直奔我们本期的主题: [只需几行代码,就能让任何应用更智能 ...
Azure 上的物联网产品介绍
微软云Azure上物联网产品提供了从设备接入到设备与云的双向通信,到数据在云中存储,到数据分析,最后到数据展示的完整解决方案,本文主要介绍一些基本的概念,后续的章节中,会详细介绍每款产品的使用方法及步 ...
(转)Hprose与WCF在云计算平台Azure上的对决
Windows Azure Platform是一个运行在微软数据中心的云计算平台.它包括一个云计算操作系统和一个为开发者提供的服务集合.开发人员创建的应用既可以直接在该平台中运行,也可以使用该云计算 ...
获取Avrix上Computer Vision and Pattern Recognition的论文，进一步进行统计分析。
此文主要记录我在18年寒假期间,收集Avrix论文的总结寒假生活题外在寒假期间,爸妈每天让我每天跟着他们6点起床,一起吃早点收拾,每天7点也就都收拾差不多. 早晨的时光是人最清醒的时刻,而 ...
Azure 认知服务 (2) 计算机视觉API - 分析图像
<Windows Azure Platform 系列文章目录> 在上一节内容中,笔者介绍了微软认知服务的概览. 在本节中,笔者将详细介绍微软认知服务中的一种:计算机视觉 (Computer ...
Azure 认知服务--计算机视觉 API - 分析图像
在本节中,笔者将详细介绍 Azure 认知服务中的一种:计算机视觉 (Computer Vision) API. 我的一个客户有需求,他们需要消费者与自己的产品合照,然后上传到服务器并转发到朋友圈. ...
Azure 认知服务概述
背景知识近些年随着机器学习.深度学习等技术的不断发展,人工智能在越来越多的场景得到了应用,如人脸识别.图像识别.语音识别.语音生成.自然语言处理.决策分析等等,让机器拥有了听.说.看和思考的能力,很 ...
Azure认知服务之表格识别器
认知服务 Azure 认知服务的目标是帮助开发人员创建可以看.听.说.理解甚至开始推理的应用程序. Azure 认知服务中的服务目录可分为五大主要支柱类别:视觉.语音.语言.Web 搜索和决策.开发人 ...

随机推荐

【Luogu P3387】缩点模板（强连通分量Tarjan&拓扑排序）
Luogu P3387 强连通分量的定义如下: 有向图强连通分量:在有向图G中,如果两个顶点vi,vj间(vi>vj)有一条从vi到vj的有向路径,同时还有一条从vj到vi的有向路径,则称两个顶 ...
5分钟上手自动化测试——Airtest+Poco快速上手
版权声明:该文章为AirtestProject原创文章:允许转载,但转载必须注明“转载”并保留原链接前言本文档将演示使用`AirtestProject`专用的编辑器AirtestIDE,编写`Ai ...
Kubernetes权威指南第一章：Kubernetes入门
Kubernetes是什么官网 https://kubernetes.io/ 中文版:https://kubernetes.io/zh/ Kubernetes是谷歌十几年大规模容器管理经验的成果是 ...
Java基础部分（11~20）
11."=="和 equals 方法究竟有什么区别? (单独把一个东西说清楚,然后再说清楚另一个,这样,它们的区别自然就出来了,混在一起说,则很难说清楚) ==操作符专门用来比较两 ...
apache虚拟主机配置的3种方式
Apache的虚拟主机功能 (Virtual Host) 是可以让一台服务器基于IP.主机名或端口号实现提供多个网站服务的技术. 下面我介绍一下这3种方式具体的配置流程: 一.基于ip地址首先我们需 ...
sina中的附件图片处理
这样写就会频繁的创建和销毁对象因为setPhotos这个方法调用频繁如果在里面直接用for循环创建9个UIImageView如果因为cell重用比如在上一个cell中本来就有UIImageVie ...
第五章 Unity中的基础光照（2）
目录 1. Unity中的环境光和自发光 2. 在UnityShader中实现漫反射光照模型 2.1 实践:逐顶点光照 2.2 实践:逐像素光照 2.3 半兰伯特模型 1. Unity中的环境光和自发 ...
分享一个Vue数组赋值的错误
今天在写项目用到Vue的时候,遇到的一个问题,纠结了好一会,首先我的代码是这样的有没有毛病!! 开始我感觉是没啥毛病啊,按照之前写Java代码的逻辑,我感觉这没一点毛病 . 但是它就是有毛病, 假 ...
luogu P5058 [ZJOI2004]嗅探器
题目描述某军搞信息对抗实战演习,红军成功地侵入了蓝军的内部网络,蓝军共有两个信息中心,红军计划在某台中间服务器上安装一个嗅探器,从而能够侦听到两个信息中心互相交换的所有信息,但是蓝军的网络相当的庞大 ...
[TimLinux] django html如何实现固定表头
1. 需求表格很长,这个时候就希望表格头部不动,而只是表格内容行支持滚动功能. 2. 方法两张表:一张表(THeader)负责头部字段的显示,另一张表(TBody)负责内容行字段的显示. 两张表都 ...

AI-Azure上的认知服务之Computer Vision(计算机视觉)

AI-Azure上的认知服务之Computer Vision(计算机视觉)的更多相关文章

随机推荐

热门专题