上个月,我们发布了牛津计划机器学习的情感识别API,能够帮助不同平台的开发者轻松添加智能应用,而无需精通人工智能领域.牛津计划仅仅是微软在人工智能领域探索中的一个实例,而我们的期望是实现更加注重个人使用体验和更优性能的产品,逐渐实现它看.听.说.理解甚至是进行推论的性能. 现在,声纹识别API和视频API已经公开预览,自定义识别智能服务(CRIS)可通过www.ProjectOxford.ai进行访问. CRIS能提供开发者构建针对特定词库.环境.或用户群的语音识别系统.视频API使得分析和自动…
光学字符识别 上传本地图片或者提供一个图片URL,查看光学字符识别的演示. 视觉特征分析 上传本地图片或者提供一个图片URL,查看视觉特征分析的演示. 缩略图 上传本地图片或者提供一个图片URL,查看生成缩略图的演示. 人脸检测 上传一张本地图片或提交一个图片URL,查看人脸检测的演示. 人脸验证 上传两张不同光照条件或不同脸部视角的本地照片,或提供照片的URL,你就能够得到比对和辨识结果. 情感识别 上传一张本地图片或提供一个图片URL以试用情感识别示例. 人脸追踪 查看人脸检测及追踪的演示,…
本篇合集包括以下三个部分的内容: 1.微软亚洲研究院过去一年的所有开源合集,如分布式机器学习工具包DMTK等. 2.利用微软研究院的技术提高工作效率的工具合集,如让没有机器学习背景的开发人员也能开发出智能应用的牛津计划等等. 3.包含微软研究院技术转化的应用合集,如微软自拍,微软绝句等等. ​ 微软亚洲研究院过去一年的所有开源合集 2015年5月20日,微软亚洲研究院Graph Engine 1.0预览版正式发布.Graph Engine是一个基于内存的分布式大规模图数据处理引擎,能够帮助用户更…
2016年3月30日:微软在Build 2016开发者大会中发布“认知服务”. 在Build 2016开发者大会中,微软发布了新的智能服务:微软认知服务(Microsoft Cognitive Services).该服务集合了多种智能API以及知识API.借助这些API,开发者可以开发出更智能,更有吸引力的产品.微软认知服务集合了多种来自Bing,前“牛津计划“等项目的智能API.应用了这些API的系统能看,能听,能说话,并且能理解和解读我们通过自然交流方法所传达的需求.同时,服务中包括的知识A…
微软牛津项目人脸识别API初探 按照董子的这篇博客中的介绍,到微软牛津项目的网站申请到测试用的人脸识别Key,按照官方文档的介绍,把wpf项目建好之后,按照一步步的流程下来就可以完成example中的功能了.但是这仅仅是个example,图片不能太大,不然会出现溢出错误.之前关注过牛津项目,后来不知道竟然中文版的官网也出来了,只是中文的文档翻译的是在是太不堪入目了,不过这也保持了微软的一贯的风格. 我的环境是:win7 64bit+VS2015+.Net4.5+C#PS:最好把 drawingC…
按照董子的这篇博客中的介绍,到微软牛津项目的网站申请到测试用的人脸识别Key,按照官方文档的介绍,把wpf项目建好之后,按照一步步的流程下来就可以完成example中的功能了.但是这仅仅是个example,图片不能太大,不然会出现溢出错误.之前关注过牛津项目,后来不知道竟然中文版的官网也出来了,只是中文的文档翻译的是在是太不堪入目了,不过这也保持了微软的一贯的风格. 我的环境是:win7 64bit+VS2015+.Net4.5+C#PS:最好把 drawingContext.Close();移…
var appInsights=window.appInsights||function(config){ function r(config){t[config]=function(){var i=arguments;t.queue.push(function(){t[config].apply(t,i)})}}var t={config:config},u=document,e=window,o="script",s=u.createElement(o),i,f;for(s.src…
由于最近的demo中需要在活体检测的同时进行音视频录制 ,  尝试使用MediaRecord和camera来录制视频 , 然而Camera.onPreviewFrame 不能与 MediaRecord同时调用.活体检测的原理其实是把camera的预览回调onPreviewFrame(byte[] data, Camera camera) 中的图片数据data作为参数传递到活体检测引擎中去拿返回的检测结果码,由于种种原因 , 不能使用Camera2实现 , 于是通过谷歌了解到javacv这个库可以…
深度学习在最近十来年特别火,几乎是带动AI浪潮的最大贡献者.互联网视频在最近几年也特别火,短视频.视频直播等各种新型UGC模式牢牢抓住了用户的消费心里,成为互联网吸金的又一利器.当这两个火碰在一起,会产生什么样的化学反应呢? 不说具体的技术,先上一张福利图,该图展示了机器对一个视频的认知效果.其总红色的字表示objects, 蓝色的字表示scenes,绿色的字表示activities. 图1 人工智能在视频上的应用主要一个课题是视频理解,努力解决“语义鸿沟”的问题,其中包括了:     · 视频…
CVPR2020:扩展架构以实现高效的视频识别(X3D) X3D: Expanding Architectures for Efficient Video Recognition 论文地址: https://openaccess.thecvf.com/content_CVPR_2020/html/Feichtenhofer_X3D_Expanding_Architectures_for_Efficient_Video_Recognition_CVPR_2020_paper.html 代码位于:h…