随想:目标识别中,自适应样本均衡设计,自适应模型结构(参数可变自适应,模型结构自适应,数据类别or分布自适应)
在现在的机器学习中,很多人都在研究自适应的参数,不需要人工调参,但是仅仅是自动调参就不能根本上解决
ai识别准确度达不到实际生产的要求和落地困难的问题吗?结论可想而知。如果不改变参数,那就得从算法的结构入手,
比如,现有的谷歌的MnasNet系列,这种是在人工的指导下进行的,但是,仅仅是这样就够了吗?我个人觉得还不够
1、在做机器学习的时候,我们模型的指标提不上去的时候,通常原因是因为边缘样本,也就是我们所说的hard-example,
如果和解决边缘样本呢?目前是人工发现这些样本并增加hard-example数量达到改善模型指标的方式。还有一种方式,就是
将边缘样本细分,将边缘样本单独作为一类别,从而成为非边缘样本。(样本边缘性是相对的,当你将某一个样本作为主要类别,
则与该样本模式相差较大但是划分为同一类别的就是边缘样本。)
2、目前算法是很笨的,他不具备潜意识,只是学习你喂的数据,因此从表现上改变数据的结构,分类,细化问题,可能获得更好的模型体现。
3、但是,问题来了,上面只是从样本上面去做改变,如何从算法方面作出改变呢?
梯度提升树(boost)的优势就是他会将识别错误的样本的基础上,重新训练获得新的决策,(第二颗树训练的目标是基于第一棵树的识别结构的),
而,目前损失函数,就是计算训练样本的和label的之间的loss,并不关注,每个样本loss大小变换与不同的问题。实际上,对于边缘样本,脏样本,
在训练迭代到后期,这些样本的地loss是比较大的,就是他们存在,算法不能收敛完全(比如,后期好的样本的loss已经很低了,每来一次干扰样本,
导致训练,训偏了,这种偏差将需要好几个正常样本的来“修复”)。这时候就想出了,是否除了参数可变自适应,模型结构自适应,数据类别or分布自适应呢?
数据分布自适应:
数据分布自适应,我觉得类似k-means,自适应寻找模型内部的分布,并挖掘这个样本数据集合到底要怎么分类,分几个类别,当然,要结和业务角度出发,
不能破坏我们原有的需求。比如自适应的感受野,在识别卡车和行人问题上,我们能不能根据卡车大小统计和人的大小统计从而归纳出识别人需要几层网络,识别卡车需要几层网络,
然后,在一个网络中,比如,卡车需要M层,人需要N层,则算法自动选取ob=max(M,N)层,当达到M层时自动设计一个针对卡车的输出,N层时,自动设计针对人的输出等等。
也许目前人工智能是因为人工标注学习的结果,也许目前算法还不够智能,也是局限于人工的标注(人工智能成也人工,败也人工?),而不能超越人工的框框架架下面。
随想:目标识别中,自适应样本均衡设计,自适应模型结构(参数可变自适应,模型结构自适应,数据类别or分布自适应)的更多相关文章
- 如何去设计一个自适应的网页设计或HTMl5
如何去设计一个自适应的网页设计或HTMl5 如今移动互联网随着3G的普及,越来越火爆,更多需求跟随而来!APP应用市场和APP应用数量成倍成倍的增长!从而给移动互联网带来新的挑战! 移动设备正超过桌面 ...
- 重复造轮子系列——基于FastReport设计打印模板实现桌面端WPF套打和商超POS高度自适应小票打印
重复造轮子系列——基于FastReport设计打印模板实现桌面端WPF套打和商超POS高度自适应小票打印 一.引言 桌面端系统经常需要对接各种硬件设备,比如扫描器.读卡器.打印机等. 这里介绍下桌面端 ...
- Java生鲜电商平台-生鲜系统中微服务架构设计与分析实战
Java生鲜电商平台-生鲜系统中微服务架构设计与分析实战 说明: Java生鲜系统中微服务的拆分应该如何架构设计与分析呢?以下是我的实战中的设计与经验分析. 目录 1. 微服务简介2. 当前现状3. ...
- 以项目谈WebGIS中Web制图的设计和实现
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1.背景介绍 一般WebGIS项目中,前端展示数据的流程基本是先做数据入 ...
- (十二) WebGIS中矢量图层的设计
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/. 1.前言 在前几章中我们已经了解了什么是矢量查询.屏幕坐标与地理坐标之 ...
- 关于ASP.NET中的负载均衡
ASP.NET站点中做负载均衡: 基于HTTP协议我们可能发现我们要解决两点问题: 第一做到负载均衡,我们需要一个负载均衡器. 可以通过DNS轮询来做,在DNS服务器上配置为每次对我们做负载均衡的同一 ...
- Cloud Foundry中warden的网络设计实现——iptable规则配置
在Cloud Foundry v2版本号中,该平台使用warden技术来实现用户应用实例执行的资源控制与隔离. 简要的介绍下warden,就是dea_ng假设须要执行用户应用实例(本文暂不考虑ward ...
- MEF插件系统中通信机制的设计和实现
MEF插件系统中通信机制的设计和实现 1.背景 一般的WinForm中通过C#自带的Event机制便能很好的实现事件的注册和分发,但是,在插件系统中却不能这么简单的直接用已有的类来完成.一个插件本不包 ...
- VxWorks中的中断应用设计要点
硬件中断处理是实时系统设计中的关键性问题,设计人员有必要对其作深入研究,以更好地满足开发工作需要.文中以VxWorks操作系统为软件平台,讨论了在实时系统中进行中断应用设计时要注意的一些问题.由于软硬 ...
随机推荐
- enable-ssh-key-logon-disable-password-password-less-logon-centos/
cat ~/.ssh/id_rsa.pub | ssh root@destination_server_address "cat >> ~/.ssh/authorized_key ...
- web安全类
web安全类主要分为两个部分:CSRF和XSS 一.CSRF 基本概念:CSRF,通常称为跨站请求伪造,英文名Cross-site request forgery 缩写为CSRF; 怎么防御 1.To ...
- Mock Server
下载地址:https://repo1.maven.org/maven2/com/github/dreamhead/moco-runner/ 此处使用standalone的方式,不使用api用法 启动方 ...
- 理解Linux文件权限
任何完整的系统都应该具备有某种形式的安全性.必须用过某种机制来保护文件不被未授权的用户查看或修改:Linux系统遵循了Unix的文件权限的方法,来根据用户与用户组授权,实现文件安全访问. 1.Linu ...
- 关于如何使用ehcarts2加载svg矢量地图并自定义县级内部乡镇轮廓
项目需求:显示县级内部的乡镇一级地图的轮廓! 效果预览: 阻碍因素:echarts不提供县级以下乡镇级轮廓. 解决思路: 1.根据资料查找相关县的行政区域图(百度搜索),如本人所制作的浙江省宁波市宁海 ...
- centos7安装Jenkins
一.准备工作 机器要求: 256MB内存,建议大于512MB 10GB的硬盘空间(用于存放Jenkins镜像) 需要安装以下软件: Java (JRE或者JDK都可以) 需要可以访问公网 关闭防火墙连 ...
- TestNG+Java+Selenium+Maven 代码实例
搭环境时注意不要忘记testng的jar包,selenium的jar包 package com.guge.test; import org.testng.annotations.Test;import ...
- sublimit 编辑器 设置默认的编码
1.首选项>>设置 - 用户 2.加上:"default_encoding": "UTF-8"
- Oracle根据主键获取对应表,Oracle根据外键获取相关表
Oracle根据主键获取对应表 select * from user_constraints a, USER_CONS_COLUMNS b where a.CONSTRAINT_TYPE = 'P' ...
- echarts统计图Y轴(或X轴)文字过长问题解决
echarts 统计图Y轴文字过长 在使用echarts时,出现数值非常大,Y轴又显示不下的情况就需要压缩Y轴数值刻度. 解决方法: yAxis: { type: 'value', axisLabel ...