随着数据的暴增和计算机硬件技术的发展,也催生了AI技术在各行各业的应用渗透。而想将AI技术应用到各行各业,数据是必需品。因为数据直接影响到AI最终训练出来的模型好坏。AI建模没有太大门槛,但数据才是真正的门槛。因此,目前业界流传着一段话有多少人工智能,就有多少人工。前一篇讲述了数据如何标注及其注意,今天来学习一下数据标注的类型有哪些?

谁来做数据标注

    目前各个公司需要标注的数据,一般同下面几大公司或人员承担

  • 公司自己招聘人员或实习生进行标注

    这种方式最大的优势是:可以随时检查标注的质量和进度,便于快速沟通和调整,数据可以做到保密不外泄;劣势是成本较高

  • 外包给数据标注公司

    这种方式最大的优势是:速度非常快,成本低廉,标注公司也具备一定的开发标注工具能力,可定制性化能力较强;但劣势也明显标注公司鱼龙混杂,参差不齐,需要随时检查标注质量,返工成本较大。另外数据也无法做到保密不外泄

  • 外包给私人团体

    这种方式的优劣势基本同标注公司。优势是成本较低,因为可以大量招收人员,如农村闲置人员,兼职人员等。稍微培训下即可投入标注。

谁来管理数据标注

    针对数据分配给不同的人员,相应的角色也可以分为三种类型:

  • 数据标注人员

    主要负责数据的标注和汇总

  • 数据检查人员

    主要负责数据标注的质量检查,常采用抽检方式检查,可细分为部分抽检(比例约20%~30%)或全部抽检

  • 数据管理人员

    负责人员任务分配、进度跟进、标注培训及对外/对内协调沟通等

数据标注类型

    因AI技术应用到具体的实例场景,会有很大差异,因此标注的类型也有很多,详细如下所示:

图像标注-2D边框标注

    这种类型应该是最常见的标注方式,常用于检测目标对象的相应区域,标注框位于目标对象的四周,如下图所示:

图像标注-3D边框标注

    也称立方体标注,相比2D标注而言,还可以展现目标对象的近似深度。如下所示:

图像标注-语义分割

    根据检测区域的不同,将图像标注为不同的像素,如下所示:

图像标注-多边形标注

    根据需求标注目标对象的形状,常用于无法使用边框标注的不规则的目标对象,需要在目标对象的各个关键点进行描点,无论最终为何形状,均要能反应目标对象的轮廓形状和所有边缘,如下所示:

图像标注-直线或曲线标注

    根据需求标注目标对象对应的线条位置,线条可能是直线也可能是曲线,常用于分隔表明边界的事物。常用于自动驾驶,如下所示:

图像标注-点标注

    这种标注一般用于人脸识别,人体姿态跟踪(如POSE算法)等

视频标注-跟踪标注

    在视频或连续的图像中跟踪标注的目标对象,形成与ID关联的运动轨迹

文本标注-中英文语音转写与校对

    英文语音转中文文本或中文文本转英文语音。

语音标注-客服语音标注

    外呼机器人进行外呼记录语音标注呼叫成功或失败,从而训练话术。

常用标注工具

    常用标注工具如下所示:

本文同步在微信订阅号上发布,如各位小伙伴们喜欢我的文章,也可以关注我的微信订阅号:woaitest,或扫描下面的二维码添加关注:

AI-数据标注类型的更多相关文章

  1. AI数据标注行业面临的5大发展困局丨曼孚科技

    根据艾瑞咨询发布的行业白皮书显示,2018年中国人工智能基础数据服务市场规模为25.86亿元,预计2025年市场规模将突破113亿元,行业年复合增长率达到了23.5%.​ 作为人工智能产业的基石,数据 ...

  2. 破局AI落地难,数据标注行业需率先变革丨曼孚科技

    ​2019年,国内人工智能领域的投融资热情大幅降低,相当数量的AI企业彻底消失在了历史的长河中,“人工智能寒潮已至”甚至成为行业年度热词. 与前几年创业与投资热情齐头并进的盛况相比,近段时间的AI行业 ...

  3. 曼孚科技:数据标注,AI背后的百亿市场

    ​ 1. 两年前,来自山东农村的王磊成为了一位数据标注员.彼时的他,工作内容非常简单且枯燥:识别图片中人的性别. 然而,一段时间之后,他注意到分配给他的任务开始变得越来越复杂:从识别性别到年龄,从框选 ...

  4. [C#.NET 拾遗补漏]09:数据标注与数据校验

    数据标注(Data Annotation)是类或类成员添加上下文信息的一种方式,在 C# 通常用特性(Attribute)类来描述.它的用途主要可以分为下面这三类: 验证 Validation:向数据 ...

  5. C++的那些事:数据与类型

    一.前言 最近在看C++Primer第5版,先前已经看过第4版,但是发现第5版在整个知识布局与个别知识的讲解上跟第4版差别还是挺大的,尤其是新增了C++11的内容,正如孟岩老师在第5版前言中所讲:“现 ...

  6. 如何正确选择MySQL数据列类型

    MySQL数据列类型选择是在我们设计表的时候经常会遇到的问题,下面就教您如何正确选择MySQL数据列类型,供您参考学习. 选择正确的数据列类型能大大提高数据库的性能和使数据库具有高扩展性.在选择MyS ...

  7. MySQL学习笔记之数据存储类型

    说明:本文是作者对MySQL数据库数据存储类型的小小总结. Numeric Type (数字类型) 1.TINYINT.SMALLINT.MEDIUMINT.INT.BIGINT主要根据存储字节长度不 ...

  8. sql 数据字段类型

    bit    整型 bit数据类型是整型,其值只能是0.1或空值.这种数据类型用于存储只有两种可能值的数据,如Yes 或No.True 或False .On 或Off. 注意:很省空间的一种数据类型, ...

  9. JSTL实现int数据的类型的长度

    JSTL否int类型转换string该功能.为了解决增益int数据的类型的长度,闹失踪. 得到String的数据的长度是jstl的fn能够${fn:length(string)},但int做数据? 经 ...

随机推荐

  1. 跨交换机VLAN之间的通信(基于Cisco模拟器)

    实验要求: 拓扑结构如下 1.交换机2台:主机4台:网线若干. 2.把主机.交换机进行互联. 3.给2台交换机重命名为A.B. 4.设置2台交换机及主机的ip.注意IP要不冲突 5.在2台交换机上分别 ...

  2. [LeetCode] 98. Validate Binary Search Tree 验证二叉搜索树

    Given a binary tree, determine if it is a valid binary search tree (BST). Assume a BST is defined as ...

  3. 第02组 Alpha冲刺(5/6)

    队名:無駄無駄 组长博客 作业博客 组员情况 张越洋 过去两天完成了哪些任务 摸鱼 准备"Alpha事后诸葛亮" 提交记录(全组共用) 接下来的计划 沟通前后端成员,监督.提醒他们 ...

  4. Java连载15-boolean类型&类型转换&++运算符

    一.boolean类型 1.说明: (1)在java语言中,boolean类型只有两个值:true.false,没有其他的值.在C语言中,是有0代表false和1代表true的 (2)在底层存储的时候 ...

  5. ng 打包给路径添加前缀

    1.ng build --base --href /前缀名/--common - chunk --output-hashing=all --optimization 2.更改ts和html中的路径,将 ...

  6. 31,Leetcode下一个排列 - C++ 原地算法

    题目描述 实现获取下一个排列的函数,算法需要将给定数字序列重新排列成字典序中下一个更大的排列. 如果不存在下一个更大的排列,则将数字重新排列成最小的排列(即升序排列). 必须原地修改,只允许使用额外常 ...

  7. 基础知识---委托和 lambda

    委托定义类型,类型指定特定方法签名. 可将满足此签名的方法(静态或实例)分配给该类型的变量,然后(使用适当参数)直接调用该方法,或将其作为参数本身传递给另一方法再进行调用. 以下示例演示了委托的用法. ...

  8. json工具类(一)——alibaba包

    package com.ruoyi.common.utils.json; import java.util.HashMap; import java.util.List; import java.ut ...

  9. Go语言-1-标识符与变量

    目录 1. Go标识符 1.1 Go关键字 1.2 常量标识符(4个) 1.3 空白标识符(1个) 1.4 内置数据类型标识符 1.5 内置函数(15个) 2. Go语言操作符 3. Go语言变量 3 ...

  10. C#将运算字符串直接转换成表达式且计算结果

    DataTable dt = new DataTable(); var Result= dt.Compute("1+2*3+2", "");//将运算字符串转换 ...