【观隅】数据集管理与可视化平台-NABCD分析
| 项目 | 内容 |
|---|---|
| 这个作业属于哪个课程 | 2021春季软件工程(罗杰 任健) |
| 这个作业的要求在哪里 | 团队项目-初次邂逅,需求分析 |
项目介绍
观隅 数据集管理与可视化平台(取“观一隅而知全局”之意),一款数据集管理与可视化软件,可以对常见深度学习数据集进行筛选、可视化以及结构解析。可以方便深度学习新手快速入门,也可以通过对数据集内容的直观展示辅助模型的设计与优化。
NABCD分析
N (Need 需求)
- 深度学习近年来被大量应用。目前网上有各种领域各种各样的数据集,数据集的格式具有多样性,不方便使用者直接查看
- 初次接触某领域的深度学习任务时,用户需要通过观察数据集来了解任务的输入输出,从而对任务建立起直观的理解
- 对数据集的可视化可以加速用户后续的模型开发过程,观察模型在数据集上表现不好的部分,可以相应地改进自己的设计,加速开发进程
A (Approach 做法)
常见深度学习数据集的可视化
- 对于简单的带标签的分类数据,展示数据(不同形式)以及数据对应的标签
- 对于图像分割、物体识别等数据,用颜色覆盖层标注图像的分割结果和物体位置,同时标注物体内容
- 对于视频数据,动态用颜色覆盖层等方式标志出目标
- 对于音频数据,在时间轴上展示数据中被标记的区域
- 对于文本数据,用不同颜色分割不同的被标记成份
数据集文件结构的可视化解析
- 解析文件的结构
- 对于某些没有DataLoader的数据集,提供示例代码生成
数据集内容的筛选和搜索
- 用户可以选出自己感兴趣的目标标签并查看结果,例如从MNIST数据集中找出所有标注为1的图像
- 在NLP相关的数据集里,用户可以查找相关的数据内容,例如从IMDB数据库中找到存在某个词的数据及其标注
数据集的筛选和搜索
为了方便用户直观体验一些基础的公共数据集,在服务器上搭建网站提供主流数据集的管理与可视化服务
考虑到数据隐私和网络性能等原因,允许在用户主机端运行Web服务器提供管理(类似TensorBoard),用户可在浏览器中打开本机的数据集进行可视化和管理
B (Benefit 好处)
- 用户可以通过本平台对某个或某类数据集形成直观认识
- 用户可以通过本平台快速筛选出某领域的数据集
- 用户可以通过本平台对某个数据集中的数据进行快速筛选,并以可视化的方式对这部分数据的特征进行了解
- 用户可以将服务部署在本地,对于本地的涉密数据集也可以可视化
C (Competitors 竞争)
目前,尚没有完整的针对大量数据集的示例
现在能在互联网上找到的,关于数据集格式内容的信息,主要来源有以下两点
- 数据集发布者提供说明文档,和数据集内容示例
- 各类博客作者自己总结有关数据集
第一类内容权威但零散,第二类内容的时效性和权威性都堪忧。此外,二者都并不支持以较便捷的方式查看数据集的指定部分内容,这正是本产品的机会和优势。
D (Delivery 交付)
本产品目标用户为初步接触深度学习的高校学生、接触深度学习新领域的高校研究生和科技公司研究员;我们希望从北航的参加冯如杯、选修方法论的同学切入,逐步拓展到研一、研二学长学姐等人群
通过微信朋友圈,QQ空间等个人渠道推广;在方法论等引导学生入门深度学习的课程群进行推广
软件发布与用户量估计
我们希望通过网站的形式发布软件,网站提供经典数据集的可视化服务和可供本地部署的客户端的下载方式。
预估发布一周后,网页端用户量约有200人,下载部署用户人次约有20人次。
宣传视频
https://bhpan.buaa.edu.cn:443/link/09297EE2B35E9C79F8F5C7197069DF62
【观隅】数据集管理与可视化平台-NABCD分析的更多相关文章
- “知疫”疫情防控可视化平台——NABCD分析
"知疫"疫情防控可视化平台 项目 内容 这个作业属于那个课程 2021春季学期软件工程(罗杰.任健) 这个作业的要求在哪里 初次邂逅,需求分析 1 NABCD分析 NEED 目前多 ...
- seaborn教程3——数据集的分布可视化
原文转载:https://segmentfault.com/a/1190000015006667 Seaborn学习大纲 seaborn的学习内容主要包含以下几个部分: 风格管理 绘图风格设置 颜色风 ...
- Superset 0.37 发布——颜值最高的数据可视化平台
Superset 0.37,增加可视化插件,行级权限控制 使用Superset已经有一段时间,其良好的体验与丰富的图表功能节省了大量的时间.但是对于权限,自定义图表,图表下载,报警邮件一直没有很好的支 ...
- 整理全网最全K8S集群管理工具、平台
整理常见的整理全网最全K8S集群管理工具.平台解决方案. 1 Rancher Rancher中文官网:https://docs.rancher.cn/ 2 KubeSphere 官网:https:// ...
- bi数据可视化平台带来的企业变化
相信现在互联网的发展,大家有目共睹,在互联网的快速发展下,所产生的数据已经成为庞然大物,各行各业都在进行数据化转型,大数据分析也就成了香饽饽,bi数据可视化平台能够让数据可视化,通过数据分析可以业务人 ...
- 资料共享平台----nabcd
知识共享平台NABCD模型 N(need)需求 大一新生刚刚开始大学生活,不适应大学学习生活的节奏,并且课堂上知识容量大.密度高,学生不能立刻掌握所学知识点,同时,网上资料冗杂繁复,指向性不强,导致学 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理
SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...
- 【分布式搜索引擎】Elasticsearch之安装Elasticsearch可视化平台Kibana
一.Kibana简单介绍 Kibana 是为 Elasticsearch设计的开源分析和可视化平台.你可以使用 Kibana 来搜索,查看存储在 Elasticsearch 索引中的数据并与之交互.你 ...
- 用户需求与NABCD分析
用户需求与NABCD分析 目录 项目简介 用户需求分析 调研途径 问卷情况说明 问卷反馈与分析 NABCD分析 Need 需求 Approach 途径 Benefit 好处 Competitors 竞 ...
随机推荐
- js generator和yield
function co<T>(fn: () => Generator<any, any, any>): Promise<T> { const g: Gener ...
- RT-Thread学习笔记3-线程间通信 & 定时器
目录 1. 事件集的使用 1.1 事件集控制块 1.2 事件集操作 2. 邮箱的使用 2.1 邮箱控制块 2.2 邮箱的操作 3. 消息队列 3.1 消息队列控制块 3.2 消息队列的操作 4. 软件 ...
- 为什么10月上线的NGK Global即将燎原资本市场
近日据社区透露,NGK Global将在10月全面启动,数据公开透明,人人可以参与运营监管. 现在,区块链经济已经处于爆发前夜.金融行业的探索领先一筹,而其他行业的应用正在快速展开.区块链行业应用头部 ...
- 创建gitHub账户并配置秘钥
1. 登录注册地址 https://github.com/ 2.点击注册 Sign up 3.输入邮箱 密码 进行注册 4.注册成功后,登录邮箱验证 .然后通过邮箱和密码登录gitHub.设置 set ...
- django学习-19.admin管理后台的配置和登录
目录结构 1.前言 2.admin管理后台的配置和登录的完整操作流程 2.1.第一步: 在[settings.py]里对常量[INSTALLED_APPS]的值进行相关配置 2.2.第二步: 在[ur ...
- 将项目加载到tomcat中的时候报错:Tomcat version 6.0 only supports J2EE 1.2, 1.3, 1.4, and Java EE 5 Web modules
转自:http://jingwang0523.blog.163.com/blog/static/9090710320113294551497/ 最近在用eclipse做项目,新建项目时什么都贪新,用最 ...
- 微信小程序开发小技巧:
小技巧:输入view.tabs_content就可以生成下面的代码. 输入p10,就可以得到: 输入jc:c得到:文字水平对齐 输入d:f得到: 输入ai:c得到: 输入bb得到: currentCo ...
- C++Template 模版的本质
我想知道上帝的構思,其他的都祇是細節. ...
- 看完我的笔记不懂也会懂----ECMAscript 567
目录 ECMAscript 567 严格模式 字符串扩展 数值的扩展 Object对象方法扩展 数组的扩展 数组方法的扩展 bind.call.apply用法详解 let const 变量的解构赋值 ...
- WeihanLi.Npoi 1.16.0 Release Notes
WeihanLi.Npoi 1.16.0 Release Notes Intro 最近有网友咨询如何设置单元格样式,在之前的版本中是不支持的,之前主要考虑的是数据,对于导出的样式并没有支持,这个 is ...