项目 内容
课程 2020春季计算机学院软件工程(罗杰 任健)
作业要求 团队项目选择

项目名称

FOTT

项目内容

在OCR-Form-Tools开源项目的基础上,扩展功能,支持演示更多的API,例如看本账户有多少个模型;支持更多的应用场景,例如生成支持编程小白直接运行的python代码,只要提供endpoint和app key即可直接开始运行极大地简化上手难度和编程操作等。

Need

​ 对于各类有大量表单数据录入的企业或机构而言,如何实现大量纸质表单的快速智能电子化非常重要,针对票据表单的OCR表格识别技术在表格数据采集和应用之间架起高速通道。本项目可以节省大量的数据录入工作量、大大加快数据录入的效率、提高数据录入的准确性、并实现大量纸质表单原图的安全保存,能够满足各行各业的需求,让公司的业务摆脱手工。并且现在OCR的市场已经比较成熟,比如银行、保险、金融、税务、海关、公安、边检、物流、电信工商管理、图书馆、户籍管理、审计等很多行业都已经应用了OCR技术。而OCR-Form-Tools开源项目的在线工具部署在Azure上,国内访问比较困难,其他方法需要较高的计算机能力,因此我们的项目对没有较强计算机能力或网络环境的文字编辑非常友好。

Approach

项目基于微软的OCR Form Labeling Tool,将其他的功能开发成可视化程序,主要从两个角度开发:

  • 基于微软FOTT的API接口,扩展功能,完善当前的Web应用

    ​ 因为原应用是一个React + Redux Web应用,使用TypeScript语言(是JavaScript的超集,最终会被编译为JavaScript代码)开发 ,这也是我们进行扩展开发所使用的技术;

  • 基于已有的逻辑生成Python代码,便于开发者调试和测试

    ​ 技术基于React和TypeScript。

因为我们组大部分队员都很少有大型项目开发的经验。这次能够基于微软开源的项目的进行功能开发和完善是一个很好的平台,也是很大的挑战;我们也有很多需要学习的新知识和理论,并且在不算充足的时间里应用于实践,大概也能让我们很好的体会"敏捷开发"。在实践开发过程中,肯定会面临很多困难,但是作为一个团队前进,大家也一定会交流探讨,互帮互助,各司其职;再加上课程组和微软高级工程师专业的指导,大概也会是approach的buff加持。

Benefit

  • 容易上手、操作简单,不需要较高的编程能力或专业知识背景;
  • 文本分割粒度细,正确率较高;对手写字体也识别精准;
  • 用户可以手动更改各种表单训练集,标记tag再训练模型,可选取任意信息输出,实现重要信息的识别提取和不重要信息的过滤;
  • 功能丰富、形式多样,支持表格、收据等多种API;格式支持广泛,常见的图片、pdf均可;

Competitor

现在市面上有多种OCR识别软件、但这种专门是针对表单的OCR项目却并不多见。

睿琪票据智能识别平台为例,只提供了发票、火车票等相关功能,不能实现任意表单的任意数据的提取。

同时,我们的项目能够实现让没有多少编程经验的人放心使用,而市面上的大多数工具只是提供了一个API接口,具体代码需要自己实现,对没有编程能力的使用者非常不友好。

Delivery

  • 主要网站上线,参考:https://fott.azurewebsites.net/
  • 源码:github(支持本地编译按照使用,需要一定的计算机知识,提供教程也是不错的选择)
  • 前期主要考虑在同学、老师中宣传,搜集初步的应用反馈(调查问卷等);后期可以考虑通过知乎、公众号等进行推广。

用户量评估

发布一周,预估用户量400。

要点组合

各位领导/合作伙伴: 我们的 OCR功能增量开发以及API的完善是为了解决个人和企业面对大量表单数据以及OCR工具上手不易的痛苦, 他们需要获取各类表单(pdf、卡证、票据等)的数据进行自动识别、信息抽取、审核、对比等, 但是现有的方案并没有很好地解决这些需求,我们有现已较成熟的基于React和TypeScript的技术来支持相应功能的实现, 它能给用户带来易上手、个性化可定制、精准识别、功能完善的使用体验, 远远超过竞争对手 天若OCR睿琪票据智能识别平台等,包括我们以前的版本。我们相信新的改进能给我们带来更多用户以及落地的实用性改善,甚至应用于商业领域。值得期待。

参考博客

NABCD-name not found的更多相关文章

  1. 利用NABCD模型进行竞争性需求分析

    微博的NABCD模型 N-Need:毫无疑问,当今的中国普通民众是有这点需求的,在上个世纪中国民众的休闲娱乐方式更多的停留在以电视传媒为主的娱乐方式,而进入21世纪以来中国民众的娱乐中心向互联网转移, ...

  2. [课程设计]Scrum 1.1 NABCD模型&产品Backlog

    多鱼点餐系统WEB NABCD模型 & 产品Backlog ● 一.NABCD模型  1) N (Need 需求) 为了解决餐饮企业在同行中的竞争优势,减少顾客到店后的点餐.等餐及结算过程消耗 ...

  3. PhyLab2.0需求与功能分析改进文档(NABCD)

    PhyLab1.0需求规格说明文档 1. 概述 1.1 项目概述 软剑攻城队小组于2015学年开发了PhyLab物理实验网站,一经发布好评如潮.网站的核心功能是提供预习报告和自动数据处理,而后加入了论 ...

  4. 团队项目作业:利用NABCD模型进行竞争性需求分析

    NABC正是这样的一套框架,当你试图提出一项崭新的提案之际,它能够提供四个思维基点,令你的商业策划具备天马行空的基础. 具体来说,NABC是四个关键词的首字母缩写- Need(需求)-现在市场上未被满 ...

  5. NABCD需求分析

    1. N 需求    如今的社会,每个公司每个人都有大量的信息需要处理.保管和查询,这就难免会有些信息在个人电脑中保存的位置被遗忘,需要一款简单并且实用的搜索引擎来搜索个人 所需求的信息. 2. A ...

  6. 饭团(1):用NABCD大法为项目奠基

    上一篇文章:提升效率的开发工具 提到高效的开发工具就像催化剂,加速项目开发.这篇文章提到的NABCD大法,就像一份地图,指引项目往正确的方法上发展. 选择比努力更重要.一个项目成功自然离不开码农们的努 ...

  7. NABCD——竞争性需求分析的框架

    最近在读邹欣老师的书<构建之法>,读到很多地方,相当有感触,有种一拍大腿“啊,他说的太对了”的感觉,但都疏于记录,今天又看到一个一拍大腿特带感的一节,决定记录下来. 竞争性需求分析的框架— ...

  8. 思甜雅--关于qq的NABCD模型分析

    个人连接:http://www.cnblogs.com/xiaoliulang/ 关于QQ的NABCD模型 N--Need 随着电脑的普及,人们在网络上进行交流的时间越来越多,由于现有的交流工具还不是 ...

  9. 团队项目NABCD模型的需求分析

    团队项目NABCD模型的需求分析 NABCD模型的介绍 Need(需求)-现在市场上未被满足但又急需满足的客户需求是什么?Approach(方法)-要满足这种需求,我能够提出什么独特的方法吗?Bene ...

  10. 团队项目作业第二项:利用NABCD模型进行竞争性需求分析

    项目需求分析与建议--NABCD模型(王鲁跃负责) N (Need 需求) 对于现在的学生来说,我们认为打字是很重要的.不管在什么方面都需要进行电脑打字,例如文员.QQ.MSN.制作,论文等等,都需要 ...

随机推荐

  1. Amundsen在REA Group公司的应用实践

    REA Group是一家专门面向房地产与实业资产的跨国数字广告公司. 他们主要为消费者提供房地产购买.出售与租赁服务,同时发布各类房产新闻.装修技巧以及生活方式层面的内容.每一天,都有数百万消费者访问 ...

  2. 第一次OOP作业-Blog总结

    前言 第一次作业一共八道题,此次作业也是这三次作业中最接近面向过程程序设计的题目集,整体难度偏低,总耗时1.5h,主要的知识点在熟悉Java的语法上,整体题目的逻辑非常清晰简单,但最后一个判断三角形类 ...

  3. [2020年10月28日普级组]1405.小B浇花

    区 间 和 的 和 区间和的和 区间和的和 题目解析 就直接模拟,从最低的花的高度向最高的花的高度枚举,如果当循环变量的值到达了顶峰,但还有花的数量大于2的,就把循环上线加一(所以数组要开大些) Co ...

  4. Redis主从&哨兵集群搭建

    主从集群 在搭建主从集群前,我们先把Redis安装起来: #解压Redis压缩包 [root@master lf]# tar -zxvf redis-6.2.1.tar.gz -- #安装gcc [r ...

  5. 简述Java多线程(二)

    Java多线程(二) 线程优先级 Java提供一个线程调度器来监控程序中启动后进入就绪状态的所有线程,线程调度器按照优先级决定应该调度哪个线程来执行. 优先级高的不一定先执行,大多数情况是这样的. 优 ...

  6. 如何建立一个足够安全的SSH连接?

    1 概述 使用SSH连接服务器是一件很平常的事,但是,连接是否足够安全是一个令人担忧的问题.本文从如下几个方面介绍了如何建立一个足够安全的SSH连接: 端口 协议 用户 密码 密钥对 ssh-agen ...

  7. mariadb_1 数据库介绍及基本操作

    数据库介绍 1.什么是数据库? 简单的说,数据库就是一个存放数据的仓库,这个仓库是按照一定的数据结构(数据结构是指数据的组织形式或数据之间的联系)来组织,存储的,我们可以通过数据库提供的多种方法来管理 ...

  8. 前端进阶(1)Web前端性能优化

    前端进阶(1)Web前端性能优化 Web前端性能优化, 不仅能够改善站点的用户体验,并且能够节省相当的资源利用.下面将从1)服务器.2)html内容.3)css. 4)javascript. 5)图片 ...

  9. 现代操作系统原书第3版.mobi

    电子书资源:现代操作系统原书第3版 书籍简介   本书是操作系统领域的经典之作,与第2版相比,增加了关于Linux.Windows Vista和Symbian操作系统的详细介绍.书中集中讨论了操作系统 ...

  10. JDBC_05_ResorceBundle(资源绑定器) 绑定配置文件

    ResorceBundle(资源绑定器) 绑定配置文件 jdbc.proprtise 需要在src目录下新建一个文件夹然后将jdbc.proprtise放在文件中然后右键该文件夹选择 Rebuild ...