学生开发者勇担青年使命,用AI守护少数人的“视界”
本文分享自华为云社区《【先锋开发者云上说】学生开发者勇担青年使命,用AI守护少数人的“视界”》,作者:华为云社区精选 。
青年动人之处,在于他们的勇气,和非凡的创造探索精神。
有这样一群00后学生开发者、,他们用AI探索医疗领域的技术创新,为少数群体守护光明。
在刚刚结束的2023华为开发者大赛全球总决赛上,他们一路过关斩将,凭借AI眼部医疗辅助诊断系统获得了中国赛区学生赛道全国一等奖的铜奖。

如果早一点,人们眼里光就多一点
孙洋今年大三,是电子科技大学成都学院人工智能专业的一名学生,他很喜欢这个伴随着AI技术浪潮而起的新兴专业,常常泡在学校实验室里研究神经网络、深度学习、图像识别、人机交互等各种技术。直到一次比赛,孙洋无意中接触到一个医疗辅助诊断系统的项目,顿时兴趣高涨。
“我就想基于最初的原型,结合AI技术把项目进一步扩大。”在这个过程中,孙洋找来了几个志同道合的小伙伴,正式组建了“融创眼援”团队,即用融合创新的技术“援助”那些患有眼部疾病的群体。
孙洋选择做这个项目的初衷,既是为了研究图像识别技术在医疗领域的应用,更是考虑到宏观的社会现状和市场环境下,眼健康行业中普遍存在缺乏早筛且资源分布不均的问题,“如果能早一点,那么人们眼里的光就多一点”,他们渴望用学到的技术去做一些实事,为这个世界带来一点改变。
接入上云,项目加速
团队成员先是去学校的合作医院走访调研,从与眼科医生的访谈中抽象出项目的数据模型逻辑,随着调研的深入,他们发现做医疗项目最棘手的就是数据隐私安全。由于医疗数据的特殊性,患者的病史数据难以在各个医疗机构共享,不可避免形成“数据孤岛”的局面,从而导致医疗资源的浪费,也让医生难以全面了解患者情况,难以做出正确的诊疗决策。
介于医疗数据的特殊性,孙洋和团队选择采用联邦学习的训练框架,将敏感的眼部影像数据保存在本地,把数据训练出来的模型参数上传到云端,来保证模型的效果。
但对于学生开发者来说,上云面临着巨大的成本压力。此时,孙洋在学校论坛上看到了华为开发者大赛的消息,当即决定带着团队试一试。报名成功后,孙洋很快申领到了一定数额的上云代金券。
他们先是用华为云云耀服务器搭建了一个底座,本地通过SSH连接到云服务器,配置好联邦学习需要的基本网络设置,以及依赖库,将模型参数传到云上的数据库,团队成员都可以直接访问下载,进行新的训练和计算,再将新的模型参数更新到云端,提高模型的准确率。

“最开始我们在做云端系统搭建的时候,完全摸不着头脑。好在华为云官网上的技术文档非常详细,再加上华为云社区其他开发者分享的详细教程,跟着一步步做基本上没问题。之前我们在本地构建数据库管理数据也挺麻烦的,但在云上一键就能完成,省时省力。”孙洋提到,在华为云的支持下,他们基本上实现了零成本的接入上云,从而能更顺利地推进整个项目。
在数据训练方面,最初孙洋也只能用自己的电脑来跑,后来借助华为赠送的昇腾Atlas 200I DK2开发板,得以快速高效地在本地完成模型的训练,然后再将数据传回电脑和云上,既节省了一定的硬件成本,也缩短了他们的研发周期。
从实践中来,创新的多模态融合
在和医生的交流中,孙洋观察到他们在实际诊断中,不仅仅要仔细查看病人的眼底影像,而且要综合病人的的其他病理检查结果,才能得出一定的结论。
孙洋举了个例子,假如一个患者患有糖尿病视网膜病变,血糖的升高会导致他眼球血管里面的渗透压增大,医生要去检查他眼球血管是否有增生或者阻塞。但单从一张眼底彩相只能看到血管的分布,医生还需要查看患者拍摄的 FFA(荧光素眼底血管造影技术)的图像,了解血管的流向,并综合患者的血糖、日常饮食习惯等其他情况,来给出最终的诊断结果。
“于是,我们就做了多模态数据的融合,将眼底图像、FFA图像、OCT图像和检测数据转化成向量,并对不同的数据类型进行权重分配,加入到神经网络里面来实现融合诊断。”

由于获取到的医疗数据有限,孙洋和团队对既有的数据进行增强来提高模型的准确率;并自主研发了基于超参数的改进TransCNN模型,试验结果的准确率高达97.48%,在500例与专业医师诊断结果对比中,差异率也控制在3%~5%之间。
为了让医生能够更高效得使用这套AI辅助系统,他们还创新研发了一体化图像处理技术,包含有血管分割、分类检测、自动标注、表格统计四大功能,满足了医生的绝大多数需求。

从确定产品规划、实现核心算法突破到与相关医院取得意向合作,对标一线完善系统定位与设计,历经一年的攻坚克难,融创眼援开发出了基于多模态的眼部医疗辅助诊断系统。
“现在,医生只需上传患者的影像资料,我们的眼部辅助诊断系统可在8秒内实现自动标注并给出影像诊断意见,随后生成病情报告,在单一病种诊断上对比专业医生,准确率高达97.48% 。”

让源源不断的创意变为现实
团队下一步的方向是将二维眼底图像转化成3D模型,可视化模拟真实的眼球血管走向,再借助传感器来实现手势识别,结合华为云的语音识别服务,开发出更高效的可视化交互诊断系统,这样医生就可以直接在这个3D眼球上进行观察或者手术模拟等。“类似于元宇宙医疗的概念”孙洋补充道。
回顾参赛以来的种种经历,孙洋心有戚戚,“就像打开了新世界的大门,因为之前参加的一些比赛都很看重表面工作,但华为开发者大赛评判作品的首要标准是技术创新,对于热爱技术的我们来说特别友好。而且华为云的很多产品有详细的学习路径和教程,即使和自己专业无关,我们也可以去玩一玩、学一学。”

当接触学习的内容多了,这群学生开发者经常会冒出各种新奇的想法,如孙洋所说,“脑子里就像有一台计算机,想去尝试各种新兴前沿的技术,比如我们现在对脑机接口很感兴趣,在想是不是可以通过它让抑郁症患者重回正常生活……”
开发者,是用代码改变世界的人。他们写下的每一行代码,开发的每一款应用,都有可能成为驱动创新的重要源泉。华为云予力学生开发者追求AI医疗技术创新,帮助他们脚踏实地去实现梦想,让源源不断的创意变为现实。
学生开发者勇担青年使命,用AI守护少数人的“视界”的更多相关文章
- 用AI识别内部人威胁面临的道德规范
用AI识别内部人威胁面临的道德规范 还记得汤姆·克鲁斯的<少数派报告>吗?人工智能可识别昭示未来风险的员工行为.该如何有效且有道德地使用这一数据呢? 为保护公司网络不受恶意软件.数据渗漏和 ...
- 音视频开发者的福音,快速集成AI配音能力
音视频内容创作者对剪辑应用中的AI配音需求与日俱增.它的优点很多,不光可以解决雇佣人力配音的成本以及创作者本身的口音.语言等限制,还可以大幅提升生产效率.比如,短视频的播放时间短的几十秒,长的vlog ...
- 国外AI界牛人主页 及资源链接
感觉 好博客要收集,还是贴在自己空间里难忘!!! 原文链接:http://blog.csdn.net/hitwengqi/article/details/7907366 http://people.c ...
- 全面解析百度大脑发布“AI开发者‘战疫’守护计划”
即日起,百度大脑发布“AI开发者战疫守护计划” 大疫当前,人人有责,携手开发者共同出击抗击疫情 基于百度大脑AI开放平台和飞桨深度学习平台,积极运用算法.算力.软件等“武器”助力抗疫! 谁能参与计 ...
- 百度大脑发布“AI开发者‘战疫’守护计划”,AI支援抗疫再升级
面对新冠肺炎疫情,AI开发者们正在积极运用算法.算力.软件等“武器”助力抗疫.针对开发者们在疫情防控期间的开发与学习需求,2月6日,百度大脑推出“AI开发者‘战疫’守护计划”, 正在进行疫情防控相关应 ...
- 华为有AI,这场转型战有点大
华为有AI,这场转型战有点大 https://mp.weixin.qq.com/s/qnUP5cgbNxXcAT82NQARtA 李根 发自 凹非寺 量子位 报道 | 公众号 QbitAI 华为有AI ...
- AI+教育落地,百度大脑如何让校园更智能?
人工智能作为影响社会底层技术革命逐渐向传统行业渗透,“AI+”已经替代“互联网+”成为创业创新的新引擎,出人意料的是,在AI在教育业的率先落地并且相当火爆. 现在,人工智能教育已成为从业者心目中的“教 ...
- AI小白快上车!这是发往高薪职位的车!
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由腾讯云AI中心发表于云+社区专栏 AI到底有多火?看看下面这组数据: 腾讯研究院<2017全球人工智能人才白皮书>报告中提 ...
- 微软大礼包 | 集合在线学习资源,助你秒变AI达人
编者按:人工智能的浪潮正如火如荼地袭来,未来人工智能将大有所为,人们的生活轨迹也正在技术不断向前推进的过程中逐渐改变.人工智能不是科研人员或开发人员的专属,微软希望能够将人工智能带给每个人,从开发者到 ...
- 【转载】程序猿转型AI必须知道的几件事!
历史上AI火过两次,但是最终都已销声匿迹作为结束.这次AI大火的原因:AlphaGo 4比1战胜李世石,相对于一些外行人的恐慌和恐惧,其实很多业内人员在这场世纪之战结束后,都为人类点上了一个大大的赞. ...
随机推荐
- 线上问题排查--进程重启失败,最后发现是忘了cd
背景 我前面写了几篇文章,讲c3p0数据库连接池发生了连接泄露,但是随机出现,难以确定根因,最终呢,为了快速解决问题,我是先写了个shell脚本,脚本主要是检测服务的接口访问日志,看看过去的30s内是 ...
- html5 3.0 表单
表单的定义:多个输入框,以表格的形式展示 表单常用在网页登录和注册功能中 表单的元素属性:<input type="text"name=" "valu ...
- 2.0 Python 数据结构与类型
数据类型是编程语言中的一个重要概念,它定义了数据的类型和提供了特定的操作和方法.在 python 中,数据类型的作用是将不同类型的数据进行分类和定义,例如数字.字符串.列表.元组.集合.字典等.这些数 ...
- 让 GPT-4 来修复 Golang “数据竞争”问题 - 每天5分钟玩转 GPT 编程系列(6)
目录 1. Golang 中的"数据竞争" 2. GoPool 中的数据竞争问题 3. 让 GPT-4 来修复数据竞争问题 3.1 和 GPT-4 的第一轮沟通 3.2 和 GPT ...
- 《Kali渗透基础》13. 无线渗透(三)
@ 目录 1:无线通信过程 1.1:Open 认证 1.2:PSK 认证 1.3:关联请求 2:加密 2.1:Open 无加密网络 2.2:WEP 加密系统 2.3:WPA 安全系统 2.3.1:WP ...
- KRPano最新官方文档中文版
KRPano最新官方文档中文版: KRPano作为VR全景开发中常用的工具软件,深受广大开发者喜爱,但由于软件本身是国外软件,因此官方的文档都是以英文为主,对于一些国内不太熟悉英文的开发者来说比较不友 ...
- ES6 Module模块,在vsCode中已服务器模式运行HTML文件
操作步骤如下: 一.安装Live Server 插件 二.点击扩展设置 三.设置live server默认打开浏览器为"chrome" 四.配置-工作区 五.在HTML文件中,右键 ...
- md5sum 文件一致性校验
1. 背景 在网络传输.设备之间转存.复制大文件等时,可能会出现传输前后数据不一致的情况.这种情况在网络这种相对更不稳定的环境中,容易出现.那么校验文件的完整性,也是势在必行的. md5sum命令用于 ...
- PostgreSQL学习笔记-7.基础知识:子查询、自增、PRIVILEGES 权限
子查询 子查询或称为内部查询.嵌套查询,指的是在 PostgreSQL 查询中的 WHERE 子句中嵌入查询语句.一个 SELECT 语句的查询结果能够作为另一个语句的输入值.子查询可以与 SELEC ...
- 【WPF】单例软件实现自重启
原文地址 https://www.cnblogs.com/younShieh/p/17749694.html 如果本文对你有所帮助,不妨点个关注和推荐呀,这是对笔者最大的支持~ 在WPF应用程序中 ...