摘要:近期,中科院上海药物所、上海科技大学联合华为云医疗智能体团队,在Science China Life Sciences 发表题为“Facing Small and Biased Data Dilemma in Drug Discovery with Enhanced Federated Learning Approaches”的文章。

本文分享自华为云社区《中科院上海药物所/上海科技大学、华为云联合团队发布个性化联邦学习算法框架,赋能AI药物研发》,作者: 华为云头条 。

文章来源:中国科学杂志社

药物研发是一个漫长的过程,传统的药物研发需要投入大量的研发人员,并且花费十到十五年,数十亿美元的研发经费才能使一个药物走向上市。近些年来,随着AI、大数据和云计算等技术的发展,越来越多的制药公司和科技巨头把目光投到这一领域。然而AI药物研发面临着一系列困难和挑战,AI模型需要大量的数据进行建模,而药物研发数据的高壁垒、高成本、高机密性影响到了制药公司数据贡献的积极性。同时,数据孤岛现象普遍存在,很多企业内部的数据都是量少而且高度有偏的,这给高质量的AI药物研发模型带来很大的挑战。近年来新兴的联邦学习可以很好的解决这个问题。联邦学习本质上是一种分布式机器学习技术,其目标是在保证数据隐私安全合规的基础上,实现共同建模。在联邦学习框架下,多家药企之间无需共享数据,仅通过共享模型权重,来实现药企之间协同训练,在保证数据安全的同时彼此增强AI模型的效果。

近期,中科院上海药物所、上海科技大学联合华为云医疗智能体团队,在Science China Life Sciences 发表题为“Facing Small and Biased Data Dilemma in Drug Discovery with Enhanced Federated Learning Approaches”的文章。联合团队使用三个任务来模拟跨数据孤岛的联合学习过程:基于化学结构进行药物溶解度、激酶抑制活性和hERG心脏毒性的预测。这些数据涵盖了不同的药物化学空间、实验测量方法、实验条件和数据大小,代表真实世界中不同制药公司的数据分布的差异。借此,来研究联邦学习对打破数据孤岛的意义,并从分析结果中发现,联邦学习的效果均优于单独数据来源的模型训练。

接着,为进一步提升模型效果,联合团队引入了残差全连接网络(RFCN),通过利用AI自动建模工具AutoGenome1,对三个任务重新训练以获得更精确的模型骨架;另外,在联邦模型参数整合策略中联合团队引入了个性化联邦学习(FedAMP)2,为联邦计算参与者训练个性化模型,并且通过注意力消息传递机制加强具有相似数据分布的参与者之间的协同,使得数据贡献越多、质量越好的参与方获益也越大;在激酶抑制活性预测的性能对比我们可以看到,RFCN和FedAMP的引入,在药物溶解度、激酶抑制活性和hERG心脏毒性预测这三个AI任务上,均优于传统MLP和FedAvg方法。

近日,上海药物所/上海科技大学和华为云医疗智能体,联合发布基于华为云ModelArts平台的药物联邦学习服务,来帮助药企和研究机构更加方便的使用药物联邦学习,通过简单的四步操作,参与联邦学习的用户就可以便捷的实现联邦训练:第一步:盟主创建联盟,定义联邦任务,如药物结构预测水溶解度;第二步:盟主邀请参与者加入联邦,参与者同意加入;第三步:联邦成员部署代理,配置联邦运行环境;第四步:盟主启动联邦任务,开始联邦作业训练。

华为云医疗智能体EIHealth基于华为云AI昇腾集群服务、华为云一站式AI开发平台ModelArts的强大AI能力,集成了医药领域众多算法、工具、AI模型和自动化流水线,目标是打造一个全栈、开放、专业的医疗行业企业级AI研发平台。 更多信息请访问 : https://www.huaweicloud.com/product/eihealth.html

参考文献

1. Liu, D. et al. AutoGenome: An AutoML Tool for Genomic Research. bioRxiv 842526 (2019) doi:10.1101/842526.2. Huang, Y. et al. Personalized Cross-Silo Federated Learning on Non-IID Data. arXiv:2007.03797 [cs, stat] (2021).

点击关注,第一时间了解华为云新鲜技术~

个性化联邦学习算法框架发布,赋能AI药物研发的更多相关文章

  1. 联邦学习开源框架FATE助力腾讯神盾沙箱,携手打造数据安全合作生态

    近日,微众银行联邦学习FATE开源社区迎来了两位新贡献者——来自腾讯的刘洋及秦姝琦,作为云计算安全领域的专家,两位为FATE构造了新的功能点,并在Github上提交修复了相关漏洞.(Github项目地 ...

  2. 联邦学习开源框架FATE架构

    作者:京东科技 葛星宇 1.前言 本文除特殊说明外,所指的都是fate 1.9版本. fate资料存在着多处版本功能与发布的文档不匹配的情况,各个模块都有独立的文档,功能又有关联,坑比较多,首先要理清 ...

  3. 联邦学习FATE框架安装搭建

    联邦学习 FATE (Federated AI Technology Enabler) 是微众银行AI部门发起的开源项目,为联邦学习生态系统提供了可靠的安全计算框架.FATE项目使用多方安全计算 (M ...

  4. 强化学习(十七) 基于模型的强化学习与Dyna算法框架

    在前面我们讨论了基于价值的强化学习(Value Based RL)和基于策略的强化学习模型(Policy Based RL),本篇我们讨论最后一种强化学习流派,基于模型的强化学习(Model Base ...

  5. 联邦学习 Federated Learning 相关资料整理

    本文链接:https://blog.csdn.net/Sinsa110/article/details/90697728代码微众银行+杨强教授团队的联邦学习FATE框架代码:https://githu ...

  6. Apache Pulsar 在腾讯 Angel PowerFL 联邦学习平台上的实践

    腾讯 Angel PowerFL 联邦学习平台 联邦学习作为新一代人工智能基础技术,通过解决数据隐私与数据孤岛问题,重塑金融.医疗.城市安防等领域. 腾讯 Angel PowerFL 联邦学习平台构建 ...

  7. MindSpore联邦学习框架解决行业级难题

    内容来源:华为开发者大会2021 HMS Core 6 AI技术论坛,主题演讲<MindSpore联邦学习框架解决隐私合规下的数据孤岛问题>. 演讲嘉宾:华为MindSpore联邦学习工程 ...

  8. 针对深度学习(神经网络)的AI框架调研

    针对深度学习(神经网络)的AI框架调研 在我们的AI安全引擎中未来会使用深度学习(神经网络),后续将引入AI芯片,因此重点看了下业界AI芯片厂商和对应芯片的AI框架,包括Intel(MKL CPU). ...

  9. 简要介绍Active Learning(主动学习)思想框架,以及从IF(isolation forest)衍生出来的算法:FBIF(Feedback-Guided Anomaly Discovery)

    1. 引言 本文所讨论的内容为笔者对外文文献的翻译,并加入了笔者自己的理解和总结,文中涉及到的原始外文论文和相关学习链接我会放在reference里,另外,推荐读者朋友购买 Stephen Boyd的 ...

  10. 1、学习算法和刷题的框架思维——Go版

    前情提示:Go语言学习者.本文参考https://labuladong.gitee.io/algo,代码自己参考抒写,若有不妥之处,感谢指正 关于golang算法文章,为了便于下载和整理,都已开源放在 ...

随机推荐

  1. html笔记重点

    第五周-周二 一.视频和音频 <video src="路径" controls="controls"></video> 1.加contr ...

  2. Net 高级调试之五:如何在托管函数上设置断点

    一.简介 今天是<Net 高级调试>的第五篇文章.今天这篇文章开始介绍如何在托管方法和非托管方法设置断点,我们要想调试程序,必须掌握调试的一些命令,动态调试的命令,我们在上一篇文章已经讲过 ...

  3. 神经网络入门篇:详解向量化实现的解释(Justification for vectorized implementation)

    向量化实现的解释 先对几个样本计算一下前向传播,看看有什么规律: 公式1.16: \(z^{[1](1)} = W^{[1]}x^{(1)} + b^{[1]}\) \(z^{[1](2)} = W^ ...

  4. two-pointer 算法

    介绍 双指针算法是一种通过设置两个指针不断进行单向移动来解决问题的算法. 它包含两种形式: 两个指针分别指向不同的序列.比如:归并排序的合并过程. 两个指针指向同一个序列.比如:快速排序的划分过程. ...

  5. 七天.NET 8操作SQLite入门到实战 - 第二天 在 Windows 上配置 SQLite环境

    前言 SQLite的一个重要的特性是零配置的.无需服务器,这意味着不需要复杂的安装或管理.它跟微软的Access差不多,只是一个.db格式的文件.但是与Access不同的是,它不需要安装任何软件,非常 ...

  6. .net 温故知新【13】:Asp.Net Core WebAPI 缓存

    一.缓存 缓存指在中间层中存储数据的行为,该行为可使后续数据检索更快. 从概念上讲,缓存是一种性能优化策略和设计考虑因素. 缓存可以显著提高应用性能,方法是提高不常更改(或检索成本高)的数据的就绪性. ...

  7. MySQL-utf8 和 utf8mb4 区别?

    版权声明:原创作品,谢绝转载!否则将追究法律责任. ----- 作者:kirin 1.首先说明一下,版本问题.MySQL8.0之后默认:utf8mb4,而8.0之前默认:latin 2.utf8 和 ...

  8. 前端解析excel表格

    需求如下: 前端拿到表格中的数据,对数据做以下判断,并将拿到的数据转换成以下json格式,传给后端. 具体实现: 下载npm包:npm install xlsx --save 在vue文件中引入依赖: ...

  9. 【uniapp】学习笔记day02 | uniapp搭建

    起因:需要做一个小程序,家人们谁懂啊,老师我真的不会做,由于懒得看视频学习,于是只能看博客学习了. uniapp 好处: 1.不用关心适配问题 2.可以发布到各大平台的小程序 3.上手容易,使用vue ...

  10. JSON多层嵌套复杂结构数据扁平化处理转为行列数据

    背景 公司的中台产品,需要对外部API接口返回的JSON数据进行采集入湖,有时候外部API接口返回的JSON数据层级嵌套比较深,举个栗子: 上述的JSON数据中,最外层为请求返回对象,data里面包含 ...