广州CBC2019
8月24日上午,CBC2019正式开幕。主持人首先对大会情况以及与会嘉宾做了简要介绍;紧接着,校领导、大会主席以及CCF专委工委委员致辞;与会来宾合照之后,会议正式开始。
特邀报告
来自中科院上海马普计算生物学研究所的研究员兼首席科学家李亦学教授带来了题为“肝癌的生物信息学以及多组学研究”的精彩报告。生命科学和医学进入了大数据驱动的颠覆性变革时代,生物医学大数据的来源与类型更是丰富多样。在这样的数据驱动下,教授向我们介绍了NODE新一代生物组学数据的汇交管理平台;并简要介绍了团队在肝癌多组学、肝癌精准医学以及肝损生再生这几个领域的研究情况。
来自香港浸会大学计算和理论科学研究所副所长张晓明教授为我们带来了题为“Clustering on Imbalance Data”的精彩报告。少数类的数据中常常会包含更多有用的信息,例如在癌症诊断中,少数类更应该被关注。处理非平衡数据的方法一般有1)采样方法,包括降采样和过采样;2)权重设置法。目前为止,如何处理非平衡数据仍未有一个较为通用的方法。张教授提出一种SMCL方法:先选择多个小聚点,再通过惩罚学习将小聚点融合成大聚点,最终为数据划分出适当的聚类结果。
来自中南大学计算机学院的院长王建新教授为我们带来了题为“生物医学大数据处理研究探讨”的精彩报告。随着生物分析和计算技术的快速发展,生物医学领域产生了大量的数据。王教授在分析生物医学数据的主要来源以及相关特点的基础上,与大家分享了AI技术在电子健康档案、医学影像数据以及生物组学数据的分析应用等方面的研究工作和挑战,并就生物医学人工智能中存在的主要问题进行了简要分析和探讨。
分会场报告
下午的报告分别在三个分会场举行,分会场的主题分别为:精准医疗,医学图像,表型-基因型分析;组学大数据分析与医疗应用;蛋白质结构预测与计算。下面对其中的部分报告做简单介绍:
来自海普洛斯的陈实富CTO为我们带来了名为“生物信息开源实践”的精彩报告,这是本次大会为数不多的来自企业的报告嘉宾。他为我们介绍了该公司现有的两个产品:极速高敏感度地检测目标突变的MutScan、目标基因融合的敏感检测和可视化GeneFuse。产品的独特性会给公司以及使用者带来最大化的价值,因此工具的特性介绍和使用方法也是必不可少的。
来自云南大学周维教授团队的于小娟学者为我们带来了题为“Exploiting XGBoost for Predicting Enhancer-Promoter Interactions”报告。该篇论文使用表观基因组学数据预测增强子和启动子的相互作用(EPIs),并发现H3K家族特征能表现EPIs;另外,对比常用的机器学习分类方法如GBDT、XGBoost等三种方法,最终发现XGBoost的分类效果最好。报告结束后,实验室小伙伴与她进行了交流和学习。
来自上海脑科学与类脑研究中心的曾涛副研究员为我们带来了名为“Scalable and Adaptive Integration Analysis for Big Omics Data”的精彩报告。在生物大数据时代,如何对多层次匹配组学信息的样本进行整合分析至关重要。而在不同场景的生物学研究中,单层组学和未确定层数的多组学数据广泛存在,因此可拓展性和自适应数据集成方法至关重要。该团队提出一种名为HCI(高阶相关积分)的有效数据集成框架,利用PFA(模型融合分析)结合的高阶矩阵,实现了联合特征提取以及自适应模式。同时还整合了来自TCGA和GEO数据集的异质组学数据,验证了方法的有效性。
来自华中科技大学物理学院生物物理研究所的黄胜友教授,带来了名为“Modeling the Symmetry of Pretein-Protein Complex Structures through Molecular Docking”的精彩报告。黄教授主要介绍了蛋白质与蛋白质相互作用的分子对接方法,主要研究Cn对称蛋白的反应。相互作用的对接基于快速傅里叶变换,建立打分函数,通过迭代优化使得结合自由能最低。黄老师团队在2018年国际蛋白质与蛋白质复合物结构预测竞赛中荣获冠军,并在其他多项重要竞赛中也获得佳绩。
BC2019-day2
8月25日,第四届中国计算机学会生物信息学会议第二天的精彩报告如约而至。
特邀报告
来自中山大学中山眼科中心的刘奕志教授为我们带来了题为“用人工智能进行常见眼病筛查诊断、风险和预后预测的研究”的精彩报告。刘教授团队近年来利用高速发展的机器学习新算法,对眼科诊疗大数据进行挖掘学习,构建了白内障图像识别诊疗决策云平台、青光眼多模态诊断体系、眼底多疾病诊断系统和近视发展预测的一系列人工智能模型,经过内外部的机器数据验证,准确率均可达到90%以上。以上系统已经在临床上初步投入使用,并取得了临床实践上的真实反馈,可辅助或部分代替医生,远程为广大患者提供专家级别的筛查、诊断、诊疗决策、风险评估和预后预测的新型医疗服务。
来自中国科技大学的黄德双教授为我们带来了题为“Motif Mining in Biological Sequences by Deep Neural Networks ”的精彩报告。黄教授今天讲述的主题是使用深度学习方法进行序列的motif挖掘,有研究表明结合位点motif挖掘在转录和翻译中发挥着至关重要的作用,将motif挖掘与深度神经网络相结合已成为研究趋势。接下来列举了多种神经网络模型,如:卷积神经网络、半监督神经网络、大型卷积神经网络等,结合序列和结构信息,用于预测RNA与DNA的motif。在最后黄教授也提出了motif预测的难点,因结构信息是通过序列信息预测,所以可能产生冗余信息,无法保证预测高准确性,进一步来讲,序列编码以及模型选择也对预测准确性有一定影响。
来自中科院“基因组科学与信息”的方向东博士为我们带来了题为“基因组大数据与全民健康”的额精彩报告。方博士主要介绍了目前关于基因组大数据的使用瓶颈以及实现全民健康需要做出的努力。随着基因测序的价格越来越低,越来越多的基因数据积累起来,目前关键技术瓶颈是生命健康大数据不能得到有效利用,如果能够及时获取、结构化整合、快速分析这些数据,并且有效整合临床医疗与卫生健康数据,才能开展精准的疾病分类与诊断,实现个性化疾病防治和健康管理的全新模式。生命健康大数据不能得到有效利用的主要原因在于:数据多元异构、物理分散,亟需集成与融合,需要开发组学和医疗数据集成引擎,建立标准化的、可拓展、可共享的精准医学大数据平台;在充分保障健康数据的隐私和安全的前提下 ,有效实现精准医学大数据的互联、互通、互操作。国家主管部门要及时出台相关的法规和标准,加快建设统一权威、互联互通的人口健康信息平台。
分会场报告
下午的报告分别在三个分会场举行,分会场的主题分别为:生物信息学算法,基因组学分析,生物网络、RNA与疾病关联分析。下面对其中的部分报告做简单介绍:
来自南开大学人工智能学院的张瀚教授为我们带来了题为“Detecting Hidden Batch Factors Through Data-Adaptive Adjustment tor Biological Effects ”的精彩讲座。批量效应是影响高吞吐量研究(如RNA测序)测量技术变化的主要来源之一,有研究表明,不同的实验平台、实验室条件、不同的样品来源和人员差异可能会导致批量效应差异,这些差异会导致假阳性。批量校正算法的一个关键是弄清楚批量因素,但在许多情况下,这些因素是未知的或不准确的,因此,检测隐藏的批量因素尤为重要。张教授团队提出了一种基于数据自适应收缩和半非负矩阵分解的检测未知批量效应的新算法,能够识别原始研究遗漏的新的批量因子,导致差异表达基因的表达不足,同时在检测细微批量效应方面也具有强大功能。
来自大连理工大学软件学院的何增有教授为我们带来了题为“统计显著社区发现及其在生物信息中的应用”的精彩报告。社区发现是数据挖掘以及网络科学等诸多领域中的核心算法问题之一,何教授团队将统计显著社区发现算法应用在蛋白质与蛋白质网络发现等生物信息学问题中,最近提出评估社区统计显著性的P值计算方法(社区划分越合理,P值越小),以及如何利用启发式的方式来对目标函数进行优化,搜索具有统计显著意义的社区。
来自吉林大学周丰丰团队的成员为我们带来了一场名为“Two Straws May Make a Perfect Diamond: Selecting Individually Weak Features for a Better Accuracy ”的精彩报告。由于算法时间复杂度等问题,生物医学大数据的常用分析方法是考察组间差异指标(特征),来发掘表型相关的功能模块。通过理论构造和实验验证多个途径表明,组间差异性较小的单个特征,组合在一起可以取得非常好的数据模型。该团队在IFS方法的基础上,提出了一种名为RIFS的特征打分排序算法,并进一步给出了多个不同生物医学大数据领域的实际应用案例。
来自湖南大学信息科学与工程学院的骆嘉伟教授为我们带来了一场名为“基于癌症基因组学数据的miRNA功能模块识别算法研究”的精彩报告。大量研究表明miRNA的异常表达与癌症的发生、发展有关,且miRNA通常以组合的方式发挥其协同调控作用。本报告主要介绍如何通过聚类手段发现miRNA的功能模块,即利用粗糙集算法识别miRNA调控模块和利用亲和力传播聚类算法发现miRNA预后模块。
最后,中国科学院计算机技术研究所研究员张法进行闭幕式致辞,并宣布下一届CBC会议拟于2020年8月16-19日在哈尔滨华旗饭店举行。期待明年的会议~
广州CBC2019的更多相关文章
- 广州PostgreSQL用户会技术交流会小记 2015-9-19
广州PostgreSQL用户会技术交流会小记 2015-9-19 今天去了广州PostgreSQL用户会组织的技术交流会 分别有两个session 第一个讲师介绍了他公司使用PostgreSQL-X2 ...
- 活用UML-软件设计高手(广州 2014年6月14-15日)
我们将在广州为您奉献高级技术课程”活用UML-软件设计高手“,首席专家张老师将会为您分享软件架构设计.数据库设计.用户体验设计及详细设计的最佳实践,帮助您成为优秀的软件设计师! 时间:2014.06. ...
- 广州APP开发外包公司哪家比较好?广州达到信息技术有限公司技术到底怎么样?
广州APP开发公司哪家比较好,广州手机APP软件开发公司广州达到信息表示:用户的刚性需求是公司使用手机APP软件盈利的根本前提和基础,所以开发一款手机APP应用时必须从客户的角度来思考.因此公 ...
- Selenium自动化测试实践 公开班(广州)
Selenium自动化测试实践 公开班(广州) http://gdtesting.com/product.php?id=115
- 2016开发一个app需要多少钱?app开发需要哪些成本-app开发问题汇总-广州达到信息
作为一个APP开发从业者,被外行的朋友们问及最多的问题是,"做一个网站需要多少钱?"或者"开发一个APP需要多少钱?".作为开发过完整网站项目和手机APP的人, ...
- 开发一个App要多少钱?APP开发报价单,APP开发外包有哪些注意事项-广州达到信息www.ddapp.com.cn
来源:广州达到信息著作权归广州达到信息所有.商业转载请联系作者获得授权,非商业转载请注明出处. 作为一个APP开发从业者,经常会有人问到:开发一个App要多少钱?下面针对这个问题来好好解答解答正经的谈 ...
- 广州传智博客黑马训练营.Net15期
广州传智博客黑马训练营.Net15期 7 张扬波 MVC大项目 6 张扬波 MVC 3 胡凌浩 HTML&JS 2 基础加强+三层 5 张扬波 企业站点(asp.net)&EF 4 江 ...
- 长宽广州地区DNS
网络又抽风了,发现时DNS的问题. 打客服电话问到了长宽广州的DNS: 首选:211.162.62.1备用:211.162.62.61
- 针对电信乌龙事件的深度测试: 广州电信错误将深圳地区189的号码在3G升级4G申请时从广州网厅发货,造成深圳用户收到4G卡后无法激活,深圳电信找不到订单
广州电信错误将深圳地区189的3G升级4G申请从中国电信广州网厅发货(智能卡号:8986 1114 9002 0851 742X S 电话号码 189),造成用户收到4G卡后无法激活,深圳电信找不 ...
随机推荐
- 「ZJOI2019」Minmax搜索
传送门 Solution 叶子节点的变化区间是连续的,可得知非叶子节点的权值变化区间也是连续的 由此可知,\(W\)的变化值的可行域也是连续的,所以只需要看它能否变为\(W+1\)或\(W-1\) 对 ...
- 微信公众号_Deejo说_2019
说明: 1. 文中的内容均来自Deejo说微信公众号 2. 微信中搜索"Deejo说"公众号,可关注 麻麻英语 ——2019.09.10—— It’s my treat. 我来请客 ...
- fastq 转换为 fasta
使用 awk awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' XXX.fastq & ...
- 【2019.11.27】SDN课程阅读作业(2)
过去20年中可编程网络的发展可以分为几个阶段?每个阶段的贡献是什么? Making computer networks more programmable enables innovation in ...
- chown与chmod的区别
chown 修改文件和文件夹的用户和用户组属性 1.要修改文件hh.c的所有者.修改为sakia的这个用户所有 chown sakia hh.c 这样就把hh.c的用户访问权限应用到sakia作为所有 ...
- conda中重要的三个概念:环境、通道和包
基本使用conda必须要了解的三个概念:虚拟环境.通道和包. conda提供了在python环境下重要的编程环境管理功能,包括环境隔离和依赖包管理. 环境隔离通过虚拟环境实现,与此相关的命令有: co ...
- 可伸缩性架构常用技术——之数据切分 Data Sharding/Partition
1. 简介 本来想写一篇可伸缩性架构方面的文章,发现东西太多了,久久未能下笔,这里首先把大家最关注的数据切分(Partition/Sharding)方面的内容先写完,给大家参考. 我们知道,为了应对不 ...
- arcpy实例教程-地图范围导出到要素类
arcpy实例教程-地图范围导出到要素类 商务合作,科技咨询,版权转让:向日葵,135-4855_4328,xiexiaokui#qq.com 功能:将当前地图范围导出到内存要素类 描述:将当前地图的 ...
- sqlserver表被锁了,解锁方法,删除锁的方法
-- 查询死锁select request_session_id spid, OBJECT_NAME(resource_associated_entity_id) table ...
- 013-centos7 常用命令--查看当前用户的4种方法
一.概述 4种查看系统用户信息(通过编号(ID))的方法. 1.1. 使用w命令查看登录用户正在使用的进程信息 w命令用于显示已经登录系统的用户的名称,以及他们正在做的事.该命令所使用的信息来源于/v ...