[]基于分层双核多任务学习的酶号预测模型构建与基准测试

基于分层双核多任务学习的酶号预测模型构建与基准测试

报告开始:5月13日 09:50:00 (Asia/Shanghai)

报告时间:10min

所在会议:[E] 墙板报告 [E-1] 张贴墙板报告

摘要
近年来,随着测序技术的进步,蛋白序列的增长速度日益加快,仅仅依靠生物实验方法测定蛋白质功能,会导致蛋白质序列、结构信息与功能信息的鸿沟越来越大。为了增加注释速度,研究人员将计算方法引入进来,然而,现有方法在进行蛋白/酶-反应预测时仍存在诸多的不足:1.注释覆盖性不足。目前已有7983个EC号,但SOTA方法CLEAN只覆盖到4669个EC号,覆盖率不足60%。2.注释准确率不足。SOTA方法注释准率仅为64%。为此我们开发全新的酶功能注释方法,将EC覆盖到6192个,将注释准确率提高到86%。
报告人
史振坤
中国科学院天津工业生物技术研究所

史振坤,男,中国科学院天津工业生物与技术研究所博士后。2020年获吉林大学博士学位。主要从事机器学习算法构建以及人工智能与基础学科融合交叉方面的研究。先后在Information Sciences、NAR、Neurocomputing、WWW、ADMA、DASFAA等TOP SCI期刊或国际高水平会议上18篇,其中第一作者或通讯作者论文12篇引用150余次。目前主持国家自然基金委青年基金1项,天津市创新能力提升项目1项。