[特邀报告]三代高阶三维基因组前沿技术开发

三代高阶三维基因组前沿技术开发
特邀报告

报告开始:5月13日 14:00:00 (Asia/Shanghai)

报告时间:20min

所在会议:[S2] 分会场二 [S2-1] 基因组学、表观基因组学和微生物组学

摘要
三代测序Oxford Nanopore技术近10年发展迅速,被广泛应用于生命科学研究领域。近几年研究者应用Nanopore长读长的优势,开发了能够检测染色质高维互作信息的技术(Pore-C),能够克服传统Hi-C只能研究两互作的局限性,然而Pore-C技术由于堵孔其测序通量显著下降。针对Pore-C技术测序低通量的问题,我们建立了高通量高阶的三维基因组技术(HiPore-C),显著减低了测序成本;与此同时,针对高维三维基因组测序错误率高且短片段比对缺失问题,我们开发了高效高阶三维基因组数据序列比对方法(Falign),显著提高了数据的利用率;最后,针对HiPore-C二倍体三维基因组计算方法缺失问题,我们构建了精准识别HiPore-C数据SNP的神经网络模型和高阶互作渐进式回收模型,从而组建了二倍体高阶三维基因组重构方法(dip3d),与Hi-C相比,dip3d的二倍体三维基因组数据利用率、分辨率和完整度提高了一个数量级以上,从而加速了二倍体三维基因组广泛应用。
报告人
肖传乐
教授 中山大学眼科中心

生物信息学博士,广东省杰出青年基金获得者,中山大学中山眼科中心副研究员。长期致力于三代测序前沿计算技术开发及应用研究。主要研究方向及成果有:(1)三代测序数据基因组计算方法开发:针对三代测序序列比对耗时问题,提出了长序列种子投票打分模型,并开发了快速组装系统MECAT大幅提高计算速度(Nature Methods,2017);针对Nanopore测序错误分布广及局部不均问题,提出了精度优先序列校正模型,大幅提高Nanopore序列校正速度和精度(Nature Communications,2021);(2)三代测序表观遗传学方法开发及应用:针对三代测序PacBio的计算消耗大及背景噪声大问题,提出了PacBio甲基化并行计算模型,首次系统揭示了人类DNA-6mA甲基化图谱(Molecular Cell,2018);并且分别建立了识别动物甲基化(CpG)和植物甲基化(CHH和CHG)电信号修饰的深度学习模型,实现了动物和植物5mC精准检测(Nature Communications,2019和2021);(3)三代高阶三维基因组方法开发及应用:针对Pore-C测序通量低问题,提出了混合多次酶解方法(HiPore-C),大幅提升了通量,并揭示了单分子三维拓扑结构特征(Nature Communications,2023);针对Pore-C数据比对率低问题,提出了渐进式比对方法,大幅提高Pore-C数据利用率(Nature Computational Science,2023)。目前以第一或通讯作者在Nature Methods、Molecular Cell、Nature Computational Science,Nature Communications(4篇)等期刊发表高水平SCI论文二十余篇,先后开发NECAT、Falign和MECAT等十余个生物信息学分析工具,多次担任Nature Methods和Nature Communications等专业期刊审稿