浙大发布高精准基因组设计AI模型

发布时间:2025-07-14 10:29:49
来源: 经济参考报
阅读量: 584

     浙江大学郭国骥教授团队开发出一款用于基因组预测设计的深度学习AI模型“女娲CE”,能够以超过90%的准确率预测基因组调控区域发生突变之后带来的表型变化,并结合疾病表型设计出相应的治疗位点。据悉,相关成果已发表于国际学术期刊《细胞》。

  据介绍,基因组由DNA组成,不仅包含蛋白质的编码序列,还包含大量不编码蛋白质的调控序列。这两类序列的协同作用,共同决定了生物体的复杂表型特征。

  “读懂生物体的古老遗传‘语言’,是科学家们一直致力于攀登的科学高峰。”郭国骥说,人类基因组计划集全球科学家之力绘制出人类基因图谱,但多年来,科学家对其中的遗传信息的破译还不足10%。近年涌现的AI模型可帮助科学家们进一步快速、系统地理解隐藏在海量基因序列背后的复杂调控语言。

  郭国骥团队自主开发了超高通量、超灵敏度的单核染色质可及性测序技术,在这一技术基础上构建了覆盖小鼠、鸡、守宫、蝾螈和斑马鱼五种代表性脊椎动物的全组织调控元件图谱,形成优质“数据库”,并开发出多任务深度学习AI模型“女娲CE”,实现从基因组到细胞图谱的直接预测。

  “基于大量优质的数据,‘女娲CE’模型在多项指标上超越现有的基因组AI模型。”郭国骥介绍,“女娲CE”能够预测基因组调控元件发生突变之后对各种细胞类型带来的表型变化,经检测准确率超过90%。

  “基于‘女娲CE’预测出的一个镰刀型贫血症治疗性基因位点,我们对该位点进行修改,使得胎儿血红蛋白表达量得到提升。”郭国骥表示,“女娲CE”系列模型将帮助研究人员更好地理解遗传病发生的复杂原因,为生命科学、医学和农学研究提供强大的支撑。


(责任编辑:于昊阳)

商业观察网-《商业观察》杂志社官网版权与免责声明:

① 凡本网注明“来源:商业观察网或《商业观察》杂志”的所有作品,版权均属于商业观察网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:商业观察网”。违反上述声明者,本网将追究其相关法律责任。

② 凡本网注明“来源:XXX(非商业观察网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

③ 如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。