6月26日讯 谷歌 DeepMind 官方博客昨日(6 月 25 日)发布博文,宣布推出 AlphaGenome 模型,能够在多种基因调控过程中,更全面、准确地预测人类 DNA 序列中的单个变异或突变影响,并计划通过 API 预览版向科研界提供。
注:AlphaGenome 是一种新的人工智能工具,它能够处理长达 100 万字母的 DNA 序列,预测数千个分子属性,以表征其调控活动。该模型通过比较突变序列与未突变序列的预测结果,对遗传变异或突变的效果进行评分。
AlphaGenome 的训练数据来自 ENCODE、GTEx、4D Nucleome 和 FANTOM5 等大型公共联盟,这些数据覆盖了数百种人类和小鼠细胞类型和组织的基因调控重要模式。
该模型使用了卷积层来检测基因组序列中的短模式,变压器来传递序列中所有位置的信息,以及一系列最终层将检测到的模式转化为对不同模式的预测。
AlphaGenome 具有几个显著特点:能够处理高达 100 万字母的长序列并做出单个字母分辨率的预测;能够进行全面的多种模式预测;能够高效地对变异进行评分;以及首次对剪接接点进行建模。
AlphaGenome 的预测能力有望帮助疾病理解、合成生物学和基础研究等多个领域。尽管该模型取得了显著进步,但仍有一些挑战,如准确捕捉距离较远的调控元素的影响等。