CRISPR-Cas9最为人所知的是一种编辑DNA的实验室工具,但它其实还是免疫系统的一部分,能够帮助某些微生物对抗病毒。
美国麻省理工学院生物化学家张锋团队联合美国国家生物技术信息中心研究人员开发出一种新算法,在数十亿个蛋白质序列中发现了新的罕见CRISPR系统,后者最终有望被改编成基因组编辑工具。相关成果11月23日发表于《科学》。
“八大胜对CRISPR系统的多样性感到惊讶。”张锋说,“做这种分析可以让八大胜一石二鸟——既研究生物学,也可能找到有用的东西。”
单细胞细菌和古细菌使用CRISPR系统保护自己免受噬菌体的侵害。CRISPR系统通常由两部分组成:识别并结合噬菌体DNA或RNA的“引导RNA”分子,以及在引导RNA指示的位点切割或干扰遗传物质的酶。
迄今为止,研究人员已经确定了6种CRISPR系统,分别为I到VI。它们有不同的特性,包括使用酶的类型,以及识别、结合和切割RNA或DNA的方式。用于基因工程的CRISPR-Cas9系统通常被归类为II型,而其他类型的CRISPR特征可能在其他方面有用。
为了在自然界找到不同的CRISPR系统,张锋和同事开发了一种名为FLSHclust的算法,可分析公共数据库中的基因序列。这些数据库包含来自细菌和古细菌的数十万个基因组、数亿个未与特定物种相关联的序列,以及数十亿个编码蛋白质的基因。FLSHclust通过寻找基因序列之间的相似性,并将它们分组到约5亿个簇中,最终发现了CRISPR的相关基因。
通过观察这些簇的预测功能,研究人员发现大约13万个基因通过某种方式与CRISPR相关,其中188个是以前从未见过的。他们在实验室测试了几个基因以了解它们的作用。实验结果揭示了CRISPR系统用来攻击噬菌体的各种策略,包括解开DNA双螺旋结构,从而使基因以插入或删除的方式切割DNA。他们还发现了“抗CRISPR”的DNA片段,这可能有助于噬菌体避开细菌。
在这些新基因中,有一种完全未知的靶向RNA的CRISPR系统代码,研究团队将其命名为VII型。论文通讯作者之一、美国国家生物技术信息中心生物学家 Eugene Koonin表示,找到新的CRISPR系统越来越难,VII型和任何其他尚未被识别的CRISPR类型在自然界中是极其罕见的。“可能需要付出巨大的努力才能找到下一种类型。”
法国巴黎萨克雷大学微生物学家Christine Pourcel说,很难确定某些类型的CRISPR系统是否罕见,因为它们对微生物要么没有用处,要么专门适应于生活在特定环境中的生物体。她补充说,由于研究中使用的基因数据库包括与特定生物体没有联系的基因组片段,因此很难研究一些新系统的作用。
新西兰奥塔哥大学生物化学家Chris Brown表示,该算法本身就是一个重大进步,因为它使研究人员能够在不同物种间寻找其他类型的蛋白质。
“这是生物化学家的宝库。”德国马尔堡大学微生物学家Lennart Randau对此表示赞同。他说,下一步是找出酶和系统工作的机制,以及研究如何将它们用于生物工程。“一些CRISPR蛋白会随机切割DNA,对生物工程毫无用处。但它们在检测DNA或RNA序列方面非常精确,会成为很好的诊断或研究工具。”
研究人员认为,现在就说VII型CRISPR系统或FLSHclust发现的任何其他基因是否对基因工程有帮助为时尚早,但它们可能有一些有用的特性。例如,VII型病毒只涉及很少的基因,这些基因可以很容易地装入病毒载体并传递到细胞中。相比之下,该团队发现的其他一些系统包含非常长的引导RNA,这可能使它们能够以前所未有的准确性靶向特定的基因序列。