原核生物是单细胞微生物,它们是自然界分布最广、个体数量最多的有机体,细菌就是一个例子:海洋、土壤、极端环境(如温泉),以及包括人类在内的所有生命体中都被它们占据。简而言之,细菌无处不在。
长期以来,全球微生物学家一直在努力将原核生物进行分类,并与同行交流相关的最新进展。然而,它们中的大多数都没有名字。已被正式命名的原核生物不到其已知总数的0.2%,因为《国际原核生物命名法》(ICNP)中描述的现行规则要求新物种能在实验室通过纯培养获得。这意味着,要命名它,首先要有个实物样本来证明。
近日,发表在《Nature Microbiology》上的一项新研究中,来自佐治亚大学和比勒陀利亚大学领导的国际研究团队建立了一个名为SeqCode的新系统,可以帮助微生物学领域研究人员对大量已识别但尚未培养的原核生物进行分类和命名。建立该系统的目的是联合微生物学领域和实验室研究,通过提供正式命名大多数已识别但商未命名的原核生物途径来反映环境基因组学的重大进展。
2021,来自40多个国家近850名多学科科学家开始开发新的SeqCode,使用培养和未培养原核生物的基因组序列数据作为命名基础。
目前,原核生物系统学有序扩展到整个原核生物树的关键部分已经就位。这将为科学研究和更广泛的领域服务,为所有原核生物提供一种基于通用语言的基因组数据集。
要获得纳入SeqCode的资格,基因组必须符合严格的科学标准,以确保质量、稳定性和开放数据共享。虽然SeqCode还没有被普遍接受,但它从根本上符合命名其他生物体(包括动植物)的既定国际原则。
任何具有来自纯培养物或非纯培养物的高质量基因组序列的生物体都可以根据SeqCode命名。该系统还会自动接受在ICNP下形成的所有名称。随着时间推移,SeqCode被使用的频率可能会比ICNP更加频繁。
作者认为,SeqCode的主要目标之一是扭转微生物学领域科学文献中使用“不规范”名称的趋势。因为这可能会导致错误,从而增加以后重命名的可能性,使科学家难以审查和比较数据并进行有效交流。相反,SeqCode包含可查找性、可访问性、互操作性和可重用性原则。
以衣原体为例。由于这些微生物不能作为纯培养物生长、储存或分布,目前还无法正式命名。因此,对于临床医生来说,新发现的衣原体没有有效名称可能会很令人困惑,并存在编目不当的风险,这可能会阻碍跟踪疾病暴发,以及科学家、医生和患者之间的交流。
该团队强调,SeqCode并不是为了阻止培养。混合或纯培养物的培养可以在受控条件下测试从基因组预测的特性。此外,强烈鼓励研究人员将菌株保存到培养物保藏中心,以提高菌株的可用性,评估表型性状的可重复性,为生物化学和生物技术提供资源并促进国际合作。
他们在论文最后写道:“我们认为‘SeqCode v.1.0’是迈向统一命名系统的必要第一步,以传达原核生物的全面多样性,我们将与科学界合作实现这一愿景。”