欢迎访问中国微生物信息网!

Nature: 机器学习帮助构建人类肠道微生物群体感应网络

日期:06-12  点击:  属于:学术论文

导语

群体感应(quorum sensing,QS)是一种连接各种微生物群落成员的细胞 - 细胞间通信机制。传统研究只收集特定微生物的少量群体感应机制,但这远远不能完全描述人类肠道微生物群中基于化学物质通信的复杂微生物互动。近日发表于 Nature Communications 的研究提出了一个系统,包括三个模块和使用基于机器学习的分类器,来收集、扩展和挖掘 QS 相关机制。此外,研究开发了人类肠道微生物群体感应(QSHGM)数据库(http://www.qshgm.lbci.net/),包括 28,567 个去除冗余的条目,以弥补 QS 数据库和人类肠道微生物群落之间的差距。在 QSHGM 的帮助下,可以搜索到各种微生物相互作用的通信机制。研究还进一步构建和分析了 818 种人类肠道微生物的 QS 通信网络(QSCN)。这项工作有助于建立 QSCN,该网络可能成为人类肠道微生物群的关键知识图谱之一,并对未来的研究与应用产生帮助,比如合成新的微生物群、发现肠道疾病的潜在疗法。

研究领域:机器学习,群体感应,微生物群落

胡聪  | 作者

邓一雪  | 编辑

论文题目:

Machine learning aided construction of the quorum sensing communication network for human gut microbiota

论文链接:

https://www.nature.com/articles/s41467-022-30741-6

1. 群体感应:微生物群的通信机制

人类肠道微生物群是复杂的微生物系统,并且与免疫系统调节和人类健康维护息息相关。越来越多的研究表明,设计肠道微生物群和调节微生物的相互作用具有医疗潜力,可以治疗各种肠道疾病。例如,群体感应系统在细菌耐药性机制的形成中发挥了重要作用,如果能够 " 监听 " 细菌间的交流,从而拦截它们之间的信号分子,就能在不施药的前提下达到治疗疾病的效果。

  

近期的研究结果清楚表明,细菌细胞间可通过互相通信联系以协调基因的表达,从而以群体的形式对不断变化的环境条件作出反应。这种细胞与细胞间的通信机制,被称为群体感应(quorum sensing, QS)。群体感应是细菌利用信号分子根据环境进行细胞内或胞外信息交流,协调群体行为并根据自身或周围环境感知来调控特定基因表达,如抗生素合成、生物发光以及形成生物膜的一种应激机制。信号分子通过某种构型与受体结合,从而传递细胞信息。

图 1:大肠杆菌

目前有很多与肠道微生物群或各种 QS 系统相关的数据库,但迄今为止它们在很大程度上是单独收集的,这可能会限制对人类肠道微生物群中复杂微生物相互作用的理解。并且新的 QS 机制也有待挖掘,从而破译微生物之间复杂的调控关系。这篇文章中,研究者通过多种机器学习算法的组合实现了 QS 机制收集、扩展和挖掘模块,以构建人类肠道微生物群的 QS 存储库。

2. 人体肠道微生物通信网络的构建

该研究利用机器学习算法提出了 "QS 通信网络 "(QSCN),算法包括随机森林 ( RF ) 、k 近邻 ( KNN ) 、支持向量机 ( SVM ) 和深度神经网络 ( DNN ) ,使用这些算法设计了四个分类器在数据挖掘中使用,从而在现有 QS 数据库中发现更多可能的人类肠道 QS 机制。这些可能的机制还会进行蛋白质功能分析来验证机制的正确性。该网络提供用户友好的浏览和搜索功能,通过可视化的方式破译人类肠道微生物群的复杂的基于 QS 的相互作用。

文章中关注了 9 种微生物通信方式,可称之为微生物的 9 种 " 语言 ",分别是 AHLs、DSFs、HAQs、CAI-1、AIPs、二烷基间苯二酚、Photopyrones、吲哚和 AI-2 ,并统计了 818 种肠道微生物的 QS 机制,利用这 9 种 " 语言 " 来构建人类肠道微生物群之间的通信网络。

  

图 2:(a)基于九种语言的 818 种人类肠道微生物的 QSCN。(b)六种典型 QS 语言的微生物分布(c)在 210 个人类肠道微生物中发现的 9 种 QS 语言的层次聚类。存在该语言用蓝色表示,不存在用灰色表示。

多种微生物有共同语言,其中 AI-2 应用最为广泛。不同语言意味着微生物语言的多样性,有助于自然系统的稳定。不同的语言可能只存在于特定的种群内,比如 AHLs 仅存在于变形菌门中、AIPs 主要存在于厚壁菌门中。

3.   利用通信网络预测微生物间的相互作用

通过 QSCN 可以预测基于 QS 语言的微生物间的相互作用,比如大肠杆菌和肠杆菌之间基于吲哚的相互作用。此外,QSCN 还可以用于预测更复杂的网络,比如大肠杆菌、嗜果胶双歧杆菌、大肠杆菌、绿脓杆菌四种菌株联合体中存在基于 AI-2、AHLs 和吲哚的复杂微生物通信,甚至可以预测将洋葱伯克霍尔德菌加入到上述菌落时的五菌株联合体间的复杂通信。

图 3:(a)基于 AI-2 的双菌株通信(b)基于 AI-2 和吲哚的三菌株通信(c)基于 AI-2、indole 和 AHLs 的四菌株通信(d)基于多种 QS 语言的五菌株通信。

QSCN 不仅可以让我们更好地理解基于 QS 的微生物通信原理,而且在为合成微生物群提供新的操作和开发潜在疗法方面也将大有帮助,比如减轻抗菌素耐药性,抑制病原菌,并开发新的基于 QS 的合成基因电路。

论文 Abstract

Quorum sensing ( QS ) is a cell-cell communication mechanism that connects members in various microbial systems. Conventionally, a small number of QS entries are collected for specific microbes, which is far from being able to fully depict communication-based complex microbial interactions in human gut microbiota. In this study, we propose a systematic workflow including three modules and the use of machine learning-based classifiers to collect, expand, and mine the QS-related entries. Furthermore, we develop the Quorum Sensing of Human Gut Microbes ( QSHGM ) database ( http://www.qshgm.lbci.net/ ) including 28,567 redundancy removal entries, to bridge the gap between QS repositories and human gut microbiota. With the help of QSHGM, various communication-based microbial interactions can be searched and a QS communication network ( QSCN ) is further constructed and analysed for 818 human gut microbes. This work contributes to the establishment of the QSCN which may form one of the key knowledge maps of the human gut microbiota, supporting future applications such as new manipulations to synthetic microbiota and potential therapies to gut diseases.