|
|
|
科研快讯 | nature子刊:多界水平微生物分析可识别不同队列中结直肠癌的细菌-k8凯发导读 2022年1月27日,中山大学附属第六医院,复旦大学人类表型组研究院,中国科学院上海营养与健康研究所,同济大学生命科学与技术学院和上海交通大学医学院公共卫生学院多单位联合在nature microbiology上发表题为《multi-kingdom microbiota analyses identify bacterial–fungal interactions and biomarkers of colorectal cancer across cohorts》的文章。尽管最近的研究对肠道微生物群和结直肠癌(crc)之间的关系方面的理解取得了进展,但在不同队列的结直肠癌中,跨界水平的肠道微生物失调还有待研究。在本研究中,我们采用来自8个不同地理区域的1,368份crc宏基因组学样本数据集,探究4个微生物界水平的改变。综合分析确定了20种古生菌、27种细菌、20种真菌和21种病毒为每个界水平诊断模型。然而,我们的数据显示,用多界水平的标志物构建的模型具有更高的诊断准确性,特别是添加真菌物种。具体来说,包括11个细菌、4个真菌和1个古菌特征的16个多界水平的roc曲线标志物,在诊断crc方面取得了较好的效果(受试者roc曲线曲线下面积auroc = 0.83),并且在3个独立的队列中保持了准确性。生态网络的co-abundance分析揭示了细菌和真菌之间的联系,例如talaromyces islandicus和clostridium saccharobutylicum。使用鸟枪宏基因组测序数据,探索了微生物功能潜力的预测能力,并在crc患者中观察到d-氨基酸代谢和丁酸盐代谢升高。基于功能性eggnog基因的诊断模型获得了较高的准确度(auroc = 0.86)。总的来说,我们的研究结果揭示了crc相关的微生物类群在不同人群中普遍存在,并证明了多个界水平和功能标志物作为crc诊断工具的适用性,以及作为治疗crc的潜在治疗靶点的可能性。 论文id 原名:multi-kingdom microbiota analyses identify bacterial–fungal interactions and biomarkers of colorectal cancer across cohorts 译名:多界水平微生物分析可识别不同队列中结直肠癌的细菌-真菌相互作用和生物标志物 期刊:nature microbiology if:17.745 发表时间:2022.01.27 通讯作者:朱立新,陈兴栋,张国庆,朱瑞新,王慧 通讯作者单位:中山大学附属第六医院,复旦大学人类表型组研究院,中国科学院上海营养与健康研究所,同济大学生命科学与技术学院,上海交通大学医学院公共卫生学院 doi号:10.1038/s41564-021-01030-7 实验设计 收集来自全世界9个地理区域的粪便鸟枪宏基因组测序数据,共计1,368份样本。包括奥地利(aus,prjeb7774)、法国(fra,prjeb6070)、德国(ger,prjeb27928)、中国(chn_hk,prjeb10878)和日本(jpn,prjdb4176)以及验证数据,包括美国(usa,prjeb12449)、意大利(ita,srp136711)和中国(chn_sh,内部)。根据宏基因组测序数据,进行微生物分类和功能鉴定分析、基于微生物特征标志物的crc诊断模型的构建与评价、多界水平物种co-abundance分析、物种和功能之间相关性分析以及与crc相关基因的qpcr分析。 结果
图1. 本研究纳入的crc患者人群及其相关肠道微生物组的概述。(a)来自全世界8个患者群体的共计1,368个样本的粪便鸟枪宏基因组数据;数据包括奥地利(aus,prjeb7774)、法国(fra,prjeb6070)、德国(ger,prjeb27928)、中国(chn_hk,prjeb10878)和日本(jpn,prjdb4176)。验证数据包括美国(usa,prjeb12449)、意大利(ita,srp136711)和中国chn_sh,内部),括号内的数字代表样本容量;(b)用shannon指数表示crc患者(红色,n= 491)和对照组(蓝色,n = 494)的α多样性;(c)基于bray-curtis距离对5个队列样本进行主坐标分析(pcoa),结果表明,组间(p = 0.001)和组间(p = 0.001)微生物组成存在差异;(d)集合图显示了通过maaslin2在每个队列中识别的不同细菌种类的数量,并通过数据集的组合共享,每一列上的数字表示不同物种的数量,右边的集合大小表示每个队列中的差异物种数量,点连接表示连通队列中的共同差异物种;(e)集合图显示了通过maaslin2在每个队列中识别的不同真菌种类的数量,并通过数据集的组合共享,每一列上的数字表示不同物种的数量,右边的集合大小表示每个队列中的差异物种数量,点连接表示连通队列中的共同差异物种。
图2. 不同人群间的差异物种及每个界水平特征构建模型的预测性能。(a)系统发育树显示了不同真菌物种的集合(共231种),按子囊菌门、担子菌门、壶菌门、隐真菌菌门、微孢子门、毛菌门和捕虫霉亚门进行分类;外圈标记为显著差异种(p < 0.05,双侧检验);meta分析结果通过mmuphin进行识别,橙色表示物种增加,绿色表示物种减少;紫色星标记的物种表示在分类模型的物种;条形图显示了各队列标记特征的丰富度变化;(b)热图显示了每个队列中使用单一界水平特征标志物建立的模型的auroc值,*p = 0.001;(c)箱线图显示了使用单一界水平特征标志物的模型的队列之间auroc值,数据通过iqrs显示,中间值为黑色水平线,须状线延伸至1.5× iqr (n = 4)范围内的最极值点。 图3. 结合多界水平的特征标志物构建的预测模型的性能以及这些基本特征标志物在每个地理队列中的综合重要性。(a)热图显示了在每个队列中用多界水平特征标志物建立的模型的auroc值,a:古菌;b:细菌;f:真菌;v:病毒,*p = 0.001;(b)箱线图显示了使用多界水平特征标志物的模型的队列之间auroc值,数据通过iqrs显示,中间值为黑色水平线,须状线延伸至1.5× iqr (n = 4)范围内的最极值点;(c)通过使用随机森林“gini importance”方法对每个队列数据集的预测性能进行交叉验证,对每个列出的特征标志物(属于四个界水平模型)的重要性进行估计,红色表示物种增加,蓝色表示crc患者与对照组相比物种减少;(d)由16个多界水平特征标志物组成的auroc模型矩阵,用于crc检测,*p = 0.001;(e)由16个多界水平特征标志物组成的auroc模型矩阵,用于早期的crc检测,*p = 0.001。 图4. crc患者与对照组多界水平物种之间的co-abundance相关性。(a)在crc患者和对照样本中,包含来自所有四个界水平的组合差异物种的co-abundance网络,节点的颜色表示细菌(绿色)、真菌(橙色)、古菌(蓝色)和病毒(紫色);绝对相关性高于0.3,紫色线条表示正相互作用,灰色线条表示负相互作用;(b)对照组和crc患者的中度co-abundance网络,绝对相关性高于0.6;边缘根据中等网络中的关联大小进行着色,节点的颜色表示细菌(绿色)、真菌(橙色)、古菌(蓝色)和病毒(紫色),紫色线条表示正相互作用,灰色线条表示负相互作用。 图5. 由ko基因构建的crc相关功能改变模型及其性能研究。(a)箱线图(左)显示了每个队列中对照(蓝色条)和crc患者(红色条)代谢通路的相对丰度,样本数为aus(crc患者= 46,对照 = 63),fra(crc患者= 53,对照 = 61),ger(crc患者= 60,对照 = 65),chn(crc患者= 80,对照 = 86),jpn(crc患者= 258,对照 = 251);热图(中)显示了综合meta分析,确定了在五个地理人群中检查的每个代谢途径中显着改变的ko基因表达,单元格颜色和强度代表ko基因的丰度倍数变化,通过mmuphin鉴定显著差异ko基因(p< 0.05),p值显示在单元格中;(b)比较对照组(n= 494)和crc患者组(n = 491)中bdha/b(k00100)、orae(k17898)和oras(k17899)功能基因的标准化的相对丰富度,以年龄、体重指数和性别为协变量,采用mmuphin方法检测统计学意义;(c和d)通过gdna qpcr检测,crc患者(n= 24) bdha和bdhb在丁酸盐代谢途径(c)和orae和oras在d-精氨酸和d-鸟氨酸代谢途径(d)的表达均高于对照组(n= 24);数据表示为平均值± s.d,三个生物学重复;(e)用175个重要的eggnog基因构建的模型的auroc矩阵,*p= 0.001。 |