# Amylostereum areolatum 基因组测序与分析:揭示菌虫共生的生物学基础

最近做的地衣共生没有什么头绪,找到的文献都是宏基因组相关,无奈,只好找了菌虫共生菌的基因组分析作为借鉴,看看能不能从中发掘出有用的方法。

这篇文献 2020 年 5 月发表在 ASM 上,主要对 Sirex noctilio 的真菌共生体 Amylostereum areolatum 进行基因组测序分析,与我进行的工作类似。

image-20200729093906243

# 摘要

Amylostereum areolatum 是一种全球入侵物种 - 欧亚树蜂 (Sirex noctilio) 的共生真菌,这种互惠共生关系与木蜂有关,可协助其昆虫伙伴的破坏过程,并为其提供营养。A. areolatum 的定植和生长对 S.noctilio 的发育和传播有重要影响,但两者之间相互作用的机制尚不清楚。在这项研究中,对这种共生真菌的第一个基因组进行了测序、组装和注释。首次组装了 A.areolatum 基因组为 57.5 Mb (54.51% GC 含量),有 15611 个蛋白编码基因。鉴定了 580 个碳水化合物活性酶 (CAZymes), 661 个基因与病原 - 宿主相互作用,以及 318 个基因编码转运蛋白。基因组注释揭示了 10 种萜类 / 植物烯合成酶,可分为三个亚类。第二类萜烯合成酶基因簇在整个红菇 (Russulales) 中保存良好。在这个簇中,编码甲羟戊酸激酶(MK)、EGR12(COG1557)和非植物萜环化酶(CD00687)的基因是已知的生物合成和调控基因。通过对该真菌基因组序列的分析,从分子水平上证明了 A.areolatum 挥发物对 S.noctilio 寄主选择的影响。进一步阐明了 A. areolatum 是一种严格的专性共生真菌。蜂在通过产卵将其引入合适的寄主基质前对其进行保护,同时为 S.noctilio 幼虫的生长提供适宜的环境和营养。

Sirex noctilio 与一种共生真菌 A.areolatum 一起,对世界各地的松树物种造成了严重的危害。在我国,它导致蒙古松大面积死亡。木蜂与其真菌之间存在一定的依赖互惠关系。研究表明,真菌的生长速度会影响黄蜂的体型:较大的成虫会出现在真菌生长速度较高的地方。通过对该真菌的基因组序列分析,证明了 A.areolatum 挥发物在分子上影响 S. noctilio 寄主选择的可能性。进一步阐明了 A. areolatum 是一种严格的专性共生真菌,为 S. noctilio 幼虫的生长提供了适宜的环境和营养物质。这些结果将为我们理解这种菌虫共生的机理奠定基础。

# 引言

木蜂与真菌共生体间存在着严格的专性依赖互惠共生关系。S. noctilio 有一个专门的器官来储存共生真菌,贮菌器(mycangium)。首先,在真菌被引入合适的宿主基质之前,贮菌器可以保护真菌。 在产卵期间,雌性木蜂通过产卵器将其共生真菌和植物毒毒液黏液与卵接种到寄主树中。当成虫出现时,真菌从蛹腔壁被吸进囊膜。通过这种方式,雌性收集虫室中产生的虫卵,传播并接种到新树中。反过来,这种真菌也对 S. noctilio 的发育乃至繁殖潜力至关重要。A.areolatum 感染并干燥木材基质,为虫卵和幼虫提供更适合的微环境。此外,共生真菌的纤维素,半纤维素和果胶的降解酶含量较多也可能是对 S. noctilio 幼虫至关重要的一环。S. noctilio 的发育及其繁殖潜力与共生真菌的活力密切相关。研究表明,S. noctilio 幼虫在三龄或四龄时都以 A.areolatum 提供的降解物为食,然后以白色腐烂的木材为食。真菌的生长速度影响了 S. noctilio 的体型大小;较大的成虫出现在真菌生长率较高的地方。碳水化合物活性酶 (CAZymes) 和毒力相关基因在真菌定植和生长中起着重要作用。白腐真菌能有效地降解木质纤维素生物质,特别是从植物中提取的木质纤维素。许多已被研究的毒力相关基因被发现与操纵植物防御促进真菌感染有关。这些基因在防御机制、信号转导、碳水化合物运输和代谢、细胞内运输、分泌和囊泡运输等方面发挥重要作用。

​ 挥发性成分在吸引雌胡蜂到植物寄主的过程中起着重要的作用。先前的研究表明 S. noctilio A.areolatum 的挥发性成分的反应比对受袭树木的反应更强。这些真菌挥发物也能吸引 S. noctilio 到受 A.areolatum 感染的寄主那里。对 A.areolatum 及其他蒙古松内生真菌的挥发性有机化合物 (VOCs) 进行了分析,发现倍半萜类化合物对已交配的 S. noctilio 有吸引力,但对未交配的 S. noctilio 无吸引力。虽然萜类化合物可能在木蜂的空间聚集中发挥重要作用,但迄今为止在 A. areolatum 中尚未发现萜类生物合成酶,而且基因组测序方法是通过识别参与次生代谢物活性的基因来发现萜类化合物生物合成途径的常用方法。

​ 在本研究中,作者完成了 A.areolatum 的基因组测序,分析了碳水化合物酶、毒力基因和次生代谢基因。这些发现将有助于解释这样一个假设,即在的 S. noctilio 生命周期中,有一种酶起着至关重要的作用,例如通过降解植物细胞壁为夜蛾幼虫的定殖和生长提供营养,以及通过产生倍半萜类化合物来吸引雌虫产卵。本研究结果为更好地了解 S. noctilio A. areolatum 之间的互利共生机制奠定了基础。

Sirex系统的最新见解。(a):对与S. noctilio交配和寄主位置有关的视觉和嗅觉线索的研究证实了新出现的个体具有强烈的趋光反应,并确定了推测的信息素,这两者都有助于树冠上方观察到的交配群。这一认识,再加上植物挥发物(kairomone)诱饵的优化,将使研究人员能够开发出更有效的监测工具。(b) S. noctilio种群中抗性的可能进化或真菌种群毒性降低的进化会导致S. noctilio和菌株之间的不相容性,因此并非所有的卵都被真菌寄生。(c) 通过松树寄主与其他S. noctilio或真菌有性繁殖来实现水平及因转移。(d)Amylostereum areolatum分解木材中的木质素和纤维素,释放出碳水化合物,这些碳水化合物作为液体从木材中挤压出来,并被发育中的幼虫摄取。细菌有助于纤维素的消化,很可能为幼虫固定氮。(e) 氮对真菌也有限制,但可以通过细菌或线虫寄生获得。这种寄生可能会影响树木中的线虫数量。(f)幼虫在化蛹期离开真菌定殖区。

# 结果

# 基因组特征

image-20200729105902140

二代测序 (illumina) 与三代测序 (PacBio) 相结合,经过质量控制,得到 HiSeq 数据 6839 Mb (118 coverage) 和 PacBio 数据 4314 Mb (74 coverage)。

# 重复原件与转座酶

​ 除了编码蛋白质的基因序列外,真菌基因组的一个重要部分是重复元件。在 A. areolatum 基因组中,鉴定了 14,513,406 bp (基因组序列的 25.21%) 的重复元件。串联重复序列占 1.1%,转座因子 (transposable elements, TEs) 占 24.11%。在 TEs 中,I 类元素和 II 类元素 (DNA) TEs 分别占基因组的 15.50% 和 1.36%。未知和其他重复元素占 8.17%。长末端重复序列 (LTRs) 是 I 类 TEs 中最丰富的 (占总基因组序列的 14.79%),包括 Copia、Gypsy 和 BEL/Pao 逆转录转座子超家族。

image-20200729141658581

# 种系发生 (Phylogeny)

利用 Orthofinder 鉴定出 56374 个基因簇,其中 913 个为所有真菌共有的基因。从这些共享的基因簇中,选择 41 个单拷贝基因,分析 A.areolatum 与其他 82 个伞菌纲的参考基因组的进化关系。最大似然(ML)分析在高支持率(70%)的情况下,确定了 15 种主要真菌分支的进化关系。 系统发育分析表明,该菌与其它红菇属植物群聚在一起,与植物病原真菌松果体菌(Peniophora sp.CONT)关系密切。

image-20200729141538596

# 碳水化合物酶

A. areolatum 基因组中,鉴定出 580 种 CAZymes,包括 219 种糖苷水解酶(GHs)、67 种糖基转移酶(GTs)、16 种多糖裂解酶(PL)、60 种碳水化合物酯酶(CE)、58 种碳水化合物结合模块(CBM)和 160 种具有辅助活性的酶(AAs)。与传统真菌相比,A. areolatum 含有更多的 CAZymes,与森林病原菌(forest pathogens)类似。

image-20200729142159948

A.areolatum 基因组中,编码 GHs 和 AAs 的基因比其他蛋白类型多。45 个 GH 基因家族中 GH3 (15 拷贝)、GH5 (18 拷贝) 和 GH18 (16 拷贝) 的数量尤其丰富。此外,还发现 2 个 GH6 和 8 个 GH7 成员与结晶纤维素的降解有关。AA 家族的分类显示,多数 AAs AA3 家族的成员 (62 拷贝), 包括亚科纤维二糖脱氢酶 (EC 1.1.99.18), 葡萄糖氧化酶 1 (EC 1.1.3.4)、芳基醇氧化酶 (EC 1.1.3.7)、酒精氧化酶 (EC 1.1.3.13) 和吡喃糖氧化酶 (EC 1.1.3.10)。

# 推测的毒性相关基因

​ 总共有 661 个与病原体 - 宿主相互作用 (PHI) 相关的预测 A. areolatum 基因。毒力降低所占比例最高 (45.39%),其次是未受影响的致病性 (23.45%)、失去致病性 (10.14%)、致死 (9.23%)、混合结果 (8.47%)、化学目标 (1.21%)、毒力增加 (高毒力)(1.66%) 和效应器 (植物无毒性决定因素)(0.45%)。此外,我们还注释了 47 个已报道为致病菌毒力因子 (VFs) 的基因 (致病菌毒力因子 [毒力因子数据库 VFDB])。根据这些基因在其他寄主物种的发病机制中所起的作用,这些基因可能是 A. areolatum 假定致病性因子。此外,还鉴定了 A. areolatum 中 83 个家族 318 种转运蛋白。在这些转运蛋白中,37 个基因编码 MFS 蛋白,18 个基因编码 ATP 结合盒蛋白;其他科中编码蛋白的基因较少。

image-20200729144120933

# 倍半萜烯合酶集群

​ AntiSMASH 分析表明 A. areolatum 次生代谢物基因的数量和类型与报道的其它红菇属植物相似,后者携带 19 个次生代谢基因簇,包括编码 8 个萜烯 / 植物烯合成酶的基因簇,2 个非核糖体肽合成酶(NRPS),1 个 I 型聚酮合酶(T1PKS)、一个铁载体合成酶和七个未知基因簇。值得一提的是,鉴定出的萜烯 / 植物烯合酶基因簇数量最多。这些酶可能参与了萜类化合物的生物合成,尽管还需要进一步的研究来确定这一点。

为了阐明萜烯生物合成簇的保守性和多样性结构,从 83 个伞菌纲基因组中获得了两个包含 5 个倍半萜合成酶(STS)基因的同源群。A. areolatum 基因组含有 10 个萜烯合成酶基因,与伞菌纲中这类酶的数量一致。系统发育树是利用三种合成酶(Cop3、Cop4 和 Cop5)的同源序列构建的,这三种合成酶是在 A. areolatum 基因组中鉴定出来的。萜合成酶基因与 Cop-STS 基因分为三大类,表明每个簇中的酶可能通过保守的环化途径产生相关的萜类化合物。

image-20200729145726289

在真菌中,次生代谢产物生物合成基因通常位于相邻的簇中。有趣的是,第二类萜烯合成酶基因簇在整个红菇中保存得很好。A.areolatumS. hirsutum H. irregulare 之间的共线性表明,参与萜类化合物合成的基因具有良好的共线性,这表明红菇可能共享与萜烯代谢相关的保守核心基因。保守的基因簇包括甲羟戊酸激酶(MK)、EGR12(COG1557)、非植物萜烯环化酶(cd00687)、烯醇辅酶 A(enoyl-CoA)水合酶 / 异构酶和 P 激酶,其中一些基因已被证实与甲羟戊酸途径(合成萜类的途径之一)有关。除了参与倍半萜代谢的核心萜烯环化酶外,倍半萜簇中还存在 ABC 转运体 ATP 结合蛋白(CL0023)和 P450(PF00067)。这些酶可能在氧化和羟基化等修饰以及倍半萜的运输中发挥作用。

image-20200729150254666

# 讨论

# 一般基因组特征和系统发育

A. areolatum 基因组组装约为 53mb,相当于红菇相关成员的组装体大小,从 26mb 到 122mb 不等。A. areolatum 基因组包含 15611 个编码基因。系统进化树表明,在进化上,A. areolatum 与植物病原真菌 Peniophora sp.CONT 的进化关系较近。

# 与降解植物细胞壁和角质层相关的蛋白家族

毒液和真菌共生体的存在会导致寄主的弱化和树脂压力的下降,为 S.noctilio 的卵孵化和幼虫发育提供了更为适宜的微环境。此外,S.noctilio 的行为和形态适应表明,S.noctilio 幼虫不摄取木质部,而是利用 A.areolatum 对难降解的木质纤维素化合物进行外部消化。A. areolatum 能分泌大量的纤维素酶、半纤维素和木质素酶,能有效降解植物细胞壁成分,提供营养物质(如葡萄糖、甘露糖、半乳糖、醋酸、木糖等)因此,A. areolatum 的成功定殖和生长对其发育起着至关重要的作用。真菌的解聚能力与其分泌一系列酶的能力成正比。在分析中,A. areolatum 的胞浆酶数量与森林病原菌相当,并且显著高于传统腐生蘑菇,这表明 A. areolatum 能够突破植物细胞壁,以类似于其他森林病原菌的方式成功建立感染。它可以通过破坏植物细胞的结构来削弱松树,并为 S.noctilio 幼虫的生长提供营养。

植物细胞壁含有丰富的纤维素。GHs 是降解纤维素、半纤维素和淀粉的常见酶。它们参与碳水化合物分子之间或内部糖苷键的水解。共有 219 个 GHs 被分为 45 个家系。编码 GH3 和 GH5 类酶的基因数量超过了编码其他 GH 酶的基因。这与树木腐烂真菌(白色、棕色和软腐真菌)GHs 的组成特征相似。此外,真菌基因组中发现了丰富的 GH18 基因编码,这些基因催化几丁质的分解。几丁质酶能降解真菌细胞壁,抑制孢子萌发、菌丝生长、芽管伸长等发育活动。因此,推测 GH18 可能对其它内生真菌如麦冬菌和球毛壳菌在蒙古松上的拮抗作用起了一定的作用。在 CAZy 数据库中,90% 的木质纤维素降解真菌含有编码裂解多糖单加氧酶(LPMOs)的基因。这些酶主要参与非碳水化合物结构组分(木质素)的解聚,或作为植物的主要细胞壁成分被发现(34,39)。在本研究中,我们分别检测到 62 个和 25 个 AA3 和 AA1 拷贝。AA3 家族(GMC 氧化还原酶 / 脱氢酶)主要存在于森林病原菌中,如 S. hirsutum(48 个 AA3 基因)和 Heterobasidion annosum(32 个 AA3 基因)。AA3 家族包含氧化还原酶的甘糖醇 - 胆碱(GMC)家族中的酶,该家族通过其反应产物协助其他 AA 家族酶的活性或支持糖苷水解酶在木质纤维素降解中的作用。它们通过产生过氧化氢和回收聚合物氧化攻击所需的电子给体和受体,促进木质纤维素的分解。

​ Laccase 另一种重要的木质素降解酶,属于 AA1 家族。在真菌中 Laccase 有不同的角色,如介导真菌病原体和宿主植物之间的相互作用,大量的 AA3 和 AA1 基因导致松树的氧化降解,使 A. areolatum 具有强烈穿透植物细胞壁和降解木质素的能力。这不仅有利于真菌的定植和生长,也为 S.noctilio 幼虫提供了营养。

# 毒力相关基因

病原体 - 宿主相互作用数据库(PHI-base)收录了来自真菌、细菌和原生病原体的 2800 多个基因,并通过实验验证了致病性、毒性和效应基因。这些基因表达的失活或减少可以降低或消除致病能力。在对 PHI-base 数据库检索得到的所有预测基因中,与毒性降低、未受影响的致病性和致病性丧失相关的基因是最常见的。生理学实验表明,单独接种 A. areolatum 并不会显著降低树势,也不会影响树木的生长。本研究所描述的 A.areolatum 毒力相关基因的特征有助于解释这一现象。致死基因的缺失或低表达会导致真菌无法存活。基因组中只有 9.23% 的致死基因。这可能是因为 A.areolatum 是一种典型的共生真菌;在将其引入合适的宿主基质之前,S.noctilio 会保护真菌。

在真菌转运蛋白中,ATP 结合盒(ABC)转运蛋白和主要促进因子超家族(MFS)是最大的两个超家族。ABC 转运蛋白是多组分的,主要是活性转运蛋白,在 ATP 水解条件下,它既能运输小分子,也能运输大分子。它们能运输多种化合物,如多糖、药物、糖、重金属、寡肽、氨基酸和无机离子。研究表明,在所有测序真菌中,S.pombe 只含有 19 个 ABC 蛋白,这可能接近自由生命有机体的最小值。A. areolatum 中 ABC 蛋白的含量比 S.pombe 少,而且更显著的是,它缺乏 ABC-D 转运体,而 ABC-D 转运体在所有测序物种中都有发现,除了 Encephalitozoon cuniculi S.pombe。从真菌中提取的 ABC 蛋白只有少数已被功能性鉴定,而 ABC-D 转运蛋白的缺乏还需要进一步的研究。

A. areolatum 含有大量的糖类酶基因,但毒力和转运基因较少。这与它们的共生关系是一致的;A. areolatum 通过分泌胞外酶为 S.noctilio 幼虫的生长提供营养,而 S.noctilio 通过将真菌带到一个特殊的器官 —— 贮菌器中,保护和转移真菌,然后将其引入一个新的合适的寄主基质。

# 倍半萜烯合酶集群

​ 研究表明,与寄主植物相比,交配后的雌性 S.noctilio A. areolatum 挥发性成分更具吸引力;倍半萜类化合物可能在这一过程中发挥作用。对红菇属真菌的序列分析表明,倍半萜合成酶同源基因在这些真菌中广泛存在。然而,尽管倍半萜合成酶同系物在真菌中占优势,但对其活性和生物学功能知之甚少。在大肠杆菌表达载体上克隆和鉴定了灰曲霉的倍半萜合成酶,结果表明在 Cop3 培养基中产生了 muurolene、elemene、muurolene、germacrene D 和 cadinene。在 Cop4 培养物中检测到了 Cadinene、cubebene、sativene、copaene 和 cubebol。因此推测,同样的化合物也出现在 A. areolatum 的挥发性成分中。

# 材料和方法

# 基因组组装

利用 Illumina 序列进行 k-mer 分析,并对 PacBio 组装进行校正。为了得到高质量的装配,使用 GATK 对序列错误进行了修正。然后,使用 SSPACE_Basic 工具将 contigs 合并成 scaffolds,使用 PBJELLY 封闭间隙。最后,基于成对序列相似度搜索,应用冗余管道来识别和去除杂合的 contigs 和 scaffolds。利用 BUSCO 和来自真菌谱系的数据集对候选 assembly 进行了评估。

# 基因预测与注释

​ 结合从头预测和基于转录体的预测方法对编码蛋白的基因进行预测。初步预测采用 SNAP、Augustus 和 GeneMark ES 进行编码基因预测。然后,使用 Tophat 将转录组测序 (RNA-Seq) 数据 (未发表) 映射到 assembly 上,使用 Cufflinks 将转录组组装到基因模型上。最后,利用循证 emodeler (EVM) 将上述方法预测的所有基因模型组合成一个非冗余的基因结构集合。使用 tRNAscan-SE 检测 tRNA 区域和二级结构。使用 RNAmmer 软件分析小 rna,使用 Infernal 对 Rfam 数据库进行搜索,预测小 rna (sRNAs)。预测的基因模型通过 BLASTp 搜索、Swiss-Prot、TrEMBL、Orthologous、GO 和 KEGG 进行功能注释。

# 转座因子和串联重复序列的鉴定

本研究采用序列比对预测法和从头预测法来评估 A. areolatum 基因组中的 TEs。对于序列比对预测方法,使用 RepeatMasker,使用数据库 Repbase 搜索 TEs。优化的默认参数与 - lib 选项一起使用以查找重复项,-species 真菌选项用于单独的分析以查找真菌重复。RepeatProteinMasker 和与 RepeatMasker 相关的转座子蛋白文库也被用来鉴定 TEs。从头预测方法,利用 buildXDFDatabase 生成扩展数据库格式(XDF)。然后,使用 RepeatModeler 和 XDF 数据库建立 TE 模型,然后使用 RepeatMasker 对 TE 进行预测。串联重复序列用 RepeatMasker 进行评估。

# 系统发育分析

​ 从 NCBI 数据库以 FASTA 格式下载 79 种蘑菇菌种的基因组序列。利用正交法获得了真菌基因组中的一组同源基因 (系统进化保守)。我们选择 41 个单拷贝同源基因构建系统发育树。使用 MAFFT 进行序列比对,使用 Gblocks 提取并连接保守位点。我们运行 ProtTest 以选择最合适的模型,并使用 RAxML 构建 ML 基因树,其中 - f a -x 12345 -p 12345 -m PROTGAMMAILGF -N 1000 选项。使用 Wallemia sebi 蛋白序列作为外组

# 碳水化合物酶分析

​ 利用 BLAST 对 A. areolatum 和其他 10 种真菌中的 CAZymes 进行鉴定和注释,并使用 dbCAN 注释程序 HMMER 对 CAZy 数据库进行搜索。当 E 值小于 1e05 时,将结果进行汇总。II 类过氧化物酶和 DyPs 通过 BLAST 在过氧基数据库中的搜索得到了进一步证实。

# 毒力相关基因预测

候选毒力相关基因在 A. areolatum 基因组中使用 BLASTp 来搜索 PHI-base。对蛋白进行比对,以确定在 A. areolatum 中可能存在的毒力相关基因,其识别率超过 40%,查询覆盖率超过 70%。毒力因子 (VFs) 检索使用 BLAST 比对毒力因子数据库。运输分类数据库 (TCDB) 包含序列,分类,和结构,功能,和进化信息的运输系统从各种分类。基于转运体分类数据库的搜索,以 E 值阈值 1e-05 和识别值为 40% 确定了 A. areolatum 中的候选转运体。利用 MAFFT 对蘑菇真菌 ABC 转运蛋白进行序列比对,利用 FastTree 构建系统发育树

# 次生代谢基因预测

利用 AntiSMASH 对 A.areolatumS.hirsutumPeniophora sp. CONT 和 H. irregulare 的次级代谢生物合成基因和基因簇进行了预测。在两个同源类群中获得 83 个伞菌纲基因组的假定真菌萜烯合酶序列。还包括五个在 C.cinereus 中发现的倍半萜合酶同源物 (分别命名为 Cop1 和 Cop5)。在构建系统发育树时,要手动检查比对以排除注释错误的序列 (例如,序列似乎太短或太长)。在 MAFFT 中对 902 个萜烯合成酶基因进行序列比对,利用 FastTree 构建系统发育树。

更新于 阅读次数

请我喝[茶]~( ̄▽ ̄)~*

amane 微信支付

微信支付

amane 支付宝

支付宝