昆明植物所研究团队发表被子植物系统发育基因组学与“生命之树”研究综述
达尔文根据共同祖先这一概念,提出可以将所有现存和已灭绝的生物门类和物种联系起来,描绘出“生命之树(Tree of Life)”,这也是他的名著《物种起源》唯一的插图。随着分子系统发育研究的兴起,重建一个反映真实物种亲缘关系的“生命之树”并阐述其起源与演化式样一直是生命科学研究的热点问题,也是生命科学其它分支学科研究的重要基础。
被子植物(即有花植物)是植物界物种多样化程度最高、分布最广、适应性最强的类群,在陆地生态系统占有绝对优势地位。最新的研究数据表明,全球被子植物约有33万种。1998年根据分子系统学研究成果提出的被子植物APG分类系统已更新到第四版(APG IV),成为被子植物一个较为稳定的目级亲缘关系框架。在过去的五年中,高通量测序技术的加速发展为被子植物系统发育研究提供了长足动力,涌现了大量采用数百至数千个基因且取样广泛的系统发育研究,在各个分类尺度上提供了可靠的基因组水平证据,使植物系统演化的研究进入到系统发育基因组学时代。其中,被子植物叶绿体系统发育基因组(Plastid Phylogenomic Angiosperm tree, PPA tree)和植物和菌类生命之树(the Plant and Fungal Trees of Life, PAFTOL)等项目相继以叶绿体基因组和Angiosperms353核基因数据构建了迄今最完整取样的基于基因组数据的被子植物“生命之树”。两项工作均涵盖了现存所有的被子植物科,且有2000以上(约占15%)的属级取样。不过,伴随着基因组数据的大量采用,直系/旁系同源性混淆和基因树冲突成为系统发育研究的普遍难题,系统误差和生物学因素如杂交、多倍化和不完全谱系分选(ILS)等过程令系统发育基因组学分析变得更加复杂。此外,从基于少数基因/位点的系统发育分析到基因组规模的系统发育基因组学研究的转变,也对研究人员生物信息学和计算生物学领域的相关技能提出了新的要求。同时,对相同的数据集采用不同的分析方法,将可能会产生相互矛盾的系统发育结果。如何从大量系统基因组学分析工具中做出合适的选择,也备受关注。
中国科学院昆明植物研究所李德铢研究团队多年来致力于被子植物系统发育和进化基因组学研究,近年来依托国家重大科技基础设施“中国西南野生生物种质资源库”,通过与国内外团队的多方合作,开展了被子植物系统发育基因组和生物地理学研究,取得了一系列研究成果。该研究团队近日在Journal of Integrative Plant Biology期刊在线发表题为Phylogenomics and the flowering plant tree of life的特邀综述,系统介绍了近年来被子植物“生命之树”和系统发育基因组学领域的研究进展。文章首先概述了当前系统发育基因组学中应用的主要测序策略,包括浅层基因组测序、转录组测序、简化基因组测序(RAD-seq)、杂交捕获测序(Hyb-Seq)、高覆盖浅层基因组测序(deep genome skimming)和全基因组测序及其实验和分析方法,并讨论了各自的优缺点和潜在应用前景。文章总结了近五年在被子植物框架、目级、科级和科下等不同分类阶元系统发育基因组学最新进展,强调了相关研究对分类学处理(如属名的变更)的潜在影响。综述进一步讨论了系统发育基因组学研究面临的主要挑战,即系统误差和潜在的生物学因素,如全基因组复制(WGD)、杂交与基因渐渗和ILS对直系同源推断和系统发育重建的影响,提出二歧分支系统树有时可能不是被子植物“生命之树”的最佳进化模型,并为演化历史复杂类群的系统发育基因组学研究提出了操作性强的建议。
该综述讨论了目前被子植物系统发育基因组学研究存在的一些普遍性问题,提出了植物系统发育基因组学未来发展的四个主要方向:(1)随着被子植物“生命之树”越来越多难以解决的系统关系被报道,网状(network)而非树状的进化模式可能会达成广泛共识,基于network的方法的进一步发展将提高我们重建系统发育关系和推断进化过程的能力。综合来自系统发育基因组学、基因复制、表型创新和生物地理的证据,将成为连接我们对被子植物微进化和宏进化理解的桥梁。(2)全基因组测序将是未来学科发展的一个主要趋势,日益增加的基因组数据将不断加深我们对被子植物进化历史的理解,并为将被子植物进化、生态学研究与功能和发育基因组学研究相结合提供全新的机会。(3)系统发育基因组学研究的类群和区域发展不均衡,一些经济上重要的类群,如禾本科、十字花科、豆科和蔷薇科等,已经开展了大量深度和广度兼具的基因组学研究,而与之相比,在33万种被子植物中,有近50%的物种,尤其是局域特有物种至今仍未有任何DNA序列的报道;在地理分布方面,大多数研究都集中在有限的地理和分类范围内,导致了取样上极大的不均衡性,通过全球合作实现大规模采样的分子系统学和系统发育基因组学研究,如豆科(LPWG II, 2017)、唇形科(Mint Evolutionary Genomics Consortium, 2018)、禾本科(Soreng et al., 2022)和苔草属(Global Carex Group, 2021)等,将是迫切需要的。(4)分类学、群体遗传学和地理取样等基础性工作仍需强化。随着植物系统基因发育基因组学研究的激增,越来越多的植物生物学家侧重于分子系统学的训练,很大程度上忽略了广义形态学、分类学、生物地理学和古生物学等基础学科的工作。在系统发育基因组学时代,组学数据分析与形态学、生态学和最终的多学科证据相结合,对于更全面地了解被子植物进化历史将至关重要。
图 被子植物系统发育框架和目、科级代表分类阶元存在的核质冲突和可能的网状进化关系
昆明植物研究所郭岑博士为论文第一作者,李德铢研究员为通讯作者,骆洋博士、高连明、伊廷双、李洪涛研究员和杨俊波正高级工程师参与了该综述工作。该研究得到了中国科学院战略性先导科技专项(No. XDB31000000)和中国科学院重大科技基础设施开放研究项目(No. 2017-LSF-GBOWS-2)的资助。