昆明植物所完成红马银花高质量单倍型基因组的组装和基因功能注释
红马银花(Rhododendron vialii Delavay & Franch)是杜鹃属(Rhododendron L.)、马银花亚属(Subgen. Azaleastrum)、马银花组(Sect. Azaleastrum)的常绿灌木。该物种曾经广布于滇中和滇南地区,但由于人类活动对生境的破坏以及作为观赏植物过度采挖等因素,目前许多分布区的居群已完全消失,因而被纳入《云南省极小种群野生植物拯救保护规划(2021–2030)》中实施拯救保护。此外,红马银花具有该组中唯一的红色管状漏斗形花冠,具有极高的观赏价值和园艺种质创新潜力。
该研究基于PacBio HiFi测序数据和HiC辅助组装,首次获得杜鹃花科第一个高质量单倍型基因组。组装完成的红马银花基因组总大小约为1.06 Gb,包含两套完整的haplotypes:Haplotype A(532.73 Mb,Contig N50和Scaffold N50分别达到35.67 Mb和42.05 Mb)和Haplotype B(521.98 Mb,Contig N50和Scaffold N50分别为34.70 Mb和41.81 Mb)。共有99.92%的序列可被锚定至染色体上,大部分染色体组装出了完整的端粒序列,仅少数不完整或缺失,最终获得了14条无gap的染色体组装。共注释到551.06 Mb的重复元件,占总基因组的52.19%。通过从头预测、转录本证据或同源蛋白证据共鉴定到60926个蛋白编码基因,其中有93.82%的基因成功进行功能注释。系列评估显示该组装无冗余、无塌缩、错误率较低且注释基因的完整度较好,表明了较高的组装质量。该研究为深度解析杜鹃属植物的演化历史、红马银花综合保护体系的深入研究和种质资源发掘利用奠定了基础。
近日,中国科学院昆明植物研究所的极小种群野生植物综合保护团队在国际期刊Scientific Data在线发表了题为A haplotype-resolved genome assembly of Rhododendron vialii based on PacBio HiFi reads and Hi-C data的研究论文。中国科学院昆明植物研究所博士研究生常宇航为论文的第一作者,中国科学院昆明植物研究所马永鹏研究员和孙卫邦研究员为论文的共同通讯作者,中国科学院昆明植物研究所博士研究生张仁纲也参与了该项目。研究得到了科技部国家科技基础资源调查专项项目、云南省自然科学基金重点项目、中国科学院西部之光及云南省高层次人才等项目的资助。
图1 红马银花花冠特征和高质量的单倍型参考基因组
图2 红马银花染色体上一些重复元件分布