昆明动物所等发布最新版树鼩基因组注释

昆明动物研究所 叶茂森 2021-09-29

  树鼩是一种与实验大鼠差不多大小的小型哺乳动物,是灵长类的近亲。由于其繁殖周期短(约6周),饲养成本低,单胎产仔数较高(每胎2-5只)等特点,在某些方面可望替代非人灵长类用于生物医学研究和应用。目前,树鼩已被用于感染性疾病如新型冠状病毒(SARS-CoV-2)、乙型肝炎、丙型肝炎、疱疹病毒感染、禽流感病毒感染等模型创建,是研究视觉系统与功能的很好的动物。中国科学院昆明动物研究所研究员姚永刚团队和合作者,对树鼩开展了长期而深入的研究,先后完成了树鼩高质量基因组分析、树鼩转基因技术突破、树鼩免疫遗传特性解析、树鼩研究资源如永生化细胞系构建等工作,拓展了人们对于这一新型实验动物的认识。 

  为了解决树鼩用于疾病动物模型创建时缺少基因组等遗传信息的问题,姚永刚团队和合作者先后发布了第一版树鼩基因组(KIZ version 1: TS_1.0)和第二版树鼩基因组(KIZ version 2: TS_2.0)序列,并建立了首个树鼩基因组数据库(http://www.treeshrewdb.org/),实现了树鼩基因组数据的自由访问和共享,促进了树鼩研究领域的发展。近期,该团队成员利用三代转录组(Long-read isoform sequencing, ISO-seq)测序技术测定了树鼩各组织的全长转录组,获得精确的树鼩转录本结构。结合涵盖多种生理和病理状态下的树鼩组织与细胞的转录组数据,完善了树鼩基因组编码基因以及长非编码RNALong non-coding RNA, lncRNA)基因的注释,得到第三版树鼩基因组的注释(KIZ version 3: TS_3.0)。新注释的编码RNA转录本和lncRNA转录本,提供了一个更为全面可靠的树鼩基因组注释信息。基于这些全面的注释信息,对树鼩lncRNA以及mRNA的基本序列特征以及表达特征进行了研究,发现树鼩lncRNA的外显子数量小于mRNAlncRNA转录本长度短于mRNAlncRNA表达水平低于mRNA,这些特征也符合其他物种中的相关报道。进一步分析显示,TS_3.0是目前最为完整的树鼩基因组注释,树鼩各组织均有较高的基因表达特异性以及可变剪切特异性,可能与各器官执行的功能有关。 

  对包括人类、猕猴、树鼩和小鼠4种哺乳动物的组织转录组相似度比较发现,树鼩相较于小鼠都与灵长类动物更加接近。同时,阿尔兹海默症(Alzheimer’s disease)、帕金森综合症(Parkinson’s disease)13个通路中,树鼩相关基因与人类同源基因的相似度均高于小鼠相关基因与人类同源基因的相似度,这些基因在大脑中的表达模式也与人类更加接近,说明树鼩比小鼠更适合作为上述疾病的动物模型。利用新的注释信息,分析了树鼩细胞和组织在多种病毒感染下的基因差异表达情况,发现在病毒感染相关转录组数据中,TS_3.0中新注释出的富嘌呤元件结合蛋白APurine rich element binding protein A, PURA)和新鉴定到的树鼩特异性STT3B家族成员表现出显著的差异表达,提示在病毒感染过程中发挥重要的作用。 

  上述研究工作以Comprehensive annotation of the Chinese tree shrew genome by large-scale RNA sequencing and long-read isoform sequencing为题,发表在Zoological Research上姚永刚团队的博士研究生叶茂森与硕士张金燕为该论文的共同第一作者,姚永刚为该论文的通讯作者。该研究工作得到昆明动物所正高级工程师吕龙宝和中国农业科学院兰州兽医研究研究员所朱启运的大力帮助。该研究得到国家自然科学基金委、中国科学院与云南省的资助。 

  文章链接:http://www.zoores.ac.cn/article/doi/10.24272/j.issn.2095-8137.2021.272