小家鼠(Mus musculus)是生物学和医学上最常用的模式生物之一。相较其他哺乳动物,它具有诸多独特优势,例如适应性强,繁殖快,成本低,易于近亲繁殖。在过去的近100年,小家鼠发展出众多“近交系”,大大提高了实验的可追溯性和可重复性【1】。科学研究中最常用的小鼠近交系是 C57BL/6J。在2002年,作为人类基因组计划的一部分,C57BL/6J全基因组测序完成【2】,并且成为了小家鼠的参照基因组(Reference genome)。在过去的十几年,历经数次更新,其错误率已从3.3x10-4降低到<10-5【3】,成为最可靠的基因组之一。因此,其他众多小鼠近交系的基因组,都是基于C57BL/6J的:大量Illumina 短片段测序(通常为75-125个碱基)通过比对,组装到参照基因组上,然后标识出所有的单碱基突变(SNP)、插入缺失(indel)和结构变异(SV),作为种系间差异的遗传学基础。这种方法花费低、效率高、测序错误率低,广泛用于小鼠和人类遗传学研究 【4】。然而不久,一个明显问题浮现出来,即比对-组装-变体识别的方法只能用于基因组内相似度高的部分,而对于类似于“主要组织相容性复合体(MHC)”的复杂区域,其结果完全不可靠。
在最近一期Nature Genetics上【7】,欧洲生物信息研究所(EMBL-EBI)的Thomas Keane研究组发表了12个最常用的实验室小鼠近交系和4个野生来源近交系的从头测序(de novoassembly)结果。
令人意外的是,在小鼠基因组,类似于MHC的高度多态性区域多达数千个,占小鼠基因组的0.5-2.5%,编码1.5-5.5%的蛋白。这些区域被称作“种系特征区”。通过基因道(gene ontology)分析,种系特征区主要编码免疫、感知、神经、行为、有性繁殖和亲属辨认相关基因。与基因组中其他部分不同,这些区域编码了大量全新基因。除非是同卵双胞胎,否则不同个体所携带的序列很可能完全不同。以野生来源近交系WSB/EiJ为例,它与参照基因组C57BL/6J遗传学相距1万年左右,却在IRG,Nlrp1,Raet1等多个区域携带全新等位基因,差异超过大鼠/小鼠间距离,即1200-2400万年。这些基因的组合是WSB/EiJ独有的,与其他15个种系均不相同。
另一个例子是“类海马体钙结合蛋白(Hpcal)”,一类只在大脑和视网膜中表达的蛋白,可能与记忆的形成有关【8】。在小鼠基因组,Hpcal家族编码于染色体12——一个极度复杂的种系特征区,长达7百万碱基,共有50-100个基因。目前我们还无法厘清这些高度多态性的Hpcal的基因,但发现各个种系内,Hpcal的编码和组合方式可能完全不同。在小鼠群体中,不同的个体会有各自的思考和行为方式。我们有理由相信,这些性格特征,很可能已经编码在基因组中类似Hpcal的区域。
这些结果提示我们,从事免疫、感知、神经、繁殖等领域的研究,光从SNP、拷贝数、表观遗传来寻找候选基因是远远不够的。种系特征区(或个体的特征区)会给目前的研究带来巨大困难。遗憾的是,由于技术局限,目前科学界大多采用短片段测序-比对-组装-变体识别的方法寻找基因组差异,而在这种条件下,个体特征区内的差别很难被发现。另一方面,小鼠不同种系间基因组差异远大于我们过去的想象,通过杂交两个背景不同的基因敲除鼠来培育双敲除种系会带来不可预测的污染。由于种系特征区很难进行变体识别,目前常用的基因芯片并不一定覆盖这部分区域,因此有时候这些污染很难被发现。
据悉,在过去的几年中,Thomas Keane研究组与其他实验室合作,测序了小鼠基因组中数个种系特征区。在这些区域种系间差异往往令人瞠目结舌。有兴趣的读者不妨可参考以下文献进一步深入了解 【9-11】。
值得一提的是,上述工作早在今年2月份就在预印本杂志bioRxiv上在线发表了。
参考文献:
1. Robert A. Taft,Muriel Davisson,Michael V. Wiles (2006) Know thy mouse, Trends in Genetics, V22, Issue 12
2. Mouse Genome Sequencing Consortium (2002). Initial sequencing and comparative analysis of the mouse genome, Nature v420, pages 520–562
3. NCBI mouse genome release notes, https://www.ncbi.nlm.nih.gov/genome/guide/mouse/release_notes.html
4. Keane, Thomas M et al.(2011) Mouse genomic variation and its effect on phenotypes and gene regulation. Nature 477 : 289-294.
5. Ana Goios et al. (2007). mtDNA phylogeny and evolution of laboratory mouse strains. Genome Res. 17: 293-298
6. Rat Genome Sequencing Project Consortium (2004). Genome sequence of the Brown Norway rat yields insights into mammalian evolution. Nature v428, pages493–521
7. Lilue, J et al. (2018). Multiple laboratory mouse reference genomes define strain specific haplotypes and novel functional loci. Nature Genetics. Published online DOI:10.1038/s41588-018-0223-8
8. Burgoyne RD (2007). "Neuronal Calcium Sensor Proteins: Generating Diversity in Neuronal Ca2+ Signalling". Nat. Rev. Neurosci. 8 (3): 182–193.
9. Nakaya, Y et al. (2017). AIM2-Like Receptors Positively and Negatively Regulate the Interferon Response Induced by Cytosolic DNA. mBIO. Published online DOI:10.1128/mbio.00944-17
10. Ibarra-Soria, X et al. (2017). Variation in olfactory neuron repertoires is genetically controlled and environmentally modulated. eLife e6, 21476
11. Lilue, J et al. (2013). Reciprocal virulence and resistance polymorphism in the relationship between Toxoplasma gondii and the house mouse. eLife e2, 01298
相关知识
16个小家鼠种系从头测序:究竟是什么造成了个体差异?(转自BioArt微信公众号)
如何运营宠物微信公众号?微信公众号怎么搜索动态宠物?
微信公众号首页
微信公众号引领宠物店管理创新
推荐几个微信公众号
浅谈医疗微信公众号日常运营方法
值得关注的十个医学类微信公众号
如何让更多人来关注微信公众号
【揭秘】微信公众号引领宠物店管理新风潮!
宠物服务微信公众号开发:宠物店通过微信公众号提供宠物训练、宠物寄养和宠物用品销售等服务解决方案
网址: 16个小家鼠种系从头测序:究竟是什么造成了个体差异?(转自BioArt微信公众号) https://m.mcbbbk.com/newsview997797.html
上一篇: 动物科普动画青蛙 |
下一篇: 仓鼠什么品种比较好养 |