我们身体中每个细胞的基因组DNA每天都会面临成千上万次的损伤。所幸的是,细胞中有一套能够修复各种类型损伤的机器来保证基因组的完整性(genome integrity)。修复DNA损伤的机器在从酵母到人所有的真核生物中都是非常保守的,因此酵母作为模式生物被广泛应用于DNA修复(DNA repair)方面的研究。在所有类型的DNA损伤中,DNA双链断裂(DNA double-strand breaks,DSBs)是最严重的。DNA双链断裂如果得不到正确的修复往往会引发癌症。对DNA双链断裂修复机制进行研究不仅关系到人类健康,还有助于对一些基本的生物学问题如基因组的突变、重组和进化的理解。DNA双链断裂主要通过两种途径进行修复:同源重组(homologous recombination, HR)和非同源末端连接(nonhomologous end-joining, NHEJ)。同源重组依赖于完整的同源序列进行修复,因此保真性高。而非同源末端连接不依赖于模板,保真性差,修复产物通常带有几个碱基对的插入或缺失。

       之前,人们检测非同源末端连接的修复产物,偶尔会看到一些长片段DNA序列——来自可移动的遗传元件如转座子、细胞核基因组其他区域以及线粒体DNA——会插入到DNA双链断裂部位从而影响基因组的完整性。长片段DNA的插入在癌症基因组里普遍存在【1】。有意思的是,最近在产生抗体的B淋巴细胞中V(D)J位点也发现了来自基因组其他位点的长片段DNA插入。插入长片段DNA的B淋巴细胞产生的抗体能够特异性结合疟原虫抗原。因此,这种长片段DNA的插入增加了抗体的多样性【2】。另外,最近在CRISPR/Cas9的基因编辑产物中也发现有长片段DNA插入。但是,人们对于长片段DNA插入的机理还不明确。这种长片段DNA在细胞里是如何产生的?细胞又是如何抑制长片段DNA插入的呢?

       近日,来自美国贝勒医学院的Grzegorz Ira实验室、休斯顿卫理公会医院Kaifu Chen实验室和安德森癌症中心的Guang Peng博士等(第一作者为于洋博士,2013年毕业于北京生命科学研究所杜立林实验室,另外两名并列第一作者是Nhung Pham和Bo Xia,共同通讯作者为Grzegorz Ira博士和Kaifu Chen博士)在Nature杂志上发表了题为Dna2 Nuclease Deficiency Results in Large and Complex DNA Insertions at Chromosomal Breaks的研究论文,报导了酵母核酸酶Dna2缺失突变体中DNA双链断裂部位具有高频率的长片段DNA序列插入。这是目前为止报导的第一个有这样表型的真核生物突变体。

       Dna2的缺失突变体中,插入到DNA双链断裂部位的长片段DNA序列长度大约100-1500 bp。大部分插入都只有一个供体片段,另外一些是2-4个来自于基因组不同位点的供体片段连在一起进行插入。通过分析这些插入序列,发现供体DNA来自于逆转座子、核糖体DNA以及整个基因组的其他区域。这些供体DNA显著地在基因组脆性位点聚集(如复制起点、R-loop、中心粒、端粒以及复制叉受阻区域)。DNA双链断裂部位长片段DNA插入主要通过非同源末端连接而不是通过同源重组介导。

       作者还发现,在Dna2的缺失突变体中,插入序列的供体DNA并没有从原来位点上删除,表明这种插入是一种复制-粘贴形式的重复(duplication),造成整个基因组的任何DNA片段都变得可以移动。因为是重复并且供体DNA在脆性位点聚集,提示供体DNA源自过度复制(over-replication)。核酸酶Dna2通过两种方式抑制DNA的过度复制:第一种方式是在滞后链合成过程中,去除冈崎片段上5’端的flap单链DNA;第二种方式是阻止复制叉的倒转(replication fork reversal)和/或降解已经倒转的复制叉【3-6】。5’端的flap单链长DNA可能是供体DNA的一个来源,因为敲除Pif1和Pol32这两个复制过程中起取代合成(displacement synthesis)作用的蛋白质能够减低长片段DNA插入频率并且降低了供体DNA的长度。

       由于供体DNA在复制叉前行容易受阻的脆性位点聚集,表明倒转的复制叉也可能是供体DNA的来源。在Dna2缺失情况下,原本通过Dna2加工处理的DNA结构可以通过其他的替代性核酸酶进行加工处理从而从复制叉上脱落。Mus81和Yen1是两个这样的结构特异性核酸酶。在Dna2突变体中再引入Mus81和Yen1的突变能够改变长片段DNA插入频率。

       作者提出一个模型来解释Dna2缺失突变体中在DNA双链断裂部位长片段DNA插入:5’端的flap单链长DNA和倒转的复制叉可以通过取代合成以及替代性核酸酶处理后从复制叉上脱离从而游离于染色体之外;这些游离的单链DNA和双链DNA可以被双链断裂的DNA末端捕获从而作为底物通过非同源末端连接修复途径被插入到断裂部位(下图)。与这个模型相符的是,作者发现相比野生型而言,Dna2缺失突变体具有更多游离的长片段DNA。并且发现外源导入的单链DNA和双链DNA不仅在Dna2缺失突变体中而且也可以在野生型细胞中被插入到DNA双链断裂部位,表明只要长片段单链DNA或双链DNA存在于细胞中就可以被断裂的DNA双链末端捕获而不必需要缺失Dna2。

       Dna2缺失的细胞中大片段插入的模型

       这项研究中发现的抑制基因组不稳定性(genome instability)的新机制为癌症基因组和V(D)J位点中类似大小的长片段DNA插入提供了一个可能的解释。游离于染色体外的长片段DNA被断裂的DNA双链末端捕获会对基因组的完整性形成威胁,但是也可能在进化过程中能够促进基因和其他遗传元件的重复以及物种间的基因水平转移。长片段DNA插入有可能促进肿瘤的发生,因此抑制游离的长片段DNA的产生或者促进它们的降解可能是一个潜在的防治肿瘤的方案。

       参考文献

       1. Li, Y. et al. Patterns of structural variation in human cancer. BioRxiv doi: https://doi.org/10.1101/181339 (2017).

       2. Pieper, K. et al. Public antibodies to malaria antigens generated by two LAIR1 insertion modalities. Nature 548, 597-601, doi:10.1038/nature23670 (2017).

       3. Budd, M. E., Reis, C. C., Smith, S., Myung, K. & Campbell, J. L. Evidence suggesting that Pif1 helicase functions in DNA replication with the Dna2 helicase/nuclease and DNA polymerase delta. Mol Cell Biol 26, 2490-2500 (2006).

       4. Hu, J. et al. The intra-S phase checkpoint targets Dna2 to prevent stalled replication forks from reversing. Cell 149, 1221-1232, doi:10.1016/j.cell.2012.04.030 (2012).

       5. Thangavel, S. et al. DNA2 drives processing and restart of reversed replication forks in human cells. J Cell Biol 208, 545-562, doi:10.1083/jcb.201406100 (2015).

       6. Liu, B., Hu, J., Wang, J. & Kong, D. Direct Visualization of RNA-DNA Primer Removal from Okazaki Fragments Provides Support for Flap Cleavage and Exonucleolytic Pathways in Eukaryotic Cells. J Biol Chem 292, 4777-4788, doi:10.1074/jbc.M116.758599 (2017).