二代测序文库构建(干货 | 蛋白质-DNA互作研究那些你不知道的技术更迭)

今天小编带大家一起来了解一下蛋白质-DNA互作研究的主流技术。

蛋白质与DNA互作是基因转录调控的关键,也是启动基因转录的前提。蛋白质与DNA互作主要包括组蛋白、转录因子、DNA甲基化酶和染色质重塑复合物等。为了研究蛋白质-DNA互作,科学家发明了很多方法:凝胶阻滞、DNaseⅠ足迹实验、甲基化干扰、体内足迹、酵母杂交、ChIP-Seq等。其中ChIP-Seq可以真实、完整地反映结合在DNA序列上的靶蛋白,是目前研究蛋白质-DNA互作的经典方法。但该技术需要大量细胞,且步骤繁琐,耗时较长,因此,研究者不断在寻找新的替代方法。

2019年4月Thomas G Fazzio教授等发表在Cell期刊的uliCUT&RUN技术,将蛋白质-DNA互作研究升级到单细胞水平。近来,又相继有文章报道了CUT&Tag等技术,进一步优化了蛋白质-DNA互作研究方法,本文将对系列方法一并总结介绍。



1997年

Orlando等研发出ChIP[1],主要用于研究转录因子与DNA结合位点的序列信息。


2009年

Dominic Schmidt等将ChIP与高通量测序技术结合,发明了ChIP-seq,能够在全基因组范围内检测与蛋白相互作用的DNA区域。


2017年

Henikoff等发布CUT&RUN技术,使用微球菌核酸酶(micrococcal nuclease, MNase)进行染色质切割替代ChIP-seq中的超声打断,使得蛋白-DNA互作研究从ChIP-seq所需的104级别降到100-1000个细胞。


2019年

Thomas G Fazzio教授等发布uliCUT&RUN,将CUT&RUN技术升级到单细胞水平,并应用于早期胚胎研究。


2019年

Henikoff等发明CUT&Tag,使用带有接头的Tn5转座酶替代MNase,简化实验操作,将细胞量从104级别降到60个细胞甚至单细胞。


✦染色质免疫共沉淀(ChIP):

ChIP是全基因组范围内检测蛋白-DNA互作的标准方法,该技术由Orlando等于1997年创立[1]。

图1:ChIP 基本原理图[1]


✦ChIP原理:

将染色质和与之相互作用的转录因子和组蛋白通过甲醛等物质交联起来,然后通过超声将染色质打碎成小片段,加入针对特定转录因子或特殊修饰的组蛋白抗体,通过Protein A/Protein G微球或磁珠将抗体-转录因子-染色质复合物拖下来,通过PCR或测序的方法检测与目的蛋白相结合的DNA序列,进而研究这些转录因子在细胞发育或者生长中的作用位点。


✦ChIP-seq:

ChIP-seq将ChIP技术与二代测序相结合,将ChIP下来的DNA进行二代测序文库构建,能够获取全基因组范围内组蛋白DNA及染色质修饰等DNA区段信息。

图2:ChIP-seq 流程


✦ChIP-seq原理:

将通过ChIP特异性收集到的与目的蛋白结合的DNA片段进行纯化与文库构建,ChIP-seq继承了ChIP的技术难点,需要先用甲醛将与DNA互作的蛋白固定,这个过程会造成一些非相关蛋白交联,形成假阳性。一些作用力小的转录因子或者由于甲醛交联不充分,在超声破碎时会造成假阴性。为了消除背景噪音,则需加大细胞投入量。ChIP以及ChIP-seq无法捕获少量细胞中发生的关键表观基因组学过程, 包括影响胚胎发育,发育疾病,干细胞的过程分化和某些癌症的发生。


✦CUT&RUN (Cleavage Under Targets and Release Using Nuclease ):

Henikoff实验室于2017年1月16日发表在elife上关于CUT&RUN的文章,使得蛋白-DNA互作研究从ChIP-seq所需的104级别降到100-1,000个细胞[2]


图3:CUT&RUN 文章 [2]


✦CUT&RUN原理:

图4:CUT&RUN 原理 [3]


利用连有刀豆蛋白A的磁珠(concanavalin A-coated magnetic beads)结合细胞。使用非离子去污剂洋地黄皂苷进行细胞膜通透。然后孵育靶蛋白(如转录因子, TF)的抗体和Protein A-MNase。抗体和Protein A-MNase能够通过核孔进入细胞核,MNase 通过Protein A 和抗体的介导切割靶蛋白附近的DNA序列。MNase的活化需要Ca2+,可通过加入Ca2+或者螯合剂来启动或终止反应,进而将靶蛋白结合的DNA序列从细胞核中释放到上清中,用以建库。


✦uliCUT&RUN:

2019年4月4日,发表在Cell期刊,文章进一步将该技术升级到单细胞水平,并应用于早期胚胎。升级版CUT&RUN被称为超低量CUT&RUN(ultra-low input CUT&RUN, uliCUT&RUN)。

图5:uliCUT&RUN文章 [4]


相对于CUT&RUN技术,uliCUT&RUN的改进包括:Buffer、体系、孵育时间、spike-in DNA量以及建库制备和纯化过程。


图6:不同细胞量mESCs的uliCUT&RUN数据结果[4]


将不同细胞量mESC的uliCUT&RUN数据中的CTCF和H3K4me3测序结果与已有文献发表的ChIP-seq数据进行read密度可视化比较,发现10个细胞起始量的测序结果可以展现出类似50万细胞量的结合位点富集热图。其中CTCF的结合区更为狭窄集中,而H3K4me3则占据相对宽的区段。


✦CUT&Tag(Cleavage Under Targets and Tagmentation):

Henikoff博士于2019年4月29日发表在Nature Communication上关于CUT&Tag的文章,让细胞量从104级别降到60个细胞甚至单细胞

图7:CUT&Tag文献[5]


✦CUT&Tag 原理:

图8:CUT&Tag原理图[5]


利用连有刀豆蛋白A的磁珠(concanavalin A-coated magnetic beads)结合细胞(刀豆蛋白A能与细胞膜上的糖蛋白结合)。使用非离子去污剂洋地黄皂苷进行细胞膜通透。然后分步孵育靶蛋白(如转录因子, TF)的抗体(一抗)、二抗、和Protein A-Tn5,抗体和Protein A-Tn5能够通过细胞膜、核孔进入细胞核,Tn5通过Protein A 和抗体的介导切割靶蛋白附近的DNA序列。使用Tn5在进行切割的时候,会在被切割的片段两端加上接头序列,通过PCR扩增直接可以得到二代测序文库。


图9: CUT&Tag、CUT&RUN的peaks鉴定结果与ChIP-seq的对比[5]


Henikoff等使用了ChIP-seq、CUT&RUN、CUT&Tag三种方法来对组蛋白H3K27me3进行研究。通过相同的数据量(8M Reads)进行比较分析发现,三种方法对应的染色体景观相似,但是ChIP-seq需要更高的测序深度才能达到去背景噪音的效果,CUT&RUN和CUT&Tag的信噪比远远高于ChIP-seq。


✦CUT&Tag 单细胞操作流程:


图10:单细胞CUT&Tag操作流程[5]


CUT&Tag能够对极少量细胞(60个细胞)进行操作,还可以进行单细胞操作。进行单细胞操作需要将细胞进行分装,由于Protein A-Tn5在细胞内进行,PCR反应之前,切割的核酸均在细胞内, Henikoff博士通过分配单个细胞到5184纳米孔,再加入带随机标签的引物进行扩增的办法,实现单细胞测序。


二代测序

✦其他蛋白质-DNA互作研究方法:

2019年3月以来,bioRxiv上传了数篇蛋白-DNA互作研究的预印文章,包括CoBATCH[5]和ACT-seq[6]技术等,同样基于Tn5与融合蛋白进行ChIP技术的创新,原理基本相同。



Protein A-Tn5、Protein G-Tn5以及 Protein A-MNase三种酶是CUT&Tag、CUT&RUN技术中的关键核心酶。由于CUT&Tag、CUT&RUN均是针对极低起始量细胞进行实验,因此对核心酶原料有极高要求。


首先是Tn5转座酶需要具有高活性,才能保证对微量DNA的高灵敏度和高亲和力,有效抓取数十个细胞中的有限结合位点;第二,由于Tn5转座酶对DNA的高亲和力,纯化过程中易产生非特异核酸残留。应用在仅有数十个细胞的CUT&Tag实验中,非特异核酸残留会对建库效果和测序数据产生较大影响。因此,选择CUT&Tag用酶时,一方面需要对Tn5转座酶进行定向进化和突变,选择高活性突变株;另一方面,需要有较高的蛋白纯化工艺,尽可能降低非特异核酸残留。


南京诺唯赞生物科技有限公司(Vazyme Biotech Co.,Ltd)是国内首家进行高通量测序建库试剂盒研发与生产的公司,拥有数百人的研发团队。公司致力于酶和抗体的研发和生产,拥有业界领先的蛋白定向进化平台、高密度发酵平台、生物信息分析平台等。


由诺唯赞定向进化和生产的Tn5酶,灵敏度是野生型Tn5酶的1000倍,具有极低的核酸残留,大大减少了低起始量建库中非特异核酸占比,Tn5突变体酶和基于该酶的建库试剂盒均得到了国内外众多客户的一致好评。过去三年间使用诺唯赞Tn5酶发表的高影响因子文章12篇,其中CNS有5篇(详情请见参考文献7-11)。


干货 | 化学感受态细胞进行质粒DNA转化的原理

干货 | 终于开学了,你保存的样本还好么?

科普 | 保护胃健康


参考文献

[1] Orlando, V., Strutt, H., & Paro, R. (1997). Analysis of chromatin structure byin VivoFormaldehyde cross-linking. Methods, 11(2), 205-214.

[2] Skene, P.J., and Henikoff, S. (2017). An efficient targeted nuclease strategy for high-resolution mapping of DNA binding sites. eLife 6, e21856.

[3] Skene, P.J., Henikoff, J.G., and Henikoff, S. (2018). Targeted in situ genomewide profiling with high efficiency for low cell numbers. Nat. Protoc. 13, 1006–1019.

[4] Kaya-Okur, H. S., Wu, S. J., Codomo, C. A., Pledger, E. S., Bryson, T. D., Henikoff, J. G., ... & Henikoff, S. (2019). CUT&Tag for efficient epigenomic profiling of small samples and single cells. Nature communications, 10(1), 1930.

[5] Wang, Q., Xioong, H., Ai, S., Yu, X., Liu, Y., Zhang, J., & He, A. (2019). CoBATCH for high-throughput single-cell epigenomic profiling. bioRxiv, 590661.

[6] Carter, B., Ku, W. L., Tang, Q., Kang, J. Y., & Zhao, K. (2019). Mapping Histone Modifications in Low Cell Number and Single Cells Using Antibody-guided Chromatin Tagmentation (ACT-seq). bioRxiv, 571208.

[7] Wu J, Huang B, Chen H, et al. The landscape of accessible chromatin in mammalian preimplantation embryos[J]. Nature, 2016, 534(7609): 652.

[8] Zheng C, Zheng L, Yoo J K, et al. Landscape of infiltrating T cells in liver cancer revealed by single-cell sequencing[J]. Cell, 2017, 169(7): 1342-1356. e16.

[9] Zhang L, Yu X, Zheng L, et al. Lineage tracking reveals dynamic relationships of T cells in colorectal cancer[J]. Nature, 2018, 564(7735): 268.

[10] Han X, Wang R, Zhou Y, et al. Mapping the mouse cell atlas by microwell-seq[J]. Cell, 2018, 172(5): 1091-1107. e17.

[11] Wu J, Xu J, Liu B, et al. Chromatin analysis in human early development reveals epigenetic transition during ZGA[J]. Nature, 2018, 557(7704): 256.

您可以还会对下面的文章感兴趣

最新评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

使用微信扫描二维码后

点击右上角发送给好友