一文读懂 ChIPseq
一、介绍
- ChIP-seq,测序方法
ChIP
指染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP),seq
指的是二代测序方法
- 作用:识别蛋白质与DNA互相作用情况
- 原理:染色质免疫共沉淀 + 二代测序
- 应用:常用于转录因子结合位点和组蛋白修饰位点的研究
二、测序原理
1、使用甲醛将目标蛋白(组蛋白,转录因子等)与染色质交联固定起来
2、从细胞裂解液分离基因组DNA,通过超声打断DNA为一定长度的小片段
3、添加与目标蛋白质特异的抗体,该抗体会与目标蛋白形成免疫结合复合体沉淀,收集这些沉淀
免疫结合复合体 = 靶蛋白 + 抗体 + 靶蛋白结合的DNA
4、去交联,分开蛋白与DNA,纯化DNA即可得到染色质免疫沉淀的DNA样本
5、建立好文库,用测序仪进行测序
详细测序过程可以参考:https://zhuanlan.zhihu.com/p/58708887
三、检测蛋白质与DNA序列的结合峰
1、测序片段匹配到参考基因组
将测序得到的 DNA 片段(sequenced fragments)匹配到参考基因组。
很显然,如果在基因组的某个位置蛋白质结合的概率越大,那么在该位置检测到 DNA 片段堆叠就会越高。反之,如果没有蛋白结合,在该位置就会几乎没有DNA 片段堆叠。为了研究方便,我们将这些DNA片段堆叠叫做峰 (Peak)。
2、检测峰
将覆盖到参考基因组的DNA片段堆叠用柱状图画出来,就会看到峰。
这里需要知道,ChIPseq是利用抗体去结合特异的靶蛋白,进而去沉淀靶蛋白结合的DNA。理论上,只要抗体设计的好,与蛋白质结合的 DNA 的都可以检测到。
我们一般用 ChIPseq 检测转录因子的结合,以及检测组蛋白修饰,二者有着截然不同的峰形:
转录因子结合的特征峰,峰型高,而且窄:
组蛋白修饰结合的特征峰,峰型起伏,而且分布广泛:
当然我们也可以使用,UCSC基因组浏览器显示。
3、提高峰质量
一般在做ChIPseq时,会加入一组空白对照(control),提高峰质量,那么为什么?
- 一般检测出的峰值会有背景噪音,也就是文库会夹渣一些没有用抗体捕获的DNA片段也被测序了。
- 开放的染色质区域比封闭的区域更容易断裂
- 序列在基因组中分布不均
- 允许我们在比对的控件中与相同区域进行比较
- 消除 ENCODE 的 Black list的影响
所以会准备空白对照,排除假阳性,对照组有有两种类型:
- input DNA:不用任何抗体捕获的DNA;
- mock IP DNA:用不含有抗体的DNA
这样一来,就会让我们检测到的峰更明显更接近真实的生物学特征。
四、影响ChIPseq测序结果的因素
1、免疫共沉淀的影响
- 高效特异性抗体
- 起始样本量
- ChIP DNA 产量
- 细胞类型
- 标记或蛋白质丰富程度(组蛋白比TF具有更高的结合覆盖率)
- 抗体质量
对于组蛋白,使用来自T细胞的20ug染色质DNA作为起始材料,总共会得到15-50ng DNA。
对于TF,通常从2500万个细胞(200ug染色质)中得到5-25ng。
-Subhash Tripathi,ResearchGate
- 染色质片段
- 片段大小:影响ChIP-seq中的信噪比
- 因细胞类型而异
- 偏向启动子区域的片段会在ChIP 和对照样品中的启动子上引起ChIP-seq富集
2、测序的影响
- Reads 长度
- 较长的 Reads 和双末端 Reads 可提高匹配率
- 对于等位基因特异性染色质事件,转座因子研究是必需的
- 避免分批次
- 序列输入对照的深度等于或大于IP样本
- 测序深度
- 对于转录因子:最小5-10M
- 对于组蛋白修饰宽谱图则更高:标准为20-40M
测序深度的对组蛋白修饰检测的影响
下面是在不同测序深度下检测人的 H3K4me3 组蛋白修饰ChIP图谱。
绿色框对应于基于SPP宽峰检测方法得到的显著富集区域。
在 5M (500 Reads) 中,未检测到突出显示的富集区域。
同样,我们换成 H3K27me3 组蛋白修饰。
这时在3.5M和10M 的低深度处未检测到突出显示的HOXD11和HOXD-AS1基因座处的富集区域(蓝色框)。
从每个子样本中H3K4me3,H3K36me3和H3K27me3回收的全部数据中获得的显著富集区域的百分比
总的来说,随着测序深度增加,组蛋白修饰检测比例开始会快速增加,随后达到平稳。测序深度饱和点取决于组蛋白修饰和所研究的物种基因组。
3、重复样和重现性
- 重复多次通常比更高的深度更有效
- 最好是低深度测序高质量样本,而不是高深度低质量样本
参考:
https://academic.oup.com/nar/article/42/9/e74/1248114
https://www.abcam.com/epigenetics/studying-epigenetics-using-chip