每个人体内都有着两米长的DNA,它是如何紧密折叠在直径 10 微米小的细胞核内。

而且还要在极度压缩的情况下,精确地调度数量庞大的调控元件去表达两万多个基因。

如果其中一些关键环节出现问题,随之而来的就是遗传疾病,甚至癌症。

接下来,我们进入细胞核的世界,从三维空间的角度,看看它是如何组织,协调这么庞大的工程。

一、细胞核 Nucleus

mark

首先看下染色质的主要存储容器——细胞核,主要看与三维基因组密切相关的三个结构:

核膜 Nuclear Envelope:用来包裹染色质,控制物质进出

**核纤层 Nuclear Lamina:**位于核膜的内表面的纤维网络,支持核膜,锚定染色质,与核骨架相连,参与细胞周期解离和重建

*核仁 Nucleolus* 主要存储合成 rRNA,存储装配核糖体

二、染色质疆域 Chromosome Territory,CT

在真核生物的基因组中,细胞核内的染色质分布并不是随机的,为了跨越较大的基因组距离去互相作用,比如增强子和启动子的互作,这些密切接触的染色质会靠的更近,这就是染色质疆域。大概就像这样:

mark

我们可以使用染色体构象捕获技术(3C,4C,Hi-C,HiChIP)来获取到3D基因组。

在二维视角下的染色质疆域

mark

在三维视角下的染色质疆域

mark

目前,发现这些区域有一定的规律:

  • 染色体的位置相对不变:这种相对不变会持续到有丝分裂开始。比如大型的,基因贫乏的染色体通常位于核层附近的外围,而较小的,富含基因的染色体则更靠近核中心。
  • 染色质的位置会因细胞类型不同而改变:例如,X染色体已显示在肝细胞中比在肾细胞中更频繁地定位在外围
  • 同源染色体在细胞间期倾向于彼此分离

为了更方便的研究,进一步把这些互作部分划分为:

三、染色质区室 A/B compartments

mark

使用 Hi-C 发现,整个基因组被分割为两个空间区室,分布标记为 A,B 染色质区,往往区室内互作频繁,而区室间互作较少。

A compartments:开放的染色质,表达活跃,基因丰富,具有较高的GC含量,包含用于主动转录的组蛋白标记,通常位于细胞核的内部。

B compartments:关闭的染色质,表达不活跃,基因缺乏,结构紧凑,含有基因沉默的组蛋白标志物,位于核的外围。它们主要由LAD组成,包含晚期复制起点。

在生物信息分析中,我们通过计算染色体内部互作的相关性来区分两种不同的区室。

mark

四、拓扑结构域 Topologically associating Domains,TAD

在染色质区室中,我们还会发现互相作用相对频繁的基因组区域,这些就是拓扑结构域 TAD。

mark

一般这些区域在不同的哺乳动物的不同细胞中都很保守,并且高度富集 CTCF 和 粘附蛋白。

mark

通过计算基因互作矩阵,我们会得到一个类似上图的大三角形,可以看到上面有几个深红色的三角,代表内部高度互作域被定义为拓扑结构域,一般是400-800kb较稳定的复制单元。

TAD 的边界:

  • 通过与上下游的互作频率趋近于0的DI值界定TAD边界
  • 边界中富含绝缘子蛋白 CTCF 结合位点、活跃转录标记,如H3K4me3及H3K36me3
  • 富含结构蛋白结合位点,与管家基因,转运RNA基因和短间隔核元素(SINEs)相关的表观遗传标记。

目前研究最多的是,TAD通过限制每个TAD的增强子-启动子相互作用来调节基因表达,但是TAD详细功能还有待发现。

尽管许多蛋白质复合物,DNA 元件与TAD边界相关,但TAD形成的基础机制也很复杂,尚未完全阐明。

目前认可的模式是,以CTCF蛋白为核心,在黏附蛋白的帮助下,通过loop extrusion模型挤压形成染色质环,锚定TAD边界,为TAD的形成提供了结构基础。此外,TAD 边界的刚度本身可能会导致 TAD 的形成。

TAD 可细分为 sub TAD, 大约长 100kb,sub TAD之间的边界在不同细胞组织间具有差异,与细胞特异性的增强子-启动子互作有关。

在细菌中,这种互作结构叫做染色质互相作用域(Chromosomal Interacting Domains,CIDs)

五、层关联域 Lamina Associating Domains,LAD

mark

LAD约占基因组的40%,大小介于40kb至30Mb之间,基因较少。 LAD主要由转录沉默染色质组成,富含组蛋白H3K27me3 ,这是异染色质的常见翻译后组蛋白修饰。

结构性 LAD,constitutive LAD,cLAD:富含AT的异染色质区域,靠近在核纤层上,这些区域对染色体之间的结构形成至关重要。

兼性 LAD, facultative LAD,fLAD:具有不同的核纤层相互作用,在不同细胞中包含不同的被激活或抑制基因,从而导致不同的细胞类型。

六、核仁关联域 Nucleolar Associating Domains,NAD

mark

NAD占基因组的4%,几乎具有与LAD相同的所有物理特征。通过对LAD和NAD的序列分析发现,某些区域可能在核纤层和核仁间切换。

七、染色质环 Chromatin loops

染色质在空间中形成环状结构,因此相距很远的染色质区域也可以在三维空间中聚集在一起。

mark

据推测大约50%的人类基因通过染色质环化过程参与长距离的染色质相互作用。我们可以基于基因互作矩阵,来查看互作频率相对周围较强的区域,在下图中用蓝色圆圈标记,这些位置就是为染色质环区域。

mark

这种结构可以使在线性距离很远的元件得以相遇,以此来调控生命活动,比如,从空间上拉近启动子和增强子的距离,促使基因的转录起始。

这个过程中,接触到启动子的增强子元件可以募集大量蛋白质复合物,例如介导复合物,PIC和细胞特异性转录因子。另外,许多因素也会促进该过程,包括结构蛋白(主要是CTCF和Cohesin),共激活因子和ncRNA等。

mark

下一篇,我们来详细看看三维基因组检测技术:染色体构象捕获技术(3C,4C,Hi-C,HiChIP)

参考

The new cytogenetics: blurring the boundaries with molecular biology

Regulation of disease-associated gene expression in the 3D genome

Chromatin Domains: The Unit of Chromosome Organization

Minor Loops in Major Folds: Enhancer–Promoter Looping, Chromatin Restructuring, and Their Association with Transcriptional Regulation and Disease

Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome

A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping

The Three-Dimensional Organization of Mammalian Genomes

Enhancer activation requires trans-recruitment of a mega transcription factor complex

https://foo-lab.com/services/chromatin-architecture-epigenetics/