Frederick Sanger 是一位1918年出生于美国的生物化学家,曾经两度获得诺贝尔化学奖 。上世纪70年代末,他提出快速测定脱氧核糖核酸(DNA)序列的技术“双脱氧终止法”,也被称作“Sanger法”。

img

早在2001年完成的人类基因组框图,采用的就是该方法。而且因准确率高,直到今天还在广泛使用,也被称为基因检测的金标准。下面我们来看看Sanger法是怎样测得基因序列的。

Sanger 测序法原理

构建反应系统

Sanger法测序由一套四个单独的反应构成,每个反应系统包含

  • 四种脱氧核苷酸三磷酸 (dNTP),可以正常合成DNA
  • 每个反应系统加入四种不同的双脱氧核苷三磷酸 (ddNTP),由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止,另外为了方便定位,需要用荧光或者同位素标记。
  • 目标片段、DNA聚合酶、引物,反应体系

这样我们的四个反应体系构建完成 (四种颜色分别代表不同的 ddNTP 反应体系):

img

扩增目的片段

下一步进行扩增,以目的片段为模板,在DNA聚合酶的催化下,从引物处起始开始复制DNA,当遇到ddNTP,反应停止。

由于反应体系中 dNTP 与 ddNTP 相对浓度的调节,使反应扩增得到一组长几百至几千碱基的链终止产物。这里是ddNTP与dNTP在复制过程中结合到延长链上的几率,如果ddNTP浓度高,结合几率高,阻碍链延长的几率就高,那么目的片段复制的长度就短。

也就是说,这些扩增产物具有共同的起始点,但终止在不同的的核苷酸上。

比如,下图的复制过程中遇到带尾巴的黄色核苷酸,一共复制9个碱基。

img

凝胶电泳

接下来,用凝胶电泳把他们分开,这里使用的是高分辨率变性丙烯酰胺凝胶,并由四个泳道组成,每个泳道对应一种碱基。然后,对凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。

img

序列读取

最后通电开始跑条带,在电流与凝胶阻力的作用下,纵向会出现具有相同间隔有规律的条带,它代表着不同的序列长度,在横向分别对应ATGC。现在,我们很容易就可以读出下图的DNA片段序列为 5’-GATTCGAGCTGA-3’。

img

现在推断模板链(也就是待测片段)为 3’-CTAAGCTCGACT-5’

img

随着物理及化学技术的发展,人们想到可以用相同的激发波长且具有不同发射波长的荧光基团标记 ddNTP(用一种激发光照射后,这些基团会有不同的光学颜色)。现在,我们就可以把四种 ddNTP 放在同一体系下,通过光激发将四种光波长信号转化为电脑可识别的电信号,在计算机眼里就会表现为不同的物质来处理。

这些新技术的加入使我们进入测序2.0时代,商用的二代测序是目前主流的测序技术,它以高度自动化测序仪为载体,实现了测序速度的提高,通量的升高,测序成本的减低,但是同时也会降低准确率。