介绍

  • SAM(sequence Alignment/mapping) 数据格式是目前高通量测序中存放比对数据的标准格式
  • 转换 BAMSAM 格式
  • 比对文件排序,建立fastq索引

安装

conda install -y samtools

这里需要安装Conda (这是一款用于安装多数生物信息分析软件的管理软件,重要的是可以解决软件依赖问题) : Conda 安装使用图文详解

使用

1、常用的三个步骤

转换 SAM 格式为 BAM 格式

samtools view -S SRR00000.sam -b > SRR00000.bam

对比对后文件进行排序

samtools sort SRR00000.bam -o SRR00000_sorted.bam

对排序后文件建立索引

samtools index SRR00000_sorted.bam

通常以上的三个步骤是依次进行

2、格式转换

sam -> bam

samtools view -S SRR00000.sam -b > SRR00000.bam

bam -> sam

samtools view -h SRR00000.bam -b > SRR00000.sam

文档:http://www.htslib.org/doc/samtools.html