SAM得到完美匹配(perfect match)
2017-02-22 15:03
447 查看
主要针对bwa生成的sam文件中,如何找到完美匹配的比对结果。
完美匹配(perfect match)是指:一条序列能够在不允许编辑距离(edit distance),碱基错配(mismatch), GAP opens/extentions时能够比对到参考基因组上。
BWA比对的结果最终为sam(Sequence Alignment/Map)格式,内容如下:
CIGAR值能够指示部分比对情况,但是但从CIGAR值来判断比对详细情况是不够的,所以,比如一条序列长度为36bp,比对到基因组上,CIGAR值为“36M”,单凭这个值是不能判断是否为完美匹配的。
我们需要根据bwa结果中的OPT列,即tag值来进行进一步的判断。bwa中提供的tag值如下:
在使用tag信息挑选perfect match时,设置NM(编辑距离)为0,XM(错配个数)为0,X0(最佳匹配个数)为1。之所以设置最佳匹配数,是因为一条序列有可能有多个完美匹配,这种序列在后续分析中不会用到,这个参数是可选的。
使用Perl语言设置的过滤条件如下:
(完)
完美匹配(perfect match)是指:一条序列能够在不允许编辑距离(edit distance),碱基错配(mismatch), GAP opens/extentions时能够比对到参考基因组上。
BWA比对的结果最终为sam(Sequence Alignment/Map)格式,内容如下:
Col | Field | Description |
---|---|---|
1 | QNAME | Query (pair) NAME |
2 | FLAG | bitwise FLAG |
3 | RNAME | Reference sequence NAME |
4 | POS | 1-based leftmost POSition/coordinate of clipped sequence |
5 | MAPQ | MAPping Quality (Phred-scaled) |
6 | CIAGR | extended CIGAR string |
7 | MRNM | Mate Reference sequence NaMe (‘=’ if same as RNAME) |
8 | MPOS | 1-based Mate POSistion |
9 | ISIZE | Inferred insert SIZE |
10 | SEQ | query SEQuence on the same strand as the reference |
11 | QUAL | query QUALity (ASCII-33 gives the Phred base quality) |
12 | OPT | variable OPTional fields in the format TAG:VTYPE:VALUE |
我们需要根据bwa结果中的OPT列,即tag值来进行进一步的判断。bwa中提供的tag值如下:
Tag | Meaning |
---|---|
NM | Edit distance |
MD | Mismatching positions/bases |
AS | Alignment score |
BC | Barcode sequence |
X0 | Number of best hits |
X1 | Number of suboptimal hits found by BWA |
XN | Number of ambiguous bases in the referenece |
XM | Number of mismatches in the alignment |
XO | Number of gap opens |
XG | Number of gap extentions |
XT | Type: Unique/Repeat/N/Mate-sw |
XA | Alternative hits; format: (chr,pos,CIGAR,NM;)* |
XS | Suboptimal alignment score |
XF | Support from forward/reverse alignment |
XE | Number of supporting seeds |
使用Perl语言设置的过滤条件如下:
next if $line !~ /NM:i:0/; next if $line !~ /XM:i:0/; next if $line !~ /X0:i:1\s+/;
(完)
相关文章推荐
- 得到完美的匹配器
- php完美匹配邮箱、链接地址和电话号码
- 二分图的最大匹配、完美匹配和匈牙利算法
- UVA 11419 SAM I AM(最大二分匹配&最小点覆盖:König定理)
- 二分图的最大匹配、完美匹配和匈牙利算法
- 二分图的最大匹配、完美匹配和匈牙利匹配算法
- 三星Galaxy s4(i9505)得到完美root权限教程
- 爬虫Get请求参数匹配得到字典类型格式(Python)
- 二分图的最大匹配、完美匹配和匈牙利算法
- DataGridViewComboBoxColumn 可以让用户输入并自动匹配选项的问题 [问了很多人,找了很多站都没得到答案,所以只好放首页,请管理员体谅.谢谢!]
- 二分图的最大匹配、完美匹配和匈牙利算法
- 最佳完美匹配性质2 uva11383-点上的性质
- 二分图的最大匹配、完美匹配和匈牙利算法
- Uva11419 I AM SAM 我是山姆 二分匹配
- 【USACO4.2.2】完美的牛栏 二分图的匹配
- myeclipse10.7.1完美破解, 导出war得到解决
- 正则匹配Ueditor中得到的文本中的自己上传的图片链接
- 二分图的最大匹配、完美匹配和匈牙利算法
- HDOJ-1533 二分图最佳完美匹配通俗解释
- poj2400 KM算法二分图的完美匹配