您的位置:首页 > 产品设计 > UI/UE

fastqc, Per Base Sequence Content

2015-11-09 15:23 651 查看
Per Base Sequence Content
对所有reads的每一个位置,统计ATCG四种碱基(正常情况)的分布:



横轴为位置,纵轴为百分比。 正常情况下四种碱基的出现频率应该是接近的,而且没有位置差异。因此好的样本中四条线应该平行且接近。当部分位置碱基的比例出现bias时,即四条线在某些位置纷乱交织,往往提示我们有overrepresented sequence的污染。当所有位置的碱基比例一致的表现出bias时,即四条线平行但分开,往往代表文库有bias (建库过程或本身特点),或者是测序中的系统误差。
当任一位置的A/T比例与G/C比例相差超过10%,报"WARN";当任一位置的A/T比例与G/C比例相差超过20%,报"FAIL"。



第一个图其实是不正常的,第二个图才是正常的,因为植物基因组,本来AT就比GC要高,第一个图之所以都一样,是因为有细菌或者叶绿体污染,导致

四种碱基含量差不多了。。。

中心测序,每次都是前面会有波动,可能是由于刚开始要测接头,可能要切完以后,信号不稳定等因素~~

freemao

FAFU
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: