根据GFF3文件统计外显子大小和数量以及内含子大小
2017-01-17 20:31
871 查看
### 根据GFF3文件统计外显子大小和数量以及内含子大小
with open('TSG.gff3', 'r') as f: for line in f: lin = line.strip().split('\t') name = lin[8].split(';')[1].split('=')[-1] if lin[2] == 'gene': print '\n', print name, lin[0], lin[3], lin[4],lin[6], if lin[2] == 'exon': print lin[3], lin[4], # 上述程序统计每个基因的外显子起始与结束的位置,保存为1.txt,注意需要打开1.txt编辑删除第一行的空行 with open('1.txt', 'r') as f: for line in f: lin = line.strip().split() a = len(lin) for i in range(6, a, 2): exon = int(lin[i]) - int(lin[i-1]) + 1 print lin[0], exon #上述程序则是计算每个外显子的大小 with open('1.txt', 'r') as f: for line in f: lin = line.strip().split() a = len(lin) if a == 7: print lin[0], '0' if a > 7: if lin[4] == '+': for i in range(7, a, 2): intron = abs(int(lin[i]) - int(lin[i-1]) - 1) print lin[0], intron if lin[4] == '-': for i in range(8, a, 2): intron = abs(int(lin[i]) + 1 - int(lin[i - 3])) print lin[0], intron #上述这个程序则是计算每个内含子的大小 with open('1.txt', 'r') as f: for line in f: lin = line.strip().split() a = len(lin) n = (a - 5)/2 print lin[0], n #上述这个程序则是统计每个基因外显子的数量
相关文章推荐
- 统计HDFS文件数量,大小,以及在某范围大小的文件数量
- 统计HDFS文件数量,大小,以及在某范围大小的文件数量
- awk 统计各种文件的数量 以及数组
- linux下统计当前文件夹中文件的数目以及如何查看文件夹的大小
- Golang代码搜集-访Unix du命令的目录文件数量和文件总大小统计程序
- Java IO 目录文件复制与删除以及目录大小与文件个数统计
- centos7中根据文件大小排序以及jenkins配置每周删除一次jobs日志信息
- Linux 下统计文件夹大小及文件数量
- PHP统计目录中文件以及目录中目录大小的方法
- 批处理统计文件夹内的所有文件的数量和总大小的bat
- 统计某个路径下所有的java文件,以及统计代码数量
- PHP中统计目录中文件以及目录中目录的大小
- PHP统计目录中文件以及目录中目录大小的方法
- 求批处理统计文件夹内的所有文件的数量和总大小
- Linux:centos释放缓存,查看磁盘空间大小,xxx文件夹, 查看文件夹大小,查看剩余内存,查看xxx软件位置,统计某文件夹,统计某文件夹下目录数量,查看文件夹大小,给文件夹下所有的文件赋值权限
- # python学习笔记(三)装饰器以及os模块(对文件大小的统计以及筛选)
- linux 文件大小和数量统计
- 统计某个路径下所有的java文件,以及统计代码数量
- unix下查看文件夹下文件数量以及大小
- Golang 目录文件数量和大小统计