您的位置:首页 > 其它

【华为OJ】【089-DNA序列】

2016-05-20 07:09 155 查看

【华为OJ】【算法总篇章】

【华为OJ】【089-DNA序列】

【工程下载】

题目描述

一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次
数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。

给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。


输入描述

输入一个string型基因序列,和int型子串的长度


输出描述

找出GC比例最高的字串


输入例子

AACTGTGCACGACCTGA
5


输出例子

GCACG


算法实现

import java.util.Scanner;

/**
* Author: 王俊超
* Date: 2016-01-06 15:18
* All Rights Reserved !!!
*/
public class Main {
public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
//        Scanner scanner = new Scanner(Main.class.getClassLoader().getResourceAsStream("data.txt"));
while (scanner.hasNext()) {
String input = scanner.nextLine();
int n = scanner.nextInt();
System.out.println(maxRatio(input, n));
}

scanner.close();
}

/**
* 初始化两个数组,一个序列数值数组K
,一个序列和数组SUM
,先遍历一边序列,
* 为C或者G则K[i]为1,否则则置为0,然后计算连续M个K[I]之和存入SUM就行。
*
* @param s
* @param m
* @return
*/
private static String maxRatio(String s, int m) {
int[] k = new int[s.length()];
int[] sum = new int[s.length()];
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
if (c == 'C' || c == 'G') {
k[i]++;
}
}

for (int i = 0; i < k.length - m; i++) {
for (int j = 0; j < m; j++) {
sum[i] += k[i + j];
}
}

int max = 0;
int idx = 0;
for (int i = 0; i < k.length - 1; i++) {
if (sum[i] > max) {
max = sum[i];
idx = i;
}
}

return s.substring(idx, idx + m);
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: