DNA序列题解

目录

原题描述:

题目描述

时间:1s 空间:256M

题目描述:

输入格式:

输出格式:

样例1输入:

样例1输出:

约定与提示:

主要思路:

求最优解:

ACcode(有注释):


原题描述:

题目描述

时间:1s 空间:256M

题目描述:

给出 n 个长度最长为5,仅包含 'A', 'T', 'C', 'G' 这 4 种字母的DNA子序列字符串,求一个最短的DNA母串,能够包含全部的DNA子序列。

输入格式:

第一行包含一个整数 n

接下来 n 行,每行一个字符串,仅包含'A', 'T', 'C', 'G' 44 种字母。

输出格式:

输出一个整数表示答案。

样例1输入:

4
ACGT
ATGC
CGTT
CAGT

样例1输出:

8

约定与提示:

对于100%的数据,1 \le n \le 8

样例解释如图:

img

主要思路:

考虑暴力,每次枚举四种情况,复杂度:O(4^n)

所以要加一些剪枝。

我们从最开始的时候,求一个最优解,从最优解开始枚举len,接着dfs,如果当前x+当前最优解所需字符长度>枚举的len,就直接结束。

求最优解:

就是把四种字符出现次数取个max,最后相加。

ACcode(有注释):

#include<bits/stdc++.h>
using namespace std;
int tmp[1010];//待选中的字符序列
int cnt[1010][1010];//记录字符出现了几次
int n;
int a[1010][1010];//记录字符序列(为了好操作)A = 0,T = 1,C = 2,G = 3,a[i][0]是第i个字符串的长度
int b[1010];
int calc()//求最优需要多少个字符(当啥都没选的时候)
{
	for(int i=1;i<=n;i++)//枚举每个字符串
	{
		for(int j=1;j<=a[i][0];j++)
		{
			cnt[i][a[i][j]]++;//统计出现次数
		}
		for(int j=0;j<4;j++)
		{
			b[j] = max(b[j],cnt[i][j]);//算最值
		}
	}
	int ans=0;
	for(int i=0;i<4;i++)
	{
		ans += b[i];//加起来
	}
	return ans;
}
int calc1(int len)//求1~len匹配后最值
{
	memset(b,0,sizeof(b));//清空数组
	for(int i=1;i<=n;i++)//枚举每个字符串
	{
		vector<int> cnt(10);//统计字符
		int k=1;
		for(int j=1;j<=len;j++)//匹配
		{
			if(k<=a[i][0]&&tmp[j] == a[i][k])//匹配上了
			{
				k++;//加1
			}
		}
		for(int j=k;j<=a[i][0];j++)//从没匹配上位置开始
		{
			cnt[a[i][j]]++;//统计出现次数
		}
		for(int j=0;j<4;j++)
		{
			b[j] = max(b[j],cnt[j]);//算最值
		}
	}
	int ans=0;
	for(int i=0;i<4;i++)
	{
		ans += b[i];//加起来
	}
	return ans;
}
bool dfs(int x,int y,int len)//x是当前位置,y是最优情况下还需要多少字母才成立,len是目标长度
{
//	cout<<x<<' '<<y<<'\n';
	if(x+y>len+1)//如果最优情况都不满足,就说明不可行
	{
		return 0;
	}
	if(x == len+1)//如果成功,返回成功。
	{
		return 1;
	}
	for(int i=0;i<4;i++)//枚举当前字符
	{
		tmp[x] = i;
		int tmp1=calc1(x);
		if(dfs(x+1,tmp1,len))//如果已经成功,就不用再算了,返回
		{
			return 1;
		}
	}
	return 0;
}
int main()
{
	ios::sync_with_stdio(0);
	cin.tie(0);
	cin>>n;
	for(int i=1;i<=n;i++)
	{
		string s;
		cin>>s;
		a[i][0] = s.size();//记录长度
		for(int j=0;j<a[i][0];j++)//映射
		{
			if(s[j] == 'A')
			{
				a[i][j+1] = 0;
			}
			else if(s[j] == 'T')
			{
				a[i][j+1] = 1;
			}
			else if(s[j] == 'C')
			{
				a[i][j+1] = 2;
			}
			else if(s[j] == 'G')
			{
				a[i][j+1] = 3;
			}
		}
	}
	int start = calc();//从最优开始枚举
//	cout<<start<<'\n';
	for(int i=start;;i++)//枚举
	{
		if(dfs(1,start,i))//成功,结束
		{
			cout<<i;
			exit(0);
		}
	}
	return 0;
}

相关推荐

  1. Leetcode 187. 重复的DNA序列

    2024-03-13 22:22:01       32 阅读
  2. c++计算DNA序列信息熵代码

    2024-03-13 22:22:01       34 阅读
  3. 力扣题解(摆动序列

    2024-03-13 22:22:01       23 阅读
  4. 力扣_字符串10—重复的DNA序列

    2024-03-13 22:22:01       49 阅读
  5. 序列的第 k 个数(c++题解)

    2024-03-13 22:22:01       53 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-13 22:22:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-13 22:22:01       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-13 22:22:01       82 阅读
  4. Python语言-面向对象

    2024-03-13 22:22:01       91 阅读

热门阅读

  1. 学习记录之数学表达式(1)

    2024-03-13 22:22:01       33 阅读
  2. ReentrantReadWriteLock学习

    2024-03-13 22:22:01       41 阅读
  3. Python中,括号内部的for循环(列表推导式)

    2024-03-13 22:22:01       41 阅读
  4. 使用Ora2Pg迁移oracle数据到openGauss

    2024-03-13 22:22:01       40 阅读
  5. Qualcomm AI Hub-API介绍

    2024-03-13 22:22:01       43 阅读
  6. C++标准输入输出和名字空间

    2024-03-13 22:22:01       44 阅读
  7. C#接口和泛型

    2024-03-13 22:22:01       47 阅读
  8. python面向对象练习一

    2024-03-13 22:22:01       42 阅读
  9. 【SpringCloud微服务实战05】Feign 远程调用

    2024-03-13 22:22:01       49 阅读