问题描述:
输入m个长度均为n的DNA序列,求一个DNA序列,到所有序列的总Hamming距离尽量 小。两个等长字符串的Hamming距离等于字符不同的位置个数,例如,ACGT和GCGA的 Hamming距离为2(左数第1, 4个字符不同)。
输入整数m和n(4≤m≤50, 4≤n≤1000),以及m个长度为n的DNA序列(只包含字母 A,C,G,T),输出到m个序列的Hamming距离和最小的DNA序列和对应的距离。如有多 解,要求为字典序最小的解。例如,对于下面5个DNA序列,最优解为TAAGATAC。
TATGATAC
TAAGCTAC
AAAGATCC
TGAGATAC
TAAGATGT
解决方案:
每列字母出现最多的且字典序相对较小的为最优解该列字母
#include<stdio.h>
#include<string.h>
int main(){int m,n;char p[50][1000],b[1000];int na,nt,nc,ng,i,j; printf("请输入m,n:"); scanf("%d%d",&m,&n); //m为行n为列 printf("输入相应的DNA序列\n"); for(i=0;i<m;i++) //可以按回车依次输入下一行DNA序列 scanf("%s",&p[i]); printf("\n");for(i=0;i<n;i++){na=0,nt=0,nc=0,ng=0;for(j=0;j<m;j++){switch(p[j][i]){case 'A':na+=1;break;case 'C':nc+=1;break;case 'G':ng+=1;break;case 'T':nt+=1;break;}}if(na>=nc&&na>=nt&&na>=ng) b[i]='A';if(nc>=na&&nc>=nt&&nc>=ng) b[i]='C';if(ng>=na&&ng>=nc&&ng>=nt) b[i]='G';if(nt>=na&&nt>=nc&&nt>=ng) b[i]='T';}for(i=0;i<n;i++){printf("%c",b[i]);}return 0;
}