Différence entre similarité et identité dans l'alignement de séquence

Table des matières:

Différence entre similarité et identité dans l'alignement de séquence
Différence entre similarité et identité dans l'alignement de séquence

Vidéo: Différence entre similarité et identité dans l'alignement de séquence

Vidéo: Différence entre similarité et identité dans l'alignement de séquence
Vidéo: TP alignement, bio informatique M2 biochimie OEB 2024, Décembre
Anonim

La principale différence entre la similarité et l'identité dans l'alignement des séquences est que la similarité est la similarité (ressemblance) entre deux séquences en comparaison tandis que l'identité est le nombre de caractères qui correspondent exactement entre deux séquences différentes.

La bioinformatique est un domaine scientifique interdisciplinaire qui implique principalement la biologie moléculaire et la génétique, l'informatique, les mathématiques et les statistiques. L'alignement de séquences est un terme majeur en bioinformatique. C'est la procédure dans laquelle les séquences d'ADN, d'ARN ou de protéines sont arrangées pour identifier les régions de ressemblance qui sont une conséquence de la relation fonctionnelle, structurelle ou évolutive entre les séquences. À la fin de l'alignement, ils seront présentés sous forme de rangées dans une matrice. Afin d'aligner les caractères identiques dans des colonnes successives, des espaces insérés sont présents entre les résidus.

Qu'est-ce que la similarité ?

La similarité dans l'alignement des séquences est la ressemblance entre deux séquences lorsqu'elles sont comparées. Ce fait dépend de l'identité des séquences. La similarité représente la mesure dans laquelle les résidus sont alignés. Par conséquent, des séquences similaires contiennent des propriétés similaires. En bioinformatique, la similarité est un outil pour évaluer la ressemblance entre deux protéines.

Différence entre similarité et identité dans l'alignement de séquence
Différence entre similarité et identité dans l'alignement de séquence

Figure 01: Similitude dans l'alignement de séquence

Il y a deux étapes principales pour séquencer le processus d'alignement. L'étape initiale est l'alignement par paires, qui aide à trouver l'alignement optimal entre deux séquences (y compris les lacunes) à l'aide d'algorithmes tels que BLAST, FastA et LALIGN. L'algorithme de correspondance trouve le nombre minimum d'opérations d'édition; in-dels et substitutions afin d'aligner une séquence sur l'autre séquence. Après alignement par paires, il est nécessaire d'obtenir deux paramètres quantitatifs à partir de chaque comparaison par paires. Ils sont identité et similarité.

Qu'est-ce que l'Identité ?

L'identité dans l'alignement des séquences est le nombre de caractères qui correspondent exactement entre deux séquences différentes. Par conséquent, les lacunes ne comptent pas lors de l'évaluation de l'identité. La mesure est considérée comme étant liée à la séquence la plus courte parmi les deux séquences. Cela implique de manière significative qu'il a un effet là où l'identité de séquence n'est pas transitive. Si X=Y et Y=Z, alors X n'est pas nécessairement égal à Z. Ceci est déduit en termes de mesure de distance d'identité.

Différence clé - similarité vs identité dans l'alignement de séquence
Différence clé - similarité vs identité dans l'alignement de séquence

Figure 02: Identité dans l'alignement de séquence

Par exemple, X a une séquence de AAGGCTT, Y a une séquence de AAGGC et Z a une séquence de AAGGCAT. L'identité entre X et Y est de 100 % {5 nucléotides identiques / min[longueur(X), longueur(Y)]}. L'identité entre Y et Z est également de 100 %. Mais l'identité entre X et Z n'est que de 85 % {(6 nucléotides identiques / 7)}.

Quelles sont les similitudes entre similarité et identité dans l'alignement de séquence ?

  • La similarité et l'identité sont deux termes que nous utilisons dans l'alignement de séquences.
  • De plus, ils font référence à la ressemblance entre les deux séquences.
  • De plus, nous les exprimons en pourcentage.

Quelle est la différence entre similarité et identité dans l'alignement de séquence ?

La similarité dans l'alignement indique la ressemblance entre deux séquences lorsqu'elles sont comparées, tandis que l'identité dans l'alignement de séquence indique la quantité de caractères qui correspondent exactement entre deux séquences différentes. C'est donc la principale différence entre la similarité et l'identité dans l'alignement des séquences.

Différence entre similarité et identité dans l'alignement de séquence - Forme tabulaire
Différence entre similarité et identité dans l'alignement de séquence - Forme tabulaire

Résumé - Similitude vs Identité dans l'alignement de séquence

L'alignement des séquences aide à identifier les régions de ressemblance dans l'ADN, l'ARN ou les protéines résultant d'une relation fonctionnelle, structurelle ou évolutive entre les séquences. Par conséquent, la similarité et l'identité sont deux termes clés dans le contexte de l'alignement de séquences. le différence clé entre ces deux termes est que la similitude est la ressemblance entre deux séquences en comparaison tandis que l'identité est le nombre de caractères qui correspondent exactement entre deux séquences différentes. Ainsi, c'est le résumé de la différence entre la similarité et l'identité dans l'alignement des séquences.

Conseillé: