Jean-Paul Comet
INRIA Domaine du Voluceau
Rocquencourt BP 105
78153 Le Chesnay cedex
La comparaison et l'alignement de séquences biologiques (recherche des similarités locales entre deux chaines de caractères) constituent un point clefs de la biologie moléculaire. La méthode la plus rigoureuse, reste la programmation dynamique: sa complexité est quadratique. Les algorithmes de Needleman-Wunsch et de Smith-Waterman peuvent être vus comme une suite d'opérations élémentaires dans l'algèbre (max,+). Lors de la comparaison de deux séquences A[1,n] et B[1,m], de longueurs respectives n et m, on itère n fois la multiplication dans l'algèbre (max,+) d'un vecteur ligne de taille m par une matrice triangulaire supérieure :
Le semi-groupe engendré par l'ensemble des matrices est fini ou projectivement fini. Il s'en suit que l'ensemble des produits consécutifs des matrices peut être précalculé et qu'un automate peut être construit pour répondre au problème de l'alignement de séquences par programmation dynamique.