IMGT®, the international ImMunoGeneTics information system®

logo IMGT

Format CLUSTAL

en

Il s'agit d'un format standard d'alignement de séquences nucléotidiques ou protéiques. C'est le format de sortie de l'outil d'alignement multiple ClustalW. Le mot CLUSTAL figure sur la première ligne du fichier. L'alignement est divisé en bloc de longueur fixe où chaque ligne de ce bloc correspond à une séquence. Chaque ligne de chaque bloc commence avec le nom de la séquence (sur un nombre de caractères limité, maximum 10), suivi d'au moins un espace. La séquence est ensuite représentée: en majuscules ou minuscules, les gaps sont indiqués par des tirets hauts "-". Le nombre de résidus est parfois ajouté à la fin de la première ligne de chaque bloc.

Exemple d'un alignement en format CLUSTAL

CLUSTAL W (1.8) multiple sequence alignment
1                                                         60
TRGJ1_01        ------------GAATTATTATAAGAAACTCTTTGGCAGTGGAACAACACTGGTTGTCAC
TRGJ2_01        ------------GAATTATTATAAGAAACTCTTTGGCAGTGGAACAACTCTTGTTGTCAC
TRGJP_01        TGGGCAAGAGTTGGGCAAAAAAATCAAGGTATTTGGTCCCGGAACAAAGCTTATCATTAC
TRGJP1_01       --------ATACCACTGGTTGGTTCAAGATATTTGCTGAAGGGACTAAGCTCATAGTAAC
TRGJP2_01       --------ATAGTAGTGATTGGATCAAGACGTTTGCAAAAGGGACTAGGCTCATAGTAAC
**    ****     ** ** *  **  *  * **
61    68
TRGJ1_01        AG------
TRGJ2_01        AG------
TRGJP_01        AG------
TRGJP1_01       TTCACCTG
TRGJP2_01       TTCGCCTG