Format CLUSTAL
Il s'agit d'un format standard d'alignement de séquences nucléotidiques ou protéiques. C'est le format de sortie de l'outil d'alignement multiple ClustalW. Le mot CLUSTAL figure sur la première ligne du fichier. L'alignement est divisé en bloc de longueur fixe où chaque ligne de ce bloc correspond à une séquence. Chaque ligne de chaque bloc commence avec le nom de la séquence (sur un nombre de caractères limité, maximum 10), suivi d'au moins un espace. La séquence est ensuite représentée: en majuscules ou minuscules, les gaps sont indiqués par des tirets hauts "-". Le nombre de résidus est parfois ajouté à la fin de la première ligne de chaque bloc.
Exemple d'un alignement en format CLUSTAL
CLUSTAL W (1.8) multiple sequence alignment 1 60 TRGJ1_01 ------------GAATTATTATAAGAAACTCTTTGGCAGTGGAACAACACTGGTTGTCAC TRGJ2_01 ------------GAATTATTATAAGAAACTCTTTGGCAGTGGAACAACTCTTGTTGTCAC TRGJP_01 TGGGCAAGAGTTGGGCAAAAAAATCAAGGTATTTGGTCCCGGAACAAAGCTTATCATTAC TRGJP1_01 --------ATACCACTGGTTGGTTCAAGATATTTGCTGAAGGGACTAAGCTCATAGTAAC TRGJP2_01 --------ATAGTAGTGATTGGATCAAGACGTTTGCAAAAGGGACTAGGCTCATAGTAAC ** **** ** ** * ** * * ** 61 68 TRGJ1_01 AG------ TRGJ2_01 AG------ TRGJP_01 AG------ TRGJP1_01 TTCACCTG TRGJP2_01 TTCGCCTG