Reconstituer l'histoire évolutive d'une famille multigénique
Une famille multigénique est constituée de gènes partageant une grande similitude de séquence nucléotidique (>20%). Ils codent donc des protéines dont les séquences en acides aminés se ressemblent. Les familles multigéniques émergent suite à des événements de duplication génique résultant de crossing-over inégaux pendant la méiose.
Plus la similitude de séquence entre deux gènes est grande, plus leur parenté est forte. Autrement dit, l'événement de duplication qui leur a donné naissance à partir d'un gène ancestral est d'autant plus récent que leur séquence, ou par extension celles des protéines qu'ils codent, se ressemblent. Cela est dû à l'accumulation de mutations dans les gènes au cours du temps.
Pour reconstituer l'histoire évolutive d'une famille multigénique, il faut donc commencer par comparer les séquences (c'est-à-dire réaliser un alignement de séquence). Une fois les séquences alignées, on peut mesurer leur ressemblance en calculant une matrice de distance. Enfin, cette matrice de distance peut-être convertie en un arbre de parenté.
Vous pouvez voir à titre d'exemple l'histoire évolutive reconstituée de la famille multigénique des globines de l'homme.