Nouvel outil pour comprendre l'évolution des gènes multi-domaine Développé

Admin Mai 14, 2015 Santé 133 0
FONT SIZE:
fontsize_dec
fontsize_inc

Carnegie Mellon scientifiques ont découvert des failles critiques dans la méthode standard utilisée pour analyser l'évolution du gène. Les méthodes standard échouent lorsqu'il est appliqué à des gènes codant pour les protéines multidomaines, une classe importante de protéines cruciales pour la santé humaine.

Biologiste Computational Dannie Durand et ses collègues ont pour la première fois il a fait face au dilemme de la façon d'étudier l'ascendance de gènes multi-domaines.

Identifier correctement l'ascendance génétique est l'un des piliers de la génomique de calcul. Les gènes transmis à partir d'un ancêtre commun ont tendance à exécuter les mêmes fonctions dans la cellule. Les scientifiques exploitent cette similitude pour effectuer des tâches telles prédire la fonction des gènes, la cartographie des régions chromosomiques humaines régions organismes modèles correspondants, et de reconstruire le circuit réglementaire qui tourne gènes sur et en dehors.


Bien que les biologistes ont développé des méthodes de calcul pour identifier les gènes qui partagent un ancêtre commun, les méthodes actuelles qui mènent à des conclusions fausses lorsque les gènes codent pour des protéines appliquées multi-domaine. Les domaines sont des fragments de séquences qui codent pour les éléments de base de la structure des protéines. Evolution fait de nouveaux gènes en mélangeant les domaines dans de nouvelles combinaisons, tout comme un enfant de construire une maison, une voiture et un hélicoptère de la même kit LEGO en combinant des blocs LEGO de différentes manières. Ce processus, appelé domaine brassage, crée des protéines complexes qui exécutent des tâches spécifiques comme la communication cellulaire critique et se liant à d'autres cellules. Lorsque l'un de ces protéines échoue, le cancer est souvent le résultat. brassage de domaine permet une évolution rapide de nouvelles protéines, mais permet également presque impossible pour les scientifiques afin de déterminer leur origine.

Dans un article publié en ligne Public Library of Science Computational Biology 15 mai, l'équipe de Durand présente une nouvelle méthode pour déterminer si une paire de gènes similaires évolué à partir d'un ancêtre commun, ou si vous regardez similaire, parce que le même domaine a été inséré à la fois gènes. Leur méthode, appelée "Corrélation de Quartier", est le premier à se attaquer à ce problème.

"Nous avions besoin d'une approche totalement nouvelle de déterminer quels multi-domaine protéines partagent un ancêtre commun, et nous sommes le premier groupe à proposer un tel procédé", a déclaré Durand. "La nôtre est la première approche pour définir et analyser ancêtre commun verticale traditionnelle, bien qu'il se produise domaine brassage."

Région corrélation exploite la structure d'un réseau de similarité de séquence statistiquement pondérés pour différencier les gènes multi-domaines avec ascendances partagées provenant de gènes multi-domaines qui résultent de domaine brassage. Duplication crée une signature spécifique dans le réseau, tandis que le domaine d'insertion crée une signature des caractéristiques différentes. District corrélation capture ces signatures, donnant couple fortunes par duplication, et donc part d'un ancêtre commun, un score supérieur gènes qui partagent un domaine inséré, mais pas un ancêtre commun.

Les scientifiques corrélation trimestre au Carnegie Mellon testés contre 20 familles de protéines kinases, - y compris la plus grande famille multi-domaine trouvées chez l'homme - dont les relations ancestrales sont bien établis à travers laboratoire basé sur la recherche. L'outil a très bien fonctionné à tester des modèles d'évolution génétique multi-domaine ancestral dans ces familles, beaucoup mieux que les outils que nous utilisons aujourd'hui, Durand dit.

Outils de calcul aujourd'hui séquence d'utilisation similitude, en supposant que les gènes avec des séquences similaires indiquent ancêtre commun. Ces méthodes utilisent la longueur de la région similaire à exclure similitude surgi car les domaines insérés. Ils raisonnent que plus la séquence partagée par deux gènes multi-domaine, plus il est probable que ces deux gènes partagent un ancêtre commun.

Mais les tests ont montré que cette hypothèse Durand souvent ne tient pas. Son équipe a trouvé des résultats inquiétants quand ils ont comparé la similarité de séquence avec leur méthode de corrélation dans l'évaluation des familles du District 20 gènes avec des histoires consolidées. La méthode de similarité de séquence effectivement produit associations fausses ancestrales et a manqué de véritables relations ancestrales.

District corrélation est un succès parce qu'il faut à la fois la duplication de gènes et le domaine de l'insertion en compte.

"Non seulement nous avons montré que la corrélation de Quartier fonctionne de manière empirique, nous fournissons également un argument évolutionniste adéquatement pourquoi il devrait fonctionner», a déclaré Durand. "Nos résultats montrent que l'organisation du réseau de similarité de séquence contient des traces de processus évolutifs anciens. Cela a des implications intéressantes pour de futures études. Nous espérons que la comparaison des réseaux séquence de similarité de différentes espèces va révéler comment les processus d'évolution diffèrent dans les plantes, les animaux et des champignons », a déclaré Durand. "Multicellularité évolué indépendamment dans chacun de ces groupes. Pour aller d'une cellule unique à de nombreuses cellules agissant de concert, chaque fois que la nature avait à résoudre les mêmes problèmes de communication et de contrôle cellulaire. Mais les solutions sont les mêmes dans chaque course" comment ces problèmes ont été résolus est une question fascinante. "

Bien que conçu pour les familles multi-domaines, Durand note que Corrélation de Quartier prédit aussi précisément ascendance dans les séquences de domaine unique. Les chercheurs espèrent que les scientifiques commenceront à se appliquer l'analyse des études de génomique pour mieux comprendre le rôle des protéines multidomaines jouer dans l'évolution des événements importants, tels que l'émergence d'animaux multicellulaires et le système immunitaire des vertébrés.

D'autres auteurs de l'étude comprennent de Carnegie Mellon Nan Song, Jacob Joseph et George Davis. membres de l'équipe sont affiliés au Centre Ray et Stephanie Lane de biologie computationnelle, le Département des sciences biologiques et de la School of Computer Science.

L'étude a été financée par la National Science Foundation, National Institutes of Health et la Fondation David et Lucille Packard.

  Like 0   Dislike 0
Commentaires (0)
Sans commentaires

Ajouter un commentaire

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Caractères restants: 3000
captcha