:: Enseignements :: Master :: M2 :: 2007-2008 :: Stages ::
![[LOGO]](http://igm.univ-mlv.fr/ens/resources/mlv.png) | Requêtes dans les réseaux d'intéractions protéiques |
Ce stage concerne le domaine de l'Algorithmique au sein de la thématique
AlgoB.
Lieu du stage
Ce stage est à effectuer au sein du Laboratoire d'informatique de l'Institut Gaspard Monge qui
se situe à
l'Université Paris-Est Marne-la-Vallée
5, boulevard Descartes
Champs sur Marne
77454 Marne-la-Vallée Cedex 2
Encadrement
- Responsable de stage : Guillaume Blin - gblin@univ-mlv.fr
- Directeur du laboratoire d'accueil : Gilles Roussel - gilles.roussel@univ-mlv.fr
Présentation générale du domaine
L'achèvement de l'analyse et du séquençage des génomes de plusieurs organismes a
été marqué par une surprise de taille pour les généticiens : l'homme n'a que 25 000 à 30 000
gènes, soit seulement deux fois plus que la mouche du vinaigre (13 600 gènes) et bien moins
que le riz (50 000 gènes).
Et si la complexité de l'espèce humaine résidait en partie dans les protéines ? Le
nombre et la fonction biologique de la plupart de ces molécules codées par les gènes ne sont
pas encore connus. Un même gène peut en effet détenir l'information utile à la fabrication de
plusieurs formes d'une même protéine. Ces formes aboutissent à des fonctions très variées,
d'où l'intérêt de l'étude des protéines : la protéomique.
Le nombre d'interactions entre protéines est considérable. L'exploration de ces réseaux
protéiques complexes nécessite des méthodologies adaptées ainsi que des outils bioinformatiques
puissants pour les analyser.
La recherche de voies métaboliques (molecular pathways) au sein de bases
de données d'intéractions est un problème important de la bio-informatique. Les recherches
récentes se sont limitées à des requêtes simples - sous la forme de chemins ou de réseaux
simples (forêts ou graphes ayant une largeur arborescente bornée).
Objectifs du stage
En tenant compte des recherches récentes basées sur la technique de "color coding"
de Alon et al. ("color coding" est une technique aléatoire pour trouver
des chemins ou cycles simples d'une longueur fixée dans un graphe), l'ojectif premier
de ce stage concerne l'extension de la classe des voies métaboliques pouvant être efficacement
utilisées dans des requêtes, i.e., fournir des outils algorithmiques permettant de gérer
des requêtes sous forme de graphes (généraux) en prenant en compte d'éventuelles erreurs au sein
de la requête ou du réseau. En particulier, la classe de graphes ayant un "vertex
feedback set" borné (i.e. l'ensemble minimal de sommets à supprimmer d'un graphe pour le rendre acyclique)
doit être étudiée. Le second objectif du stage est d'implémenter un outil permettant
les requêtes sous forme de graphes. En prenant en compte la taille importante des réseaux
à comparer, l'efficacité (en temps) devra être la priorité.
Compétences espérées
Algorithmique, Programmation (aucune connaissance en biologie n'est, a priori,
requise)
Références
- [1] Algorithm Engineering for Color-Coding with Applications to Signaling Pathway Detection by
Falk Hüffner, Sebastian Wernicke and Thomas Zichner [pdf]
- [2] Color-coding: a new method for finding simple paths, cycles and other small subgraphs within large graphs ∗
by Noga Alon, Raphy Yuster and Uri Zwick [pdf]
- [3] QNet: A Tool for Querying Protein Interaction Networks by
Banu Dost, Tomer Shlomi, Nitin Gupta, Eytan Ruppin, Vineet Bafna and Roded Sharan [pdf]
© Université de Marne-la-Vallée