Pierre Andrieu - Agrégation de classements pour les données biologiques : évaluer la qualité des classements consensuels obtenus.
21 October 2021, 00:00 Salle/Bat : 435/PCRI-N
Contact :
Activités de recherche :
Résumé :
Les médecins et biologistes sont régulièrement amenés à interroger des bases de données biologiques publiques, par exemple lorsqu’ils se renseignent sur les gènes les plus associés à une maladie donnée. Le mot-clé choisi au moment d’interroger la base de données est particulièrement important : plusieurs reformulations synonymes d’une même maladie (par exemple « breast cancer » et « breast carcinoma ») aboutissent à des classements parfois très différents pouvant aller jusqu’à plusieurs milliers de gènes. L’enjeu est alors de combiner l’information apportée par ces différents classements de gènes. La problématique consistant à partir d’une liste de classements et à calculer un classement dit consensuel aussi représentatif que possible des classements d’entrée est appelée « agrégation de classements ». Un enjeu majeur est alors de pouvoir évaluer la qualité du classement consensuel obtenu. Le but de l’exposé est de présenter des éléments de réponse et des pistes de travail en vue d’établir des critères de qualité.