Analyse bioinformatique et biostatistique

Notre expertise s’étend jusqu’à l’analyse bioinformatique et/ou bio-statistique de vos données. Nous avons mis en place différents pipelines d’analyse automatisés, basés sur les meilleurs algorithmes du moment. Nous disposons de plusieurs dizaines de serveurs de calcul pour les faire tourner, ainsi que des capacités de stockage nécessaires.

Les volumes et la qualité des données produites par les nouvelles générations de séquenceurs changent régulièrement. Notre laboratoire s’adapte continuellement et propose le développement d’utilitaires pour vous répondre et obtenir le meilleur de vos données : alignement et découverte de variants par le séquençages d’exomes et de génomes, annotation des variants découverts à partir de données publiques (Ensembl, Encode, …), études familiales et épigénétiques telles que l’étude de transcriptomes ou de méthylomes et d’interactions protéines-ADN. Nous produisons également diverses statistiques vous assurant le contrôle de la qualité des données générées.

Equipe bio-statistique

Qui sommes nous?

L’équipe de biostatistique est en charge des analyses statistiques et contribue à l’élaboration du design des études, notamment dans le cadre des demandes de financements. L’équipe comporte quatre membres et est supervisée par Mickaël Canouil (Ph.D.).

Que faisons-nous?

La génétique de l’obésité et du diabète de type 2 (DT2) a fait des progrès significatifs au cours des dernières années. Un nombre conséquent de variations génétiques a ainsi pu être associé à la susceptibilité au DT2 par de nombreuses équipes de recherche dont la nôtre. Toutefois, les variations génétiques découvertes à ce jour n’expliquent qu’une faible part de l’héritabilité attendue de traits phénotypiques comme l’obésité et le DT2. Dans ce contexte, l’objectif principal de notre équipe consiste à apporter un soutien méthodologique fort aux différentes stratégies proposées par le laboratoire pour explorer l’héritabilité manquante. Ces stratégies comprennent la hiérarchisation des gènes par leur pertinence dans les mécanismes physiologiques conduisant à la maladie, les tests d’association à partir de variants rares, et plus récemment l’exploration du rôle des marques épigénétiques dans la susceptibilité au DT2. À cela s’ajoute, du développement méthodologiques et d’outils de visualisation, pour analyser les données issues des technologies de séquençages à haut débit (p. ex., MethylSeq, RNAseq, etc.).

Nos réalisations

Notre équipe a développé et mis en place une chaine de traitement pour annoter et classer les gènes exploitant les bases de données internes et publiques (p. ex., NCBI, dbSNP, HugeNavigator et UCSC). Nous avons mis en place un plan d’analyse pour tester l’association de variants rares avec le DT2 et l’obésité à partir de données de génotypages et/ou de séquençages. Comme le profil de méthylation d’un individu est de plus en plus soupçonné de jouer un rôle dans la susceptibilité au diabète, nous avons construit un pipeline pour les analyses de méthylation à l’échelle du génome, notamment pour des technologies de puces.
Notre expertise dans l’utilisation du programme R et des extensions qui lui sont associées, nous a permis de développer des applications « Shiny » pour la visualisation et l’analyse de données de différentes natures et en particulier les données de transcriptomiques (p. ex., NanoString, qPCR, etc.), ainsi que des outils dynamiques de calcul de puissance statistique, dans un rôle de soutien de l’activité de recherche du laboratoire.

Expertise

  • Etude d’association pan-génomique :
    • transversale et longitudinale,
    • en cas-contrôle et en familial.
  • Détection d’évènements chromosomiques (mosaïque / CNV).
  • Priorisation de gènes.
  • Analyses de données transcriptomiques, épigénétiques et métabolomiques.

Pipelines & Packages

Publications

  • [2018] Canouil, M., Balkau, B., Roussel, R., Froguel, P., & Rocheleau, G. (2018). Jointly modelling single nucleotide polymorphisms with longitudinal and time-to-event trait: An application to type 2 diabetes and fasting plasma glucose. Frontiers in Genetics, 9. https://doi.org/10.3389/fgene.2018.00210
  • [2016] Yengo, L., Arredouani, A., Marre, M., Roussel, R., Vaxillaire, M., Falchi, M., Haoudi, A., Tichet, J., Balkau, B., Bonnefond, A., & Froguel, P. (2016). Impact of statistical models on the prediction of type 2 diabetes using non-targeted metabolomics profiling. Molecular Metabolism, 5(10), 918–925. https://doi.org/10.1016/j.molmet.2016.08.011
  • [2016] Yengo, L., Jacques, J., Biernacki, C., & Canouil, M. (2016). Variable clustering in high-dimensional linear regression: The r package clere. The R Journal, 8(1), 92–106. https://doi.org/https://journal.r-project.org/archive/2016/RJ-2016-006/

 

Bio-informatique

L’équipe de bioinformatique est composée de 4 bioinformaticiens. Elle assure :

  • La gestion et l’analyse des données issues des séquenceurs à haut-débit des projets du laboratoire, dont les études “exome entier” (WES) sur le diabète de type 2 et l’obésité
  • La gestion et l’analyse des données issues des séquenceurs à haut-débit lors de prestations de service LIGAN-PM (WES, WGS, RNA-seq, miRNA-seq, Met-seq, ChIP-seq, Capture-C, CNV detection from Exome…)
  • La sélection et la validation, ou le développement, puis l’intégration, d’outils logiciels pour l’acquisition, l’analyse et l’aide à l’interprétation des résultats
  • Le développement de pipelines d’analyses et leur maintien par l’utilisation des méthodes les plus récentes (Nextflow, Slurm, …)
  • L’intégration de nouvelles plateformes de séquençage à haut débit
  • La maintenance d’une base de données intégrative (GOOD)
  • La gestion et l’extension des bases de données cliniques
  • La gestion des ressources informatiques (serveurs, espaces de stockage, bases de données, logiciels)
  • L’augmentation des capacités informatiques en termes de puissance de calcul et de stockage de données

Nos principaux projets de développements futurs sont :

  • Le développement d’une interface en ligne pour la mise à disposition des résultats