La psychiatrie à l’heure des « omiques »
La mise en place et le regroupement de cohortes au niveau du GDR-3557 est une opportunité pour constituer de grandes collections bio-cliniques dans le domaine de la psychiatrie à l’échelon national, et permettre le rapprochement de données avec les cohortes internationales.
La complexité des maladies psychiatriques nécessite ainsi de nouvelles approches méthodologiques, d’autant que notre spécialité regorge de syndromes variés recoupant des réalités biologiques hétérogènes. Les données issues d’études sur les troubles psychiatriques sont particulièrement complexes, en partie redondantes, et surtout abondantes. Les projets peuvent désormais comprendre plusieurs couches de données génétiques, épigénomiques, transcriptomiques, métabolomiques, protéomiques mais également des données d’imagerie, de cognition ou encore cliniques (ou phénomiques) de plus en plus vastes.
Les données générées doivent être harmonisées pour pouvoir être partagées et permettre des analyses multimodales et multiniveaux.
A l’heure de larges ensembles de données (“big data”), seule une analyse robuste et intégrative permettra de répondre aux questions posées et de comprendre des systèmes aussi complexes que les maladies psychiatriques.
Pour optimiser ce processus de formation et d’innovation, l’institut de psychiatrie propose de développer 2 clubs d’échanges et de travail en bio-statistique « PsyStatOmics » et en « PsyPhenomics ». Ces clubs sont ouverts aux chercheurs et cliniciens désireux de se former aux outils bioinformatiques et statistiques couramment utilisés ou d’échanger sur leurs pratiques. Les membres du club possédant un niveau avancé peuvent également être sollicités pour apporter une expertise spécifique, une aide méthodologique ou pour collaborer à des travaux communs.
PsyStatOmics : Club d’échange et de travail sur les analyses bio-statistiques en psychiatrie
Responsables : Boris Chaumette / Anton Iftimovici
La mise en place et le regroupement de cohortes biologiques au niveau du GDR-3557 est une opportunité pour constituer de grandes collections bio-cliniques dans le domaine de la psychiatrie à l’échelon national. Cependant les données ainsi générées vont devoir être harmonisées et analysées. De plus, les analyses évoluent vers des approches multimodales et multi-niveaux. Les projets peuvent désormais comprendre plusieurs couches de données génétiques, épigénomiques, transcriptomiques, métabolomiques, protéomiques mais également des données d’imagerie ou cliniques de plus en plus vastes, engendrant de larges ensembles de données (“big data”) dont seule une analyse robuste et intégrative permettra de répondre aux questions posées et de comprendre des systèmes aussi complexes que les maladies psychiatriques.
Plusieurs défis sont notamment à surmonter:
- La quantité de dimensions considérées toujours croissante nécessite l’application de stratégies robustes, de sélection de variables d’une part, ou de techniques de pénalisation au sein de validations croisées d’autre part (par apprentissage supervisé par exemple).
- La réplication et généralisation des résultats d’un ensemble de données à un autre apparaît nécessaire à la validation des résultats obtenus.
- L’intégration de données multimodales et multi-niveaux requiert de considérer plusieurs types d’approches: soit, de manière “hiérarchique”, en validant les résultats obtenus à un niveau, par ceux d’un autre (e.g. les groupes obtenus en imagerie ont-ils des correspondances en clinique, protéomique ou génétique, et vice versa ?), soit de manière plus “égalitaire”, en combinant simultanément différents niveaux (par exemple au sein de stratégies de décomposition croisées telles que la régression des moindres carrés partiels).
- La variabilité physiologique attendue, liée à l’âge et au sexe en particulier, crée un bruit qui complique la détection du signal associé à la maladie; il est donc important de développer des techniques d’ajustement pour améliorer ce ratio signal/bruit.
- Au sein de chaque groupe qui présenterait en moyenne une différence par rapport à un modèle normatif, il existe une très grande variabilité inter-individuelle qui requiert de dépasser l’approche classique de comparaison cas/témoins pour développer des stratégies d’analyses plus personnalisées.
La complexité des maladies psychiatriques nécessite ainsi de nouvelles approches méthodologiques, d’autant que notre spécialité regorge de syndromes variés recoupant des réalités biologiques hétérogènes. Des statistiques modernes et avancées pourraient permettre une meilleure compréhension de ces mécanismes, de faire émerger ou tester de nouvelles hypothèses à partir des données brutes (« data-driven ») ou de répondre à des questions précises à partir d’une masse d’informations difficilement appréhendable par une approche statistique classique.
Pour optimiser ce processus de formation et d’innovation, nous portons le projet d’un club d’échange et d’analyse bio-statistique en psychiatrie « PsyStatOmics ». Ce club est ouvert aux chercheurs et cliniciens désireux de se former aux outils bioinformatiques et statistiques couramment utilisés ou d’échanger sur leurs pratiques. Les membres du club possédant un niveau avancé peuvent également être sollicités pour apporter une expertise spécifique, une aide méthodologique ou pour collaborer à des analyses biostatistiques.
Format
– L’objectif est de permettre une discussion méthodologique poussée, tout en étant le plus clair et didactique possible pour les cliniciens qui s’initient à ces méthodes.
– Par binôme, un ‘junior’ (doctorant ou M2) et un ‘senior’ (chercheur confirmé) présenteront une méthode particulière qu’ils utilisent, ses bases théoriques, les difficultés auxquelles ils se confrontent et les solutions qu’ils proposent. Cette discussion est donc très méthodologique, et diffère du format classique d’un journal club. Ce ne sont pas les résultats ou la thématique qui sont la priorité, mais bien la méthode. Ceci permet de présenter un travail qui n’est pas encore abouti, qui serait encore au stade de benchmarking, par exemple.
– La composition du binôme peut se faire au sein d’une équipe, mais aussi entre équipes, il n’y a pas de règle !
– La présentation se fera sur un créneau de 2h (1h30 de présentation et 30 min de discussion), le 3e jeudi du mois, de 17h à 19h, un mois sur deux.
– Enfin, pour ceux qui ne pourront y assister, il sera proposé aux présentateurs, s’ils l’acceptent, d’enregistrer leur communication.
Donc que vous soyez data- ou theory-driven, que vous fassiez de l’analyse supervisée, de la computation, ou de l’intégration de données de séquençage, que vous soyez clinicien, chercheur, ou étudiant, n’hésitez pas à vous manifester !
Webinaires du Club PsyStatOmics
- Jeudi 18 février
Intégration multi-blocs et multi-niveaux de données.
Arnaud Gloaguen, PhD, est venu présenter les stratégies qu’il a développées pour l’intégration multi-blocs et multi-niveaux. Il est actuellement post-doctorant dans l’équipe d’Arthur Tenenhaus, à Centrale Supélec, et a fait son travail de thèse également au sein de l’équipe Brainomics de Vincent Frouin à Neurospin (intitulé « A statistical and computational framework for multiblock and multiway data analysis »).
Pour une application à des données multiomiques, Amazigh Mokhtari, doctorant dans l’équipe NeuroDiderot-PROTECT (avec Andrée Delahaye et Pierre-Éric Lutz) a illustré l’application de ces stratégies à ses données disponibles en février.
SAVE THE DATES
Prochains webinaires du groupe PsyStatOmics :
- Jeudi 27 mai 2021 – 17h/19h
Thématique : Clustering
Intervenants : A. Iftimovici (IPNP, Paris – NeuroSpin, Saclay), R. Louiset (NeuroSpin Saclay)
- Jeudi 24 juin 2021 – 17h/19h
Thématique : Computational Techniques on Obsessive-Compulsive disorders
Intervenant :R. Maatoug / I. Msellek (IcRIN, ICM, Paris)
PsyPhénOmics : Club d’échange et de travail sur l’harmonisation des données en psychiatrie
Responsables : Jean Charlet / Co-responsable : Bruno Millet
La collecte de données en psychiatrie repose principalement sur des « échelles » et des « entretiens » reflétant des sous tendus théoriques ou catégoriels variés et générant des redondances. Par ailleurs, la diachronie des troubles est peu ou mal prise en compte en dehors d’un « âge début de maladie » d’une maladie, mal définie et pouvant évoluer d’une catégorie à une autre. L’expression de troubles s’enrichit des manifestions cognitives très présentes notamment dans la majorité des catégories et notamment en cas de troubles du développement sous-jacents.
Les principaux défis à résoudre
- L’harmonisation et la validation des échelles mesurant les différentes dimensions, tempéraments, composantes psychopathologiques, le comportement … y compris la veille pour la traduction des nouveaux outils mis en place au niveau international.
- La définition de common data elements pour les données sociodémographiques, de développement etc, et la sélection de CDE existants dans d’autres domaines de la médecine. Ces CDE facilitent l’intégration de bases de données de sources multiples
- L’harmonisation des modalités de collecte de données de type « Momentary assessment »
- La production d’un modèle de données utilisable et transposable aux différentes études / situation
- Le développement d’ontologies propres à la psychiatrie
- L’harmonisation en lien avec les nouveaux champs d’intêrêt «RDoc»