contact@carpem.fr

Plateforme de bases de données

Carpem > Activités > Plateformes > Plateforme de bases de données

transmart

Les buts du Système d’Information (SI) déployé pour CARPEM sont :

  1. de faciliter l’exploration des données et l’identification de pistes de recherche,
  2. de regrouper dans un même entrepôt toutes les données pertinentes pour la recherche,
  3. de permettre l’enrichissement des données par croisement des informations avec d’autres sources, et
  4. de standardiser la représentation de ces données.

L’entrepôt de recherche translationnelle tranSMART, interface visible du SI pour les chercheurs contiendra des données anonymisées. tranSMART est un entrepôt de recherche translationnelle issue de l’industrie pharmaceutique et rendu open-source. Il permet une exploration facilitée des données, et bénéficie de la grande dynamique de sa communauté d’utilisateurs.

 

Données collectées

Les sources d’information du projet CARPEM sont :

  • les bases rétrospectives collectées par les équipes préalablement au lancement du projet. Les données collectées dans les équipes doivent faire l’objet d’une standardisation avant de pouvoir être intégrées au SI CAPREM. Il s’agit de permettre la compatibilité du format des bases avec les différents outils de traitement et d’exploration de l’information, et de raisonnablement harmoniser les contenus.
  • les bases prospectives. La création de ces bases va nécessiter de répondre à diverses questions scientifiques mais aussi techniques comme quelles données récolter ? comment récolter, où et à quel moment aller chercher l’information ?

Les bases rétrospectives et prospectives sont crées en fonction des localisations tumorales. Afin d’avancer au plus vite dans la mise en place de SI mutualisé aux 2 sites hospitaliers Cochin/ HEGP, des groupes de travail multidisciplinaires par localisation tumorale ont été mis en place.

 

Intégration des données CARPEM

L’un des buts du SI est de permettre l’enrichissement des données de recherche par des données cliniques. Pour atteindre cet objectif, il faut pouvoir identifier pour un patient l’ensemble des documents qui lui corresponde. Cette tâche sera effectuée dans CARPEM par un serveur de fédération d’identité.

Nous utiliserons une méthode inspirée par les travaux de St. Sauver et al. du Rochester Epidemiology Project (un projet d’intégration de plus d’un million de documents cliniques sur 30 ans), et guidé par les expériences préalable de notre équipe sur des problèmes similaires. La méthode fait appel à une succession de règles de la plus solide à la plus fragile pour identifier que des documents appartiennent à un même patient. Par exemple une des premières règles pourrait-être : si le nom, le prénom, la date de naissance et lieux de naissance sont identiques alors les deux dossiers sont attribués à la même personne. La méthode est relativement simple, son application soulève de nombreux problèmes de réglages.

 

Architecture et outils déployés

Le SI est organisé en trois couches :

  1. La couche « Intégration des données ». Son accès est restreint à l’équipe d’informatique médicale et ne correspond qu’aux tâches de fédération d’identité et des standardisations des différentes sources de données. C’est là que les données nominatives sont traitées.
  2. La couche « interne AP-HP ». Elle permet aux chercheurs et aux personnels du projet CARPEM d’accéder aux outils tel que l’eCRF au sein du réseau APHP.
  3. La couche « extérieure ». Qui permettra selon des modalités à définir, d’accéder à l’entrepôt de recherche translationnelle tranSMART à l’ensemble des chercheurs du projet CARPEM (aussi bien APHP, que hors APHP). Cette couche ne contient que des données anonymisées.

L’ensemble des outils seront déployés sur des serveurs dédiés et bénéficiant des protections techniques de l’HEGP et de l’AP-HP.

Les outils déployés sont :

  • tranSMART,
  • REDCap : eCRF utilisé par plus de 700 institutions dans 60 pays du monde et gérant plus de 80 000 projets.
  • Serveur de fédération d’identité, développement ad hoc en cours.

 

 

 

Contacts

Hôpital Européen Georges Pompidou – HEGP

20 rue Leblanc – 75015 Paris

Equipe : Anita Burgun, Bastien Rance, Hector Countouris