Qu’est-ce que le NC3 et la technologie qui l’alimente ?

Qu’est-ce que le N3C et quelle est la technologie derrière ?

Le Dr Kenneth Gersing, directeur de l’informatique au NCATS, explique que l’organisation fait travailler des groupes ensemble et transforme les silos de données en réseau grâce à des services partagés. Pour rendre possible un programme tel que N3C, il est important que le NCATS trouve des économies d’échelle.

L’organisation dirige également le Réseau de recherche clinique sur les maladies rares, un précurseur du N3C, et a pu utiliser une partie de la même technologie et des mêmes processus de nettoyage, d’analyse et de sortie des données pour soutenir l’initiative N3C. En 2017, NCATS a commencé à piloter des instances Palantir dans le cloud en utilisant Amazon Web Services pour créer un environnement analytique sécurisé. L’organisation a déployé Google Workspace en 2019 pour permettre à la communauté des chercheurs de partager facilement les résultats.

L’organisation harmonise également toutes les données COVID-19 collectées auprès des établissements de santé, qui utilisent une variété de modèles de données communs. Le NCATS fournit tous les outils dont les chercheurs ont besoin pour accéder aux données et les analyser, et assure la sécurité de l’enclave et la protection de la vie privée des patients.

EN RELATION: Découvrez comment la technologie permet d’identifier et de suivre les déterminants sociaux des données sur la santé.

Gersing explique que le NCATS gère l’authentification d’identité, le déploiement dans le cloud, la sécurité, la prise en charge du logiciel en tant que service, l’authentification unique, la billetterie et les problèmes de conformité afin que les chercheurs puissent se concentrer sur la science.

L’objectif de N3C est de partager des informations avec la communauté. Si un chercheur apporte un algorithme à exécuter contre l’enclave, il devient une partie des actifs disponibles pour la communauté. L’algorithme devra être évalué à des fins de sécurité avant son utilisation approuvée.

Comment les données N3C sont-elles accessibles aux chercheurs ?

L’enclave de N3C comprend des données d’au moins 5,9 millions de patients positifs au COVID-19, ainsi que des données de deux témoins pour chaque patient positif. De nouvelles données sont collectées, harmonisées avec le modèle de données commun du Partenariat sur les résultats médicaux observationnels et publiées chaque semaine.

« Nous avons près de 4 000 bénévoles. Il n’y a aucun moyen que cela soit possible sans qu’une communauté se rassemble et aide », déclare Gersing.

Certaines des données patients recueillies remontent au 1er janvier 2018, offrant aux chercheurs une image plus complète des parcours des patients.

N3C utilise un modèle centralisé plutôt que fédéré. Dans les modèles fédérés, les chercheurs peuvent poser une question telle que « Combien de patientes de plus de 60 ans souffrent d’hypertension ? Ils recevraient un numéro mais n’auraient pas accès aux données au niveau des lignes. L’utilisation d’un modèle centralisé supprime cette limitation.

« Nous voulions que les chercheurs puissent accéder directement aux données et les parcourir », explique Gersing. « En particulier, nous voulions pouvoir utiliser des technologies comme l’apprentissage automatique, ce qui est difficile à faire dans un modèle fédéré. »

N3C garantit également que les définitions sont cohérentes, ce qui est important pour l’harmonisation des données entre modèles. Différentes organisations doivent s’entendre sur la définition d’une visite, par exemple, explique Gersing.