Cas d’utilisation réels dans le domaine de la santé
Il existe une multitude de cas d’utilisation pour lesquels les organisations de divers secteurs peuvent utiliser le ML fédéré, note Lange. Dans le domaine de la santé, les hôpitaux forment en collaboration des modèles pour le diagnostic du cancer, la segmentation des tumeurs cérébrales et la détection du COVID-19 sans partager les dossiers des patients, dit-elle. Par exemple, les centres médicaux américains – y compris les collaborateurs de la Case Western Reserve University ; Université de Georgetown ; Clinique Mayo ; l’Université de Californie, San Diego ; l’Université de Floride ; et l’Université Vanderbilt — utilisent l’apprentissage fédéré propulsé par NVIDIA pour la segmentation des tumeurs, selon un article de blog de NVIDIA.
Exigences d’infrastructure clés pour les déploiements d’apprentissage fédéré
Pour exécuter un apprentissage fédéré, les organismes de santé ont besoin d’un système central pour coordonner le processus (y compris la distribution des modèles, la planification et l’agrégation des mises à jour), d’une infrastructure locale dotée d’une puissance de calcul suffisante pour former les modèles et de moyens sécurisés pour envoyer des mises à jour entre les participants, selon Lange.
Google note sur son blog que les organisations doivent apporter le modèle aux appareils clients pour effectuer la formation du modèle local, et cela peut aller des téléphones mobiles aux appareils IoT et aux institutions entières, telles que les hôpitaux.
Le serveur central ou agrégateur « agit comme l’orchestrateur du processus d’apprentissage fédéré », note Google. « Il initialise et distribue le modèle global, collecte les mises à jour du modèle auprès des clients, regroupe ces mises à jour pour affiner le modèle global, puis redistribue le modèle mis à jour. Il n’accède pas directement aux données brutes des clients. »
Les responsables informatiques doivent également utiliser un protocole de communication défini pour déterminer comment « les clients et le serveur échangent des informations, principalement les paramètres et les mises à jour du modèle. Des protocoles de communication efficaces et sécurisés sont cruciaux, en particulier compte tenu du potentiel d’un nombre massif de clients et des conditions variables du réseau ».
Enfin, un algorithme d’agrégation de modèles permet au serveur central de combiner les mises à jour de modèles reçues des clients. « Des algorithmes tels que la moyenne fédérée sont couramment utilisés pour faire la moyenne des poids ou des gradients, créant ainsi un modèle global unique et amélioré », note Google.
Les organisations ont également besoin d’une gouvernance des données et des modèles, explique Lange.
Construire un écosystème d’IA inter-entreprises : les points clés à retenir
En fin de compte, l’apprentissage fédéré concerne la collaboration entre entreprises pour créer des modèles d’IA sans partager de données brutes, explique Lange.
« Dans des environnements multientreprises réglementés, cela peut débloquer de meilleurs modèles sans obliger les organisations à renoncer au contrôle de leurs données les plus sensibles », ajoute-t-elle. « Pour réussir, il est essentiel que les participants établissent des accords clairs sur la propriété, les contributions et les responsabilités des données. »