Les GPU sont également utilisés pour former de grands modèles de langage susceptibles d’améliorer à la fois l’expérience des prestataires et des patients. Ce type d’IA est utilisé pour la documentation clinique et les chatbots médicaux.
Les experts affirment que la puissance de calcul plus rapide et plus grande des GPU en a fait un élément essentiel pour l’avancement continu de l’IA dans le domaine de la santé. « Si vous construisez un modèle de synthèse vocale, un modèle de conception de protéines ou un modèle de vision par ordinateur, les GPU peuvent former et exécuter ces modèles plus efficacement à grande échelle », explique Kelleher.
« Les unités centrales de traitement sont idéales pour les tâches séquentielles », explique Lynch. « Mais l'IA nécessite des capacités de traitement parallèle, et les GPU sont meilleurs dans ce domaine. »
Chaîne d'approvisionnement en semi-conducteurs dans le secteur de la santé
Le PDG de NVIDIA, Jensen Huang, a récemment qualifié de « folle » la demande pour la puce GPU Blackwell de la société. En octobre 2024, un analyste de Morgan Stanley a rapporté que ces GPU étaient « réservés pour 12 mois ». La forte demande de la part des hyperscalers, notamment Amazon Web Services, Microsoft Azure et Google Web Platform, pourrait avoir contribué à la pénurie mondiale de puces, selon CDW.
Jon McManus, vice-président et responsable des données, de l'IA et du développement chez Sharp HealthCare, décrit la chaîne d'approvisionnement avancée en semi-conducteurs comme « fragile » car elle repose sur « des milliers de fournisseurs devant travailler en parfaite harmonie » pour produire les puces.
« Vous aviez déjà une industrie affaiblie en raison des bouleversements provoqués par la pandémie de COVID-19, suivis de cette incroyable demande qui lui a été imposée », explique McManus.
Lynch est d’accord, mais pense que l’intérêt croissant pour l’IA aurait conduit à une pénurie de puces même sans la pandémie. « Mon interprétation du marché est que nous aurions assisté à ce ralentissement en raison de l’augmentation de la demande de charges de travail d’IA », dit-il. « Il est difficile de fabriquer davantage de chips car nous n'avons jamais vu une telle demande pour les matières premières. »
Impact de la pénurie de puces sur les soins de santé
La majorité des systèmes de santé utilisent des services cloud. Selon TechTarget, un rapport Forrester 2023 sur le cloud dans le secteur de la santé indique que 73 % des établissements de santé s'associent à plusieurs fournisseurs de cloud public.
McManus affirme que des organisations telles que Sharp Healthcare ont accès à des capacités d'IA basées sur GPU grâce à ces partenariats. « C'est pourquoi je pense que le secteur de la santé ne ressent pas vraiment les conséquences de la pénurie de puces, car la plupart des grands fournisseurs de cloud ont déjà acheté des GPU en gros. »
Il émet l’hypothèse que les systèmes de santé endettés techniquement ou qui utilisent encore principalement des serveurs sur site pourraient avoir du mal à déployer l’IA si la pénurie de puces persiste à long terme. Si les grands fournisseurs de cloud ne disposaient pas de suffisamment de GPU, les organisations en retard dans le jeu de l'IA pourraient ne pas être en mesure d'obtenir ces partenariats.
« À moins que vous ne disposiez de talents locaux en matière de développement de l'IA, bon nombre de ces capacités d'IA sont presque exclusivement disponibles via des partenariats cloud », explique McManus. « Les systèmes de santé qui ne font encore rien dans cet espace pourraient avoir du mal à y accéder. »
Comment contourner la pénurie de puces
Pour contourner la pénurie de puces, une option consiste à utiliser les ressources d'IA des grandes sociétés de cloud computing pour former de grands modèles de langage ou exécuter des analyses avant de ramener les données propriétaires sur site. « Je n'ai pas besoin d'acheter des GPU et de les conserver sur site dans mon propre centre de données », explique Lynch. « Je peux essentiellement les louer auprès d'Amazon, de Microsoft Azure et d'autres, et je ne suis facturé que pour les données que j'utilise réellement. »
McManus recommande de travailler avec plusieurs fournisseurs pour garantir que l'organisation a toujours accès aux services de cloud computing et aux capacités d'IA dont elle a besoin. Une autre option consiste à essayer une alternative telle que les unités de traitement tensoriel de Google, conçues pour gérer les charges de travail d'IA.
L'atténuation des risques devrait faire partie de la planification de toute organisation, ajoute McManus. « En cas de pénurie importante de GPU, les conséquences économiques pourraient être profondes. À un moment donné, s’il y a une limite, soyez prêt à suspendre cette ambition en matière d’IA jusqu’à ce que le marché puisse se stabiliser.