Comment et pourquoi les microcontrôleurs peuvent contribuer à démocratiser l'accès à l'Edge AI
Avec la contribution de Rédacteurs nord-américains de DigiKey
2025-02-18
Au cours des dernières années, l'Edge AI a gagné en popularité. Le marché mondial associé devrait croître à un taux annuel composé de 27,8 % jusqu'en 2035, pour atteindre une valeur nette de 356,84 milliards de dollars.
Plusieurs facteurs stimulent cette demande. Le traitement des données en périphérie répond aux préoccupations de sécurité que les entreprises peuvent avoir concernant le transfert d'informations sensibles ou propriétaires vers le cloud. Le traitement en périphérie réduit également la latence, ce qui peut être important dans les applications en temps réel où des décisions doivent être prises en une fraction de seconde. Les dispositifs d'IoT industriel (IIoT) fournissent des opérations axées sur les données, qui à leur tour augmentent les cas d'utilisation de l'Edge AI. Les implémentations en expansion rapide — des dispositifs médicaux portables aux dispositifs corporels et à l'IIoT — dynamisent le marché de l'IA en périphérie.
À mesure que la technologie gagne en popularité, la demande associée en matière de composants capables de prendre en charge les besoins de traitement des données dans les systèmes embarqués augmente.
Choix de traitement de calcul : microcontrôleurs ou microprocesseurs
La grande majorité des dispositifs IoT déployés aujourd'hui dans les équipements industriels et autres équipements embarqués sont des dispositifs basse consommation avec très peu de mémoire. La puissance de traitement dont ils disposent provient de petits microcontrôleurs (MCU) embarqués. Ces microcontrôleurs ont des architectures basse consommation qui permettent aux systèmes embarqués d'être beaucoup plus rentables que ceux équipés de microprocesseurs.
Jusqu'à l'avènement de l'Edge AI, les microcontrôleurs répondaient bien aux besoins de traitement des dispositifs IoT. Mais les microcontrôleurs traditionnels ne peuvent généralement pas fournir la puissance de calcul nécessaire aux algorithmes d'apprentissage automatique plus complexes qui caractérisent les applications d'Edge AI. Ces algorithmes s'exécutent généralement sur des processeurs graphiques (GPU) et des microprocesseurs qui offrent une plus grande puissance de calcul. L'utilisation de ces composants présente toutefois des inconvénients, notamment en ce qui concerne la consommation d'énergie. Les microprocesseurs ou processeurs graphiques ne sont pas les solutions les plus écoénergétiques. Par conséquent, l'edge computing basé sur les microprocesseurs n'est peut-être pas la solution la mieux adaptée à toutes les applications d'Edge AI, et les fournisseurs se tournent plutôt vers les microcontrôleurs.
Les microcontrôleurs autonomes sont moins chers que les processeurs graphiques et les microprocesseurs. Pour développer l'Edge AI, l'exploitation des avantages des microcontrôleurs (faible coût et basse consommation) tout en augmentant la puissance de calcul apparaît de plus en plus nécessaire.
En effet, au fil des ans, plusieurs facteurs ont favorisé l'augmentation des capacités des microcontrôleurs en périphérie.
Facteurs favorisant l'utilisation des microcontrôleurs en périphérie
L'hypothèse générale était que le microcontrôleur traditionnel était trop léger pour le traitement des données liées à l'IA. Cependant, les changements apportés à la conception des microcontrôleurs et à l'écosystème technologique plus large stimulent leur adoption dans les cas d'utilisation Edge AI.
Ces facteurs incluent les suivants :
Intégration d'accélérateurs d'IA dans les microcontrôleurs : lorsque le microcontrôleur seul peine à répondre aux exigences de l'edge computing, son association à un accélérateur d'IA/ML tel que des unités de traitement neuronal (NPU) ou des processeurs de signaux numériques (DSP) améliore les performances.
Par exemple, les processeurs série STM32N6 (Figure 1) de STMicroelectronics sont basés sur le processeur Arm Cortex-M55 cadencé à 800 MHz. La technologie de traitement vectoriel Arm Helium apporte des capacités de traitement DSP à un processeur standard. Le STM32N6 est le premier microcontrôleur STM32 à intégrer l'accélérateur ST Neural-ART Accelerator, une unité de traitement neuronal développée en interne et conçue pour de puissantes applications d'Edge AI.
Figure 1 : Le STM32N6 est le premier microcontrôleur STM32 à intégrer l'accélérateur ST Neural-ART Accelerator, une unité de traitement neuronal (NPU) développée en interne et conçue pour les applications d'Edge AI écoénergétiques. (Source de l'image : STMicroelectronics)
- Modèles d'IA optimisés pour la périphérie : les algorithmes d'IA et d'apprentissage automatique à usage intensif ne peuvent pas être simplement transférés vers des microcontrôleurs. Ils doivent être optimisés pour des ressources de calcul limitées. Les architectures d'IA compactes comme TinyML et MobileNet répondent à ce besoin avec des techniques d'optimisation, permettant même aux microcontrôleurs en périphérie d'exécuter des algorithmes d'IA. STMicroelectronics a lancé STM32Cube.AI, une solution logicielle qui convertit un réseau neuronal en code C optimisé pour les microcontrôleurs STM32. L'utilisation de la solution en conjonction avec le STM32N6 permet de garantir les performances nécessaires aux applications d'Edge AI malgré les contraintes de traitement et de mémoire.
Essor des écosystèmes d'IA : il ne suffit pas de disposer d'un composant matériel capable d'effectuer un traitement lié à l'IA en périphérie. L'exécution d'algorithmes d'IA en périphérie requiert des écosystèmes conviviaux pour les développeurs afin de faciliter les déploiements d'IA. Des outils spécifiques comme TensorFlow Lite for Microcontrollers aident à fournir de telles solutions. Les communautés open-source comme Hugging Face et d'autres plateformes proposent des modèles pré-entraînés et des bibliothèques de codes que les développeurs peuvent tester et adapter à leurs cas d'utilisation spécifiques. De tels écosystèmes d'IA réduisent les obstacles à l'adoption de la technologie et démocratisent l'accès, même pour les entreprises aux ressources limitées qui ne seraient peut-être pas en mesure de développer des modèles d'IA propriétaires à partir de zéro.
STMicroelectronics propose un écosystème matériel et logiciel spécifiquement adapté, ST Edge AI Suite, pour des solutions Edge AI optimisées. La suite consolide de nombreux outils et bibliothèques d'IA de ST afin de permettre aux développeurs de trouver plus facilement des modèles, des sources de données, des outils et des compilateurs capables de générer du code pour le microcontrôleur.
Les modèles pré-entraînés dans une collection de modèles fournissent un point de départ aux développeurs. Ces modèles utilisent le format ONNX (Open Neural Network Exchange), une norme ouverte pour représenter les modèles d'apprentissage automatique dans des domaines tels que la vision par ordinateur (CV), le traitement du langage naturel (NLP), l'IA générative (GenAI) et l'apprentissage automatique de graphes.
- Codes pour la standardisation et l'interopérabilité : si les écosystèmes d'IA ont aidé les entreprises à tester des cas d'utilisation Edge AI, les formats de modèles ouverts et standardisés ont facilité l'intégration transparente entre les systèmes matériels. La compatibilité entre les outils logiciels et les microcontrôleurs a contribué à réduire les obstacles aux implémentations Edge AI.
- Sécurité en périphérie : si les microcontrôleurs éliminent ou au moins réduisent le besoin de traitement des données dans le cloud, les composants matériels fournissent des couches de sécurité supplémentaires. Ils incluent généralement des fonctionnalités telles que le chiffrement matériel et le démarrage sécurisé, qui protègent à la fois les données et les modèles d'IA contre les acteurs malveillants.
Particularités du matériel STM32N6
La série STM32N6 inclut un microcontrôleur hautes performances avec une unité de traitement neuronal, un ensemble de modules de caméra et un kit de découverte. La série utilise une architecture ARM Cortex-M typique et offre plusieurs fonctionnalités clés qui rendent ces dispositifs adaptés à l'IA en périphérie. Ces fonctionnalités incluent les suivantes :
- Neural ART Accelerator, qui peut exécuter des modèles de réseaux neuronaux. Cet accélérateur est optimisé pour les algorithmes d'IA intensifs, il est cadencé à 1 GHz, et il fournit 600 GOPS avec un rendement énergétique moyen de 3 TOPS/W.
- Prise en charge des instructions “Helium” M-profile Vector Extension (MPVE), un jeu d'instructions ARM permettant de puissantes fonctions de réseau neuronal et DSP. Ces instructions sont conçues, par exemple, pour fonctionner avec des nombres à virgule flottante 16 bits et 32 bits, ce qui leur permet de manipuler efficacement des nombres de faible précision. Ces instructions sont importantes pour le traitement des modèles ML.
- ST Edge AI Suite, un référentiel de cas d'utilisation, de documents et d'outils logiciels gratuits, qui aide les développeurs de tous niveaux d'expérience à créer une IA pour la périphérie intelligente. La suite inclut également des outils tels que ST Edge AI Developer Cloud, qui propose des réseaux neuronaux dédiés dans la collection de modèles STM32, un ensemble de cartes pour l'évaluation comparative dans le monde réel, et bien plus encore.
- Près de 300 unités de multiplication-accumulation configurables et deux bus mémoire AXI 64 bits pour un débit de 600 GOPS.
- Processeur de signal d'image (ISP) dédié intégré, capable d'interfacer directement avec plusieurs caméras de 5 mégapixels. Pour créer des systèmes intégrant des caméras, les développeurs doivent régler l'ISP selon un capteur de caméra CMOS particulier et son objectif. Le réglage requiert généralement une expertise spécialisée ou l'aide d'un tiers. ST fournit aux développeurs un logiciel de bureau spécifique appelé iQTune à cet effet. Ce logiciel, exécuté sur un poste de travail Linux, communique avec le code embarqué sur le STM32 et analyse la fidélité des couleurs, la qualité de l'image et les statistiques, et configure les registres de l'ISP en conséquence.
- Prise en charge de MIPI CSI-2, l'interface de caméra la plus populaire sur les applications mobiles, sans avoir besoin d'un ISP externe compatible avec cette interface série de caméra particulière.
- Les nombreuses capacités supplémentaires sur un seul dispositif impliquent que les développeurs peuvent désormais exécuter un réseau neuronal en conjonction avec une interface graphique sans avoir à utiliser plusieurs microcontrôleurs.
- Sécurité robuste, y compris les certifications Target SESIP niveau 3 et PSA niveau 3.
Conclusion
Les applications d'apprentissage automatique exécutées en périphérie nécessitaient autrefois des microprocesseurs à usage intensif dans les systèmes embarqués pour supporter la charge d'exécution d'algorithmes complexes. Grâce à de puissants microcontrôleurs tels que les processeurs série STM32N6 de STMicroelectronics, les entreprises peuvent désormais démocratiser l'IA en périphérie. STMicroelectronics fournit un écosystème complet pour le déploiement de l'IA en périphérie, y compris des composants logiciels et matériels pour l'inférence.

Avertissement : les opinions, convictions et points de vue exprimés par les divers auteurs et/ou participants au forum sur ce site Web ne reflètent pas nécessairement ceux de DigiKey ni les politiques officielles de la société.