Améliorer la sécurité et la productivité en usine en ajoutant rapidement la vision artificielle aux systèmes industriels
Avec la contribution de Rédacteurs nord-américains de DigiKey
2020-10-06
Les concepteurs de machines d'automatisation industrielle sont tenus de mettre en œuvre une forme ou une autre de vision artificielle pour déterminer la distance de tous les objets dans un champ de vision spécifique. Les raisons de l'implémentation de cette forme de vision artificielle pour la mesure de distance sont nombreuses et variées, qu'il s'agisse de la détection de l'environnement général pour détecter des changements ou d'éventuelles intrusions, de la distance des objets sur une chaîne de production ou de la protection globale de l'opérateur ou du robot contre les dangers. En particulier, les véhicules intérieurs des entrepôts industriels utilisent la vision artificielle pour la conduite automatisée, la localisation et l'identification d'objets ainsi que la détection et l'évitement d'obstacles.
La méthode de vision artificielle en intérieur la plus courante pour la détection de la distance des objets est la télédétection par laser (LiDAR) qui utilise la lumière laser pour mesurer la distance entre les objets. Le LiDAR mesure le temps de retour et la longueur d'onde de la lumière laser réfléchie pour déterminer la distance depuis chaque point. Cependant, les algorithmes de vision artificielle LiDAR sont très complexes et ont une courbe d'apprentissage abrupte, exigeant des experts en vision artificielle pour coder l'application.
Cet article montre aux développeurs comment une caméra LiDAR clés en main d'Intel peut être utilisée pour ces applications afin de détecter la distance des objets dans un champ de vision. Il résout le problème de l'ajout rapide de la vision artificielle à des systèmes nouveaux ou existants sans avoir à apprendre les complexités de la technologie et des algorithmes de vision artificielle. Il montre ensuite comment coupler la caméra LiDAR d'Intel avec un ordinateur monocarte (SBC) d'UDOO en utilisant une connexion USB 3.1 haute vitesse.
La vision artificielle dans les environnements d'automatisation industrielle intérieurs
Les environnements d'automatisation industrielle intérieurs sont de plus en plus dynamiques, avec l'ajout d'équipements et de fournitures, et un nombre croissant d'opérateurs. Les machines, les capteurs et les niveaux d'automatisation accrus sont destinés à accroître le rendement tout en garantissant la sécurité des opérateurs.
Dans de nombreux cas, les capteurs supplémentaires sont destinés à détecter des objets, y compris des personnes, dans une zone cible. Un objet sur une chaîne de production peut être détecté de nombreuses manières, notamment grâce à un capteur de lumière de base qui détecte un changement de lumière ambiante dû au passage d'un objet, à un interrupteur mécanique qui est enfoncé par le poids de l'objet ou à un faisceau lumineux sur une chaîne de production qui est interrompu lorsqu'un produit passe devant. Si ces méthodes conviennent à la détection basique des objets, la sophistication accrue de l'automatisation requiert une détection visuelle plus complexe, semblable à celle de l'œil humain.
La vision artificielle est similaire à l'ajout de la vision aux machines pour identifier différentes couleurs, différencier les objets les uns des autres et reconnaître de multiples mouvements. Cependant, un type de vision artificielle fréquent et très pratique consiste à détecter la distance de tous les objets dans un champ de vision.
Il existe deux méthodes courantes pour effectuer la détection de distance pour plusieurs objets. La première est le radar, qui, en environnement intérieur, suscite immédiatement la crainte d'être dangereux pour les opérateurs humains constamment exposés à des signaux haute fréquence. Dans les environnements extérieurs, les fréquences radar rebondissent sur les objets avant de se dissiper de manière inoffensive dans le milieu environnant. Lorsqu'il est utilisé à l'intérieur, le radar rebondit de manière répétée sur de multiples objets, ce qui entraîne des niveaux intenses d'interférences électromagnétiques (EMI). Une exposition prolongée peut avoir des effets à long terme sur la santé des opérateurs humains.
La deuxième méthode courante pour effectuer la détection de distance de plusieurs objets dans un champ de vision est le LiDAR. Un ou plusieurs faisceaux de lumière laser sont dirigés vers les objets dont la distance doit être mesurée. Le temps nécessaire au faisceau laser pour se réfléchir vers un récepteur à son point d'origine, ainsi que tout déphasage du faisceau, sont comparés au temps et à la phase du laser émis. Un algorithme calcule la distance aux objets en fonction du temps et de la différence de phase et la convertit en centimètres ou en pouces.
Le calcul de la différence de phase et du temps pour un seul faisceau laser pour détecter un objet est assez simple. Cependant, une application plus complexe de vision artificielle impliquerait le calcul de la distance de dizaines d'objets dans un champ de vision. La combinaison de ces calculs pour créer une carte visuelle des distances n'est pas anodine et peut prendre un temps de développement important.
Vision artificielle avec détection de la distance
Une solution pratique pour une application de vision artificielle pouvant être mise en place rapidement est la caméra de profondeur LiDAR L515 haute résolution Intel RealSense 82638L515G1PRQ (Figure 1). La caméra a un diamètre de 61 millimètres (mm) et une profondeur de 26 mm, et contient une unité de profondeur d'image LiDAR, une caméra RVB (rouge, vert, bleu) et une unité de mesure inertielle (IMU). La caméra LiDAR peut renvoyer une image bitmap 1024 x 768 ou 1920 x 1080, chaque pixel représentant la distance de ce point par rapport à la caméra.
Figure 1 : La caméra Intel RealSense L515 est une caméra LiDAR haute résolution autonome, également équipée d'une caméra RVB et d'une unité de mesure inertielle. Elle se connecte facilement à un ordinateur de support via USB 3.1. (Source de l'image : Intel)
La caméra LiDAR L515 d'Intel renvoie une image bitmap de la zone dans son champ visuel. Cependant, au lieu de renvoyer une image photographique typique de la zone, la caméra LiDAR renvoie une image où la valeur RVB de chaque pixel représente la distance qui sépare chaque pixel de la caméra Intel L515. La caméra a une résolution de 0,25 à 9 mètres (m). Elle contient également une caméra RVB standard de 2 mégapixels (MP) qui est utile pendant le développement. Elle est recommandée pour les situations d'éclairage intérieur car elle n'a pas été conçue pour fonctionner en plein soleil.
Une image d'exemple de l'Intel L515 est illustrée à la Figure 2. L'image de la caméra est centrée sur une plante au premier plan et est divisée en deux parties. Le côté gauche montre une image de caméra RVB standard de la plante et l'arrière-plan en couleurs naturelles. Le côté droit est une représentation visuelle de la distance entre chaque objet et la caméra. La plante au premier plan se présente sous forme de nuances de bleu, tandis que le mur à l'arrière-plan est orange vif. À droite, le mur est plus éloigné du centre de la caméra, donc l'image prend des tons de rouge plus profonds.
Figure 2 : La caméra LiDAR L515 d'Intel renvoie à la fois une image RVB (à gauche) et une image bitmap (à droite) qui représente la distance entre un objet et la caméra. Les objets les plus proches de la caméra apparaissent en bleu, tandis que ceux qui sont plus éloignés apparaissent en rouge profond. (Source de l'image : Intel)
Grâce à ces informations, un logiciel peut traiter les données d'image pour déterminer la distance entre les objets et la caméra.
Avec sa taille compacte et son haut niveau d'intégration, la caméra LiDAR L515 d'Intel convient aux applications d'automatisation industrielle en intérieur où la détection de la profondeur par vision artificielle doit être rapidement mise en œuvre dans des systèmes nouveaux ou existants. Pour les systèmes mobiles, l'Intel L515 contient une unité de mesure inertielle qui peut détecter ±4 g d'accélération et un gyroscope qui peut détecter jusqu'à ±1000° par seconde (°/s) de rotation. Cela est approprié pour la plupart des robots ou véhicules d'intérieur utilisés dans les installations d'automatisation industrielle. Il convient de prêter une attention particulière lors du codage du micrologiciel pour l'unité de mesure inertielle car un véhicule ou un robot qui heurte un obstacle peut momentanément constater plus de 4 gs, une exception dont il faut tenir compte.
La vision artificielle dans un système complet
L'Intel L515 peut interagir avec un PC ou un ordinateur monocarte via une interface USB 3.1 haute vitesse. Le boîtier de la caméra est équipé d'un connecteur USB Type-C®, ce qui permet d'utiliser des câbles standard avec des connecteurs Type-C pour faciliter l'intégration. Comme le traitement des images de vision artificielle exige généralement beaucoup de ressources du processeur, il est recommandé de disposer de performances suffisantes pour pouvoir traiter les ensembles de données d'images en temps réel si nécessaire. Le KTMX-UDOOBL-V8G.00 Bolt V8 d'UDOO est un ordinateur monocarte hautes performances, basé sur un processeur à quatre cœurs s'exécutant à 2,0 gigahertz (GHz) (avec pointe de 3,6 GHz) avec jusqu'à 32 giga-octets (Go) de DRAM. Il peut utiliser un disque SSD M.2 pour la mémoire programme et il prend également en charge une interface de disque dur SATA-3 standard.
Figure 3 : Le Bolt V8 d'UDOO est un puissant ordinateur monocarte avec un processeur à quatre cœurs fonctionnant jusqu'à 3,6 GHz. Il prend en charge les interfaces de disques externes M.2 et SATA-3, peut accueillir jusqu'à 32 Go de DRAM et dispose d'un connecteur USB 3.1 Type-C pour l'interfaçage avec la caméra LiDAR Intel RealSense L515. (Source de l'image : UDOO)
Le Bolt V8 d'UDOO est doté de deux interfaces vidéo HDMI 1.4 pour la connexion à un moniteur. Pour la mise en réseau, il peut interfacer avec un réseau d'usine par Gigabit Ethernet câblé via un connecteur RJ-45 intégré. Les technologies Wi-Fi et Bluetooth sont également prises en charge. L'audio stéréo est prise en charge via une fiche standard de 3,5 mm. L'ordinateur monocarte fonctionne avec tout système d'exploitation compatible x86 64 bits, y compris Microsoft Windows et toute distribution Linux 64 bits. Ce puissant ordinateur monocarte requiert une alimentation électrique de 19 volts, 65 watts pour prendre en charge des performances de 2 GHz.
Pour les algorithmes de données de vision artificielle, le Bolt V8 d'UDOO offre une grande puissance de traitement. Il peut recevoir des données de la caméra Intel RealSense L515 via une interface USB 3.1 Type-C haute vitesse et, si nécessaire, afficher l'image sur un moniteur connecté à l'une des interfaces HDMI. Des alertes ou des avertissements sonores peuvent être émis par des haut-parleurs connectés à l'un des jacks de sortie audio.
Conclusion
La vision artificielle avec détection de profondeur est un domaine en pleine expansion qui peut exiger du code et du matériel complexes si vous partez de zéro. L'intégration d'un système de vision artificielle avec des solutions clés en main effectuant les calculs de profondeur dans un micrologiciel pré-programmé permet d'économiser du temps et de l'argent, résultant en un système de vision artificielle hautes performances qui peut être mis en œuvre dans un environnement d'automatisation industrielle de manière rapide et fiable.
Avertissement : les opinions, convictions et points de vue exprimés par les divers auteurs et/ou participants au forum sur ce site Web ne reflètent pas nécessairement ceux de DigiKey ni les politiques officielles de la société.


