Migliorare la sicurezza e la produttività della fabbrica aggiungendo rapidamente la visione artificiale ai sistemi industriali

Di Bill Giovino

Contributo di Editori nordamericani di DigiKey

I progettisti di macchine per l'automazione industriale sono incaricati di implementare in qualche modo la visione artificiale per determinare la distanza da tutti gli oggetti entro un campo visivo specifico. Le ragioni per l'implementazione della visione artificiale possono variare, dal rilevamento dell'ambiente generale per rilevare cambiamenti o possibili intrusioni, al distanziamento di oggetti su una linea di produzione o alla protezione generale dell'operatore o di un robot dai pericoli. In particolare, i veicoli al coperto nei magazzini industriali stanno implementando la visione artificiale per la guida automatizzata, la localizzazione e l'identificazione degli oggetti e il rilevamento e l'elusione degli ostacoli.

Il metodo più comune di visione artificiale per interni per rilevare la distanza degli oggetti è il rilevamento della luce e del raggio d'azione (LiDAR) che utilizza la luce laser per misurare la distanza tra gli oggetti. LiDAR misura il tempo di ritorno e la lunghezza d'onda della luce laser riflessa per determinare la distanza da ogni punto. Tuttavia, gli algoritmi di visione artificiale LiDAR sono molto complessi e hanno una ripida curva di apprendimento, che richiede esperti nel campo della visione artificiale per codificare l'applicazione.

Questo articolo mostrerà agli sviluppatori come utilizzare una telecamera LiDAR chiavi in mano prodotta da Intel per le applicazioni destinate a rilevare la distanza dagli oggetti entro il campo visivo. Risolve il problema di aggiungere rapidamente l'elaborazione elettronica delle immagini a sistemi nuovi o esistenti senza dover conoscere le complessità della tecnologia e degli algoritmi di elaborazione elettronica delle immagini. Si mostrerà quindi come accoppiare una telecamera LiDAR di Intel con un computer monoscheda (SBC) di UDOO utilizzando una connessione USB 3.1 ad alta velocità.

Visione artificiale in ambienti interni di automazione industriale

Gli ambienti di automazione industriale al chiuso stanno diventando sempre più dinamici, con l'aggiunta di un maggior numero di apparecchiature, di operatori e di forniture supplementari. Tutte le macchine, i sensori e l'aumento dei livelli di automazione hanno lo scopo di aumentare l'efficienza, garantendo al tempo stesso la sicurezza dell'operatore.

In molti casi i sensori aggiuntivi sono destinati a rilevare oggetti, comprese le persone, in un'area specifica. Un oggetto su una linea di produzione può essere rilevato in molti modi, ad esempio tramite un sensore di luce che rileva un cambiamento della luce ambiente dovuto al passaggio di un oggetto, un interruttore meccanico premuto dal peso dell'oggetto o un raggio di luce attraverso una linea di produzione e si interrompe ogni volta che passa un prodotto. Se questi metodi sono appropriati per il rilevamento di oggetti di base, la maggiore complessità dell'automazione richiede un rilevamento visivo più complesso, simile a quello dell'occhio umano.

La visione artificiale è più o meno analoga all'aggiunta della vista alle macchine per identificare i diversi colori, differenziare gli oggetti l'uno dall'altro e riconoscere vari movimenti. Tuttavia, un tipo di visione artificiale comune e molto pratico è quello di rilevare la distanza di tutti gli oggetti in un campo visivo.

Esistono due metodi comuni per eseguire il rilevamento a distanza di più oggetti. Il primo è il radar, che per un ambiente interno desta immediatamente la preoccupazione di essere pericoloso per gli operatori umani sotto costante esposizione a segnali ad alta frequenza. In ambienti esterni, le frequenze radar rimbalzano sugli oggetti prima di disperdersi in modo innocuo nell'ambiente circostante. Quando viene utilizzato in ambienti interni, il radar rimbalza ripetutamente su più oggetti, provocando intensi livelli di interferenza elettromagnetica (EMI). L'esposizione prolungata può avere effetti a lungo termine sulla salute degli operatori umani.

Il secondo metodo comune per eseguire il rilevamento a distanza di più oggetti in un campo visivo è il raggio di luce laser, detto anche LiDAR. Uno o più raggi laser sono diretti verso gli oggetti di cui misurare la distanza. Il tempo necessario affinché il raggio laser rifletta verso un recettore nel suo punto di origine, insieme a qualsiasi spostamento di fase del raggio, viene confrontato con il tempo e la fase del laser emesso. Un algoritmo calcola la distanza dagli oggetti in base al tempo e alla differenza di fase e la converte in centimetri o pollici.

Il calcolo della differenza di tempo e della differenza di fase di un singolo raggio laser per rilevare un oggetto è abbastanza semplice. Tuttavia, un'applicazione di visione artificiale più complessa comporterebbe il calcolo della distanza di decine di oggetti in un campo visivo. La combinazione di questi calcoli per creare una mappa visiva delle distanze non è banale e può richiedere molto tempo in fase di sviluppo.

Visione artificiale con rilevamento della distanza

Una soluzione pratica per un'applicazione di visione artificiale che può essere messa in campo rapidamente è la telecamera di profondità ad alta risoluzione L515 LiDAR RealSense 82638L515G1PRQ di Intel (Figura 1). La telecamera ha un diametro di 61 mm e una profondità di 26 mm e contiene un'unità di profondità dell'immagine LiDAR, una telecamera RGB (rosso, verde, blu) e un'unità di misurazione inerziale (IMU). La videocamera LiDAR può restituire un'immagine bitmap di 1024 x 768 o 1920 x 1080 con ogni pixel che rappresenta la distanza di quel punto dalla videocamera.

Immagine della telecamera L515 LiDAR ad alta risoluzione RealSense di IntelFigura 1: RealSense L515 di Intel è una telecamera LiDAR ad alta risoluzione autonoma, dotata anche di una telecamera RGB e una IMU. Si collega facilmente a un computer di supporto mediante USB 3.1. (Immagine per gentile concessione di Intel)

La telecamera LiDAR L515 di Intel restituisce un'immagine bitmap dell'area nel suo campo visivo. Tuttavia, invece di restituire una tipica immagine fotografica dell'area, la telecamera LiDAR restituisce un'immagine in cui il valore RGB di ogni pixel rappresenta la distanza di ogni pixel dalla telecamera L515 di Intel. La telecamera ha una risoluzione da 0,25 a 9 metri. Contiene anche una telecamera RGB standard da 2 megapixel, utile durante lo sviluppo. È consigliata per gli ambienti con illuminazione interna, in quanto non è stata progettata per funzionare in aree con molta luce solare.

Un'immagine di esempio di Intel L515 è riportata nella Figura 2. L'immagine della telecamera è centrata su una pianta in primo piano ed è divisa in due sezioni. Il lato sinistro mostra un'immagine regolare della pianta e dello sfondo della telecamera RGB con colori naturali. Il lato destro è una rappresentazione visiva della distanza di ogni oggetto dalla telecamera. La pianta in primo piano presenta sfumature di blu, mentre la parete sullo sfondo è di un arancione brillante. A destra, la parete è più lontana dal centro della telecamera, quindi l'immagine diventa di una tonalità di rosso più intensa.

Immagine della telecamera LiDAR L515 di IntelFigura 2: La telecamera LiDAR L515 di Intel restituisce sia un'immagine RGB (sinistra), sia un'immagine bitmap (destra) che rappresenta la distanza di un oggetto dalla telecamera. L'area più vicina alla telecamera appare in blu, mentre quella più lontana appare in un rosso intenso. (Immagine per gentile concessione di Intel)

Utilizzando queste informazioni, il software può elaborare i dati delle immagini per determinare la distanza tra gli oggetti e la telecamera.

Grazie alle sue dimensioni compatte e all'elevato livello di integrazione, la telecamera LiDAR L515 di Intel è adatta ad applicazioni di automazione industriale per interni in cui il rilevamento della profondità con la visione artificiale deve essere rapidamente implementato in sistemi nuovi o esistenti. Per i sistemi mobili, Intel L515 contiene una IMU che può rilevare ±4 g di accelerazione e un giroscopio che può rilevare fino a ±1000˚/secondo di rotazione. Questi valori sono adeguati per la maggior parte dei veicoli o robot utilizzati negli impianti di automazione industriale. Bisogna fare attenzione nella codifica del firmware per l'IMU, poiché un veicolo o robot che colpisce un ostacolo può momentaneamente vedere più di 4 gs, e questa eccezione che deve essere tenuta in conto.

Visione artificiale in un sistema completo

Intel L515 può interfacciarsi a un PC o computer monoscheda (SBC) utilizzando un'interfaccia USB 3.1 ad alta velocità. L'alloggiamento della telecamera è dotato di un connettore USB Type-C®, per cui è possibile utilizzare cavi standard con connettori Type-C per facilitare l'integrazione. Poiché l'elaborazione delle immagini per la visione artificiale può essere intensa a livello di calcolo per la CPU, si raccomandano caratteristiche prestazionali elevate che consentano di elaborare i set di dati delle immagini in tempo reale, se necessario. KTMX-UDOOBL-V8G.00 Bolt V8 di UDOO è un SBC ad alte prestazioni basato su un processore a quattro core da 2,0 GHz (potenziato a 3,6 GHz) e supportato da un massimo di 32 GB di DRAM. Per la memoria del programma può utilizzare un'unità a stato solido M.2 (SSD) e supporta anche un'interfaccia standard per dischi rigidi SATA-3.

Immagine del potente SBC Bolt V8 di UDOO con un processore a quattro coreFigura 3: Bolt V8 di UDOO è un potente SBC con un processore a quattro core che funziona fino a 3,6 GHz. Supporta interfacce per unità esterne M.2 e SATA-3, accetta un massimo di 32 GB di DRAM e dispone di un connettore USB 3.1 Type-C per l'interfacciamento alla telecamera LiDAR RealSense L515 di Intel. (Immagine per gentile concessione di UDOO)

Bolt V8 di UDOO ha due interfacce video HDMI 1.4 per il collegamento a un monitor. Per il collegamento in rete può interfacciarsi a una rete di fabbrica tramite Gigabit Ethernet cablata con un connettore RJ-45 su bordo. Sono supportati anche Wi-Fi e Bluetooth. L'audio stereo è supportato da una spina standard di 3,5 mm. L'SBC eseguirà qualsiasi sistema operativo a 64 bit x86 compatibile con Microsoft Windows e qualsiasi distribuzione Linux a 64 bit. Questo potente SBC richiede un alimentatore da 19 V, 65 W per supportare 2 GHz di prestazioni.

Per gli algoritmi di elaborazione dei dati di visione artificiale, Bolt V8 di UDOO ha una grande potenza di elaborazione. Può ricevere dati da RealSense L515 di Intel attraverso un'interfaccia USB 3.1 Type-C ad alta velocità e, se necessario, può visualizzare l'immagine su un monitor collegato a una delle due interfacce HDMI. Gli altoparlanti collegati a uno dei connettori audio di uscita possono emettere avvisi o segnali acustici.

Conclusione

L'elaborazione elettronica delle immagini con rilevamento di profondità è un campo in rapida espansione che può richiedere codice e hardware complessi se si parte da zero. L'integrazione di un sistema di visione artificiale con soluzioni chiavi in mano che eseguono i calcoli di profondità in firmware pre-programmato consente di risparmiare tempo e denaro, dando vita a un sistema di visione artificiale ad alte prestazioni che può essere messo in funzione in un ambiente di automazione industriale in modo rapido e affidabile.

DigiKey logo

Esonero della responsabilità: le opinioni, le convinzioni e i punti di vista espressi dai vari autori e/o dai partecipanti al forum su questo sito Web non riflettono necessariamente le opinioni, le convinzioni e i punti di vista di DigiKey o le sue politiche.

Informazioni su questo autore

Image of Bill Giovino

Bill Giovino

Bill Giovino è un ingegnere elettronico con un BSEE ottenuto a Syracuse University, ed è uno dei pochi ad essere passati con successo da progettista, a ingegnere delle applicazioni sul campo, al marketing tecnologico.

Da oltre 25 anni, Bill promuove le nuove tecnologie per un pubblico tecnico e non tecnico a nome di molte aziende, tra cui STMicroelectronics, Intel e Maxim Integrated. In STMicroelectronics, Bill ha contribuito a guidare i primi successi dell'azienda nel settore dei microcontroller. Con Infineon, Bill ha orchestrato i primi successi di progettazione di microcontroller dell'azienda nel settore automotive statunitense. In qualità di consulente di marketing per la sua società CPU Technologies, Bill ha aiutato molte aziende a trasformare prodotti di secondo grado in storie di successo.

Bill è stato uno dei primi ad adottare l'Internet delle cose, compresa l'integrazione del primo stack TCP/IP completo su un microcontroller. Bill è fedele al motto "Le vendite guidate dall'educazione" e tiene molto alla crescente importanza di comunicazioni chiare e ben scritte nella promozione di prodotti online. È moderatore del famoso gruppo Sales & Marketing di LinkedIn Semiconductor e parla correntemente di B2E.

Informazioni su questo editore

Editori nordamericani di DigiKey