Utilizzate l'imaging a raggi infrarossi del tempo di volo per migliorare le capacità robotiche
Contributo di Editori nordamericani di DigiKey
2016-05-19
L'imaging è fondamentale per molte applicazioni robotiche, il che consente loro di eseguire attività di base, evitare ostacoli, navigare e garantire un livello di sicurezza di base. Il modo più ovvio per fornire imaging è mediante una videocamera a basso costo, o meglio ancora, utilizzandone due per la stereovisione e la percezione della profondità. Ma quest'ultima soluzione ha alcuni inconvenienti
L'uso di due videocamere per le immagini 3D aumenta il consumo energetico e i requisiti di spazio, complica il fattore di forma e il processo produttivo e fa salire i costi. Dato che le immagini 3D vanno principalmente in applicazioni che spaziano da unità di assistenza di base ai sistemi di controllo dei veicoli autonomi, i progettisti hanno bisogno di un'alternativa migliore che non quella di aggiungere semplicemente più videocamere.
A tale fine, i progettisti fanno sempre più uso di alternative che offrono vantaggi relativi al packaging, ai costi, al consumo energetico, alla riduzione dei dati e alle prestazioni generali. Fra le alternative vi sono i sistemi di imaging ToF (Tempo di volo), spesso chiamati Light Detection and Ranging, o LIDAR. Questi sistemi possono essere completati dall'imaging ai raggi infrarossi (IR), spesso chiamato termografia.
Iniziare con l'IR
Le onde elettromagnetiche ai raggi infrarossi hanno lunghezze d'onda più lunghe di quelle all'estremità del rosso dello spettro visibile; le lunghezze d'onda della banda IR sono generalmente collocate da 700 nm (0,7 μm) a 1 mm (1000 μm). Molto semplicemente, rappresentano il calore irradiato da un oggetto. Con un sistema di immagini IR appropriato, questa mappa del calore IR viene trasformata in un'immagine a luce visibile, spesso con l'aggiunta di falsi colori per evidenziare le temperature relative (Figura 1).
Figura 1: Un'immagine all'infrarosso dell'acqua che esce da un rubinetto e finisce in una vasca; notare l'uso della colorazione falsa per meglio indicare le differenze di temperatura. (Immagine per gentile concessione di FLIR Systems, Inc.)
Notare che le immagini basate sulle emissioni IR non sono equivalenti al rilevamento IR. Il rilevamento è un metodo senza contatto usato per individuare e anche per misurare una fonte di calore, come una persona che passa davanti a un sensore agli infrarossi passivo (PIR) come parte di un sistema di allarme, o un calore eccessivo da un tubo sotto monitoraggio. In questi casi non esiste il corrispettivo dei dettagli o della risoluzione dell'immagine.
Perché usare la tecnologia IR invece delle, o in aggiunta alle, immagini convenzionali nello spettro del visibile? I motivi sono diversi:
- L'IR è molto utile quando gli oggetti di interesse si amalgamo nel loro sfondo, sia come occultamento deliberato che per pura coincidenza
- L'IR può aiutare a individuare le persone o gli animali a sangue caldo nel campo visivo
- L'IR è utile anche quando si cercano problemi comuni quali un tubo surriscaldato in un impianto a vapore, fuoco a combustione lenta, un malfunzionamento elettrico, tutte situazioni che possono causare un surriscaldamento localizzato.
L'implementazione di un sottosistema di imaging IR oggi è fortemente semplificato grazie a componenti altamente integrati e dalle alte prestazioni con interfacce di facile uso. Si prenda ad esempio la Termocamera a infrarossi Lepton di FLIR Systems, Inc., (Figura 2). Le sue dimensioni sono circa 10 × 12 × 6 mm, integra un gruppo di ottiche con focale fissa, una serie di sensori microbolometrici ai raggi infrarossi a onda lunga (LWIR) di 80 × 60 pixel per IR da 8 a 14 μm ed elettronica di elaborazione dei segnali.
Figura 2: L'imager FLIR Lepton (in figura senza zoccolo) è un'unità altamente integrata che include l'elaborazione dei segnali e funzioni programmabili dall'utente. (Immagine per gentile concessione di FLIR Systems, Inc.)
L'interconnessione è semplificata grazie all'uso di interfacce video industriali MIPI e SPI e dall'interfaccia di controllo seriale tipo I2C a due fili (Figura 3). Malgrado le dimensioni ridotte e la facilità d'uso, l'unità Lepton vanta prestazioni elevate, con tempi di produzione delle immagini inferiori a 0,5 sec e una sensibilità termica inferiore a di 50 mK. Anche la potenza di lavoro è contenuta: 150 mW (tipico).
Figura 3: Questo diagramma a blocchi semplificato dell'unità Lepton mostra la sua unità di elaborazione delle immagini interna oltre alla serie di sensori base, nonché la sua semplice interfaccia con il sistema dell'utente. (Immagine per gentile concessione di FLIR Systems, Inc.)
Prodotti come questo si avvalgono dell'esperienza diretta dell'utente, per cui FLIR offre una scheda di breakout per i modulo termocamera che è compatibile con le schede di valutazione basate su ARM e Raspberry Pi (Figura 4). Questa scheda di 25 × 24 mm richiede una singola alimentazione tra 3 e 5,5 V e include un clock di sistema a 25 MHz, LDO interni per rail di alimentazione supplementari a basso rumore e connettori standard, nonché una basetta Molex a 32 pin per il modulo Lepton.
(a)
(b)
Figura 4:La scheda di breakout Lepton (a) (in figura senza unità Lepton), consente ai progettisti di valutare e programmare l'unità utilizzando le varie schede di valutazione grazie al suo connettore e alla sua interfaccia standard (b). (Immagini per gentile concessione di FLIR Systems, Inc.)
Il ToF prende il volo
Per molte applicazioni, un'immagine termica è utile ma insufficiente e serve un sistema di immagini nello spettro visibile, spesso in 3D. La soluzione ovvia è procurarsi una videocamera standard, in quanto oggi questo prodotto è disponibile da decine di fornitori in molte risoluzioni, sensibilità alla luce, dimensioni e opzioni di interfaccia. Se sono richieste immagini stereo, usare una coppia di videocamere.
Diversamente dalla termografia che è disponibile da decenni ma che, diversamente da quelle odierne, avevano prestazioni scarse, costi elevati e dissipazione di potenza maggiore, il ToF è relativamente nuovo. Venne proposto per la prima volta come idea accademica negli anni '90, ma i componenti richiesti e le capacità di elaborazione per farlo funzionare sono disponibili solo da un decennio.
Il ToF è spesso l'approccio alle immagini preferito per numerose applicazioni, compresi i veicoli autonomi (auto a guida autonoma) ed è stato testato in strada per milioni di chilometri. (In termini di architettura, un veicolo intelligente o autonomo è un tipo specializzato di sistema robotizzato su ruote, con sensori, algoritmi e azioni definite; è solo questione di prospettiva.) L'approccio ToF ha di fatto alcuni vantaggi specifici rispetto a una fotocamera tradizionale (illustrata sotto).
Come funziona: diversamente dalle immagini con fotocamere tradizionali, i cui principi operativi sono in genere compresi dagli ingegneri e sono in certa misura intuitivi, ToF è meno conosciuto e, per l'implementazione, fa affidamento tanto su equazioni che sul rilevamento dei fotoni. I suoi due componenti principali sono una sorgente luminosa controllata e modulata in modo preciso, un laser a stato solido o un LED (che di solito operano nel campo del quasi infrarosso di 850 μm e quindi invisibile all'occhio umano), e una matrice di pixel per "vedere" i riflessi della luce emessa rimandati indietro dalla scena da acquisire nell'immagine (Figura 5).
Figura 5: Il concetto evoluto del ToF è semplice da usare: si proietta una luce pulsata sulla scena, si catturano gli impulsi della luce riflessa e la loro temporizzazione; l'implementazione vera e propria è molto più complessa ma ora è fattibile. (Immagine per gentile concessione di Texas Instruments)
Per capire pienamente il principio ToF servono equazioni che definiscano il suo funzionamento e che tengano inoltre conto di alcune fonti di errore inevitabili e ne compensino gli effetti. Il processo ToF complessivo può essere effettuato in due modi: la sorgente luminosa viene ripetutamente pulsata con un basso ciclo di lavoro, oppure viene modulato da una sorgente sinusoidale continua o da un'onda quadra. Se si utilizza la modalità pulsata, l'energia della luce riflessa viene campionata utilizzando due finestre fuori fase, e questi campioni vengono usati per calcolare la distanza dal target. Se si usa la modalità continua, il sensore prende quattro campioni per misurazione, sfalsati di 90⁰ ognuno, e si può calcolare l'angolo di fase tra l'illuminazione e la riflessione, e quindi la distanza.
L'uscita di una sequenza e dei calcoli ToF è una nuvola di punti che rappresentano le aree acquisite dell'immagine, da qui il termine "nuvola di punti".[1]
Pro e contro relativi: la decisione tra un sistema di immagini tradizionale a una o due videocamere e un approccio ToF implica dei compromessi centrati sulla specificità dell'applicazione. Per l'ispezione e il riconoscimento dei difetti di base, in cui si conosce in anticipo l'oggetto, e l'obiettivo è l'estrazione/il confronto delle caratteristiche all'interno di un ambiente a illuminazione controllata, spesso la scelta migliore risulta una videocamera singola che offre immagini 2D. Tuttavia, se l'illuminazione è variabile, il ToF potrebbe essere preferibile, dato che è meno influenzato dalle variazioni della luce ambiente.
Per immagini 3D tramite videocamere tradizionali, la decisione ha più risvolti, a partire da quelli meccanici e di montaggio. Anche se questi non ponessero dei problemi, il sistema che elabora l'immagine deve essere dotato di algoritmi robusti per risolvere il problema della "corrispondenza" di un punto nella scena da una videocamera con lo stesso punto nella scena dalla seconda videocamera. Questa corrispondenza richiede molte variazioni della scala dei colori o della scala di grigi e la precisione della profondità è spesso limitata a causa della superficie uniforme della scena acquisita nell'immagine. Per contro, un sistema ToF è meno influenzato da problemi meccanici, di illuminazione e di contrasto, e non richiede la corrispondenza delle immagini per un risultato 3D.
Dati i tempi rapidi di risposta e la loro capacità di gestire diversi tipi di caratteristiche dei soggetti, nonché la natura della nuvola di punti che generano, i sistemi ToF sono particolarmente adatti per tradurre i gesti delle mani, del volto o del corpo in comandi, nonché per catturare l'ambiente circostante in veicoli autonomi. Tuttavia, le soluzioni che usano configurazioni convenzionali a una o due videocamere sono meno costose, data l'ampia disponibilità di questi apparecchi di base.
Implementazione: un sistema ToF ha cinque blocchi funzionali principali:
- Sorgente luminosa: un componente per generare gli impulsi di luce accuratamente temporizzati
- Ottica: una lente per focalizzare la luce sul sensore; probabilmente sarà dotata anche di un filtro passa banda ottico per ridurre il "rumore" della luce ambiente
- Sensore immagini: cattura i riflessi della luce emessa dalla scena illuminata
- Elettronica di gestione: controlla e sincronizza l'unità di illuminazione e il sensore immagini
- Unità di calcolo e interfaccia: calcola la distanza in base alla sincronizzazione dell'illuminazione rispetto ai fotoni restituiti e rilevati
La selezione dell'emittente della luce e quella del sensore immagini sono i primi passi nella configurazione di un sistema ToF. L'emittente può essere un diodo come il modello VSMY1850X01 di Vishay, un dispositivo IR a 850 μm progettato per il funzionamento ad alta velocità. Supporta tempi di salita e di caduta di 10 nsec quando pilotato da 100 mA, il che ne fa una buona scelta per la modalità a impulsi.
Il sensore o la matrice di pixel è il cuore del sistema ToF e ora è disponibile come parte di un dispositivo più grande e più integrato, come il CI sensore/controllore ToF OPT8241 di Texas Instruments (Figura 6). Contiene la sorgente del sensore (voce 3 sopra) e l'elettronica di controllo (voce 4), come viste nel diagramma a blocchi semplificato (Figura 7), e fornisce dati digitalizzati della riflessione a un coprocessore come il controller ToF OPT9221, che calcola i dati della profondità dai dati digitalizzati del sensore. OPT9221 implementa anche varie funzioni di correzione, comprese l'antialiasing, la compensazione della non linearità e la compensazione della temperatura.
Figura 6: Usando OPT8241 di TI assieme al motore di calcolo OPT9221, i progettisti possono realizzare un sistema ToF con un impegno hardware modesto e un numero relativamente esiguo di componenti.
Figura 7: Il diagramma a blocchi semplificato di OPT8241 mostra parte della complessità che usa per implementare il front-end ToF; include il controllo della modulazione e il driver per il LED di illuminazione. (Immagine per gentile concessione di Texas Instruments)
Come per qualsiasi sistema video progettato non solo per acquisire una scena ma per farlo in modo omogeneo e utile, la progettazione del software ToF non è semplice. TI offre un manuale per l'utente dettagliato[2], oltre a uno strumento di valutazione che consente di progettisti di valutare le prestazioni e l'interazione di parametri come la risoluzione della profondità, la risoluzione 2D (numero di pixel), l'intervallo della distanza, la velocità dei fotogrammi, il campo visivo (FoV), la luce ambiente e la riflettanza di un oggetto.
Conclusione
I progettisti dei sistemi robotizzati hanno sempre dovuto affrontare la sfida di come fornire una "percezione dell'ambiente circostante" dettagliata. Fortunatamente, oggi possono accedere a tecnologie ad alte prestazioni, potenti e relativamente poco costose, comprese le immagini ai raggi infrarossi, le videocamere tradizionali e anche LIDAR basati sui principi del tempo di volo. Come risultato, e come conseguenza del loro consumo complessivo basso, molti progetti completi usano una combinazione di questi approcci per superare le carenze di qualsiasi tecnica singola e fornire un'immagine più completa e multidimensionale.
Riferimenti:
- "Videocamera ToF - Presentazione", Texas Instruments
- "Presentazione del progetto di sistemi ToF", Texas Instruments

Esonero della responsabilità: le opinioni, le convinzioni e i punti di vista espressi dai vari autori e/o dai partecipanti al forum su questo sito Web non riflettono necessariamente le opinioni, le convinzioni e i punti di vista di DigiKey o le sue politiche.