Accelerazione delle prestazioni di rete: l'impatto di RDMA over Converged Ethernet (RoCE)
2024-12-27
La rapida evoluzione delle applicazioni ad alta intensità di calcolo ha accentuato la necessità di soluzioni di rete più veloci, efficienti e scalabili. Tra le tecnologie più innovative che stanno emergendo per soddisfare questa domanda c'è Remote Direct Memory Access (RDMA) over Converged Ethernet (RoCE). Questa tecnologia innovativa facilita il trasferimento diretto dei dati tra i sistemi senza l'intervento della CPU, riducendo in modo significativo la latenza e migliorando le prestazioni complessive del sistema. iWave, un'importante società di progettazione di FPGA, è all'avanguardia in questo campo, avendo implementato una robusta soluzione 100G Ethernet che integra IP ERNIC (Ethernet RDMA Network Interface Controller Intellectual Property) di AMD nel proprio portafoglio di moduli di elaborazione embedded. Questa integrazione è destinata a migliorare le funzionalità RDMA nelle applicazioni ad alte prestazioni.
Figura 1: RoCE facilita il trasferimento diretto dei dati tra i sistemi senza l'intervento della CPU, riducendo significativamente la latenza e migliorando le prestazioni complessive del sistema. (Immagine per gentile concessione di iWave)
Informazioni su RDMA over Converged Ethernet (RoCE)
RDMA è una tecnologia fondamentale che consente il trasferimento diretto di memoria tra host o server, aggirando di fatto la CPU. Questa capacità consente alle CPU di concentrarsi sull'esecuzione delle applicazioni e sull'elaborazione dei dati, portando a notevoli miglioramenti nelle prestazioni di rete caratterizzate da una riduzione della latenza, da un minor carico sulla CPU e da un aumento della larghezza di banda, il tutto in maniera economicamente vantaggiosa. RoCE è un protocollo di rete specifico progettato per facilitare le operazioni RDMA sulle reti Ethernet. Sfruttando l'infrastruttura Ethernet esistente, RoCE rappresenta un'opzione interessante per le aziende che desiderano migliorare le prestazioni senza modificare le attuali configurazioni di rete.
Tipi di RoCE
RoCE è suddiviso in due versioni distinte in base alla scheda di rete utilizzata: RoCE v1 e RoCE v2.
- RoCE v1: questo protocollo consente la comunicazione tra due host all'interno dello stesso dominio di trasmissione Ethernet (VLAN). Utilizza Ethertype 0x8915 e limita i frame Ethernet standard a 1500 byte, mentre consente ai frame Ethernet jumbo di estendersi fino a 9000 byte.
- RoCE v2: risolvendo i limiti di RoCE v1, RoCE v2 introduce miglioramenti nell'incapsulamento dei pacchetti incorporando le intestazioni IP e UDP. Questa modifica consente a RoCE v2 di funzionare senza problemi su reti sia di livello 2 (Data Link Layer) che di livello 3 (Network Layer), supportando così il routing di livello 3 e la scalabilità su più sottoreti. Spesso chiamato Routable RoCE (RRoCE), RoCE v2 aggiunge anche il supporto per multicast IP, ampliando ulteriormente la sua applicabilità.
ERNIC IP: potenziamento delle funzionalità RDMA
IP ERNIC (Embedded RDMA enabled NIC) è un core IP per controller di interfaccia di rete Ethernet RDMA personalizzabile, progettato per una perfetta integrazione con FPGA, MPSoC e implementazioni IP soft MAC di AMD. Questa soluzione è caratterizzata da un'elevata velocità di trasmissione, una bassa latenza e un meccanismo di trasferimento dati affidabile e completamente scaricato dall'hardware su Ethernet standard. iWave ha dimostrato il suo impegno per il progresso tecnologico implementando con successo una soluzione 100G Ethernet. Questo risultato è stato possibile grazie all'utilizzo del kit di sviluppo alimentato da MPSoC Zynq UltraScale+ di iWave, che integra IP ERNIC di AMD.
Il kit di sviluppo MPSoC Zynq UltraScale+ è specificamente progettato per la prototipazione e la valutazione di soluzioni 100G Ethernet, utilizzando connettori QSFP-28 ad alta velocità.
Configurazione demo
Una tipica configurazione demo (Figura 2) consiste in:
- Kit di sviluppo alimentato da MPSoC ZU19EG Zynq UltraScale+ di iWave
- NIC 100G Mellanox ConnectX-5 di Advantech
- NIC 1G abilitato da sincronizzazione 1588 PTP
- Cavo MTP, moduli QSFP-28 e cavo Ethernet CAT6 RJ45
- PC server Ubuntu 22.04
Figura 2: La tipica configurazione del kit di sviluppo MPSoC Zynq UltraScale+. (Immagine per gentile concessione di iWave)
Panoramica dell'architettura del sistema
L'architettura del sistema è progettata per ottimizzare il trasferimento dei dati, con ruoli chiaramente definiti tra i componenti del sistema di elaborazione (PS) e della logica programmabile (PL). L'implementazione prevede anche la sincronizzazione PTP (protocollo temporale di precisione), fondamentale per le applicazioni in tempo reale. Grazie alle notevoli prestazioni, come la capacità di gestire video in 8K a oltre 100 fps, le potenziali applicazioni spaziano in vari settori, tra cui i data center, il multimedia e l'elaborazione ad alte prestazioni, sottolineando la versatilità e l'importanza di questa tecnologia nei moderni ambienti informatici.
L'architettura di alto livello del sistema, rappresentata nella Figura 3, evidenzia i ruoli distinti dei componenti PS e PL all'interno dell'MPSoC Zynq UltraScale+. Il PS è dotato di un SoC basato su ARM Cortex-A53, essenziale per la configurazione, il controllo e la diagnostica del sistema. I componenti chiave di questa architettura includono:
- Driver MAC per 100G Ethernet: garantisce prestazioni robuste e trasmissione dati a bassa latenza a 100 Gbps
- Driver del controller ERNIC: responsabile della gestione dei dati in entrata nella DDR e della comunicazione tra l'applicazione utente e l'IP ERNIC attraverso scambi efficienti delle notifiche
- Librerie RDMA Core e User Space: assicurano la compatibilità e le prestazioni ottimali per le operazioni RDMA sia nel kernel che nello spazio utente
Figura 3: Punti salienti dei ruoli distinti del sistema di elaborazione e dei componenti logici programmabili all'interno dell'MPSoC Zynq UltraScale+. (Immagine per gentile concessione di iWave)
L'IP ERNIC di AMD scarica efficacemente lo stack RoCE v2 sull'FPGA, con il controller ERNIC che gestisce l'handshake tra i vari moduli per facilitare il trasferimento dei dati. Genera voci nella coda di lavoro e invia notifiche (campanelli) all'IP ERNIC. Contemporaneamente, il sottosistema 100G Ethernet dell'MPSoC Zynq UltraScale+ gestisce lo strato MAC e quello fisico, mentre Data Pattern Generator si occupa della produzione di dati grezzi e modelli di dati video.
Protocollo temporale di precisione (PTP)
L'indicatore di data e ora PTP (standard IEEE 1588) svolge un ruolo fondamentale nella sincronizzazione dell'ora tra i sistemi di una rete Ethernet. Questa sincronizzazione è fondamentale per migliorare le prestazioni delle applicazioni in tempo reale, consentendo scambi di dati sincronizzati e a bassa latenza al livello dei nanosecondi.
Punti salienti della configurazione
Le caratteristiche salienti di questa configurazione includono:
- Implementazione di 100G Ethernet su RoCE v2 utilizzando l'IP ERNIC di AMD
- Tipo di trasporto di connessione affidabile
- Funzionalità RDMA SEND, RDMA READ e RDMA WRITE per la gestione dei pacchetti
- Supporto per i tipi di messaggio Invio RDMA immediato e Scrittura RDMA immediata
- Test delle prestazioni per RDMA utilizzando le applicazioni XRPING e PERFTEST
- Generatore di modelli di dati personalizzati per modelli di dati RAW e video
- Inserimento di indicatore di data e ora PTP accanto ai dati
Le statistiche dettagliate sul throughput dei trasferimenti di dati video dal kit di sviluppo MPSoC Zynq UltraScale+ al PC server rivelano prestazioni impressionanti, con la capacità di gestire video in 8K a oltre 100 fps e video in 4K a oltre 400 fps.
Applicazioni potenziali
L'integrazione di RDMA over Converged Ethernet e IP ERNIC apre nuove strade in diversi settori, migliorando significativamente la connettività, le prestazioni e l'efficienza in una serie di applicazioni, tra cui:
- Data center e cloud computing: facilita la comunicazione efficiente dei server e accelera l'elaborazione dei dati nelle architetture cloud
- Acquisizione e trasferimento di video/immagini: vantaggioso per applicazioni multimediali, di radiodiffusione e ambienti di realtà virtuale (VR)
- Soluzioni di storage: consentono trasferimenti di dati più rapidi tra i dispositivi di archiviazione e i server, migliorando così le prestazioni del sistema di archiviazione
- Calcolo ad alte prestazioni (HPC): migliora la velocità di trasferimento dei dati e riduce la latenza all'interno dei cluster HPC per velocizzare le operazioni di calcolo e le simulazioni
- Dispositivi edge IoT: consentono la raccolta e la trasmissione di dati in tempo reale da sensori e dispositivi
Con la continua crescita della domanda di soluzioni di trasferimento dati più veloci ed efficienti, RDMA over Converged Ethernet e IP ERNIC sono destinati a svolgere un ruolo fondamentale nel futuro del calcolo ad alte prestazioni.
Conclusione
L'ampio portafoglio di piattaforme FPGA e SoC FPGA di iWave, unito alla sua profonda esperienza tecnica, consente ai clienti di sviluppare prodotti all'avanguardia che sfruttano i più recenti progressi nell'intelligenza artificiale (AI), nell'apprendimento automatico e nell'edge computing. Collaborando con iWave, le aziende possono accelerare lo sviluppo dei loro prodotti, ridurre i rischi e rimanere all'avanguardia in un panorama tecnologico sempre più complesso.
Per ulteriori informazioni o per discutere di requisiti personalizzati, contattateci all'indirizzo mktg@iwave-global.com.
Esonero della responsabilità: le opinioni, le convinzioni e i punti di vista espressi dai vari autori e/o dai partecipanti al forum su questo sito Web non riflettono necessariamente le opinioni, le convinzioni e i punti di vista di DigiKey o le sue politiche.




