Prozessoren mit exzellenter Grafikunterstützung für die visuelle Welt | DigiKey

Von Jon Gabay

Zur Verfügung gestellt von Electronic Products


Mit einfachem Text lässt sich heutzutage kein Blumentopf mehr gewinnen. Um angesichts des Überangebots an Reizen wahrgenommen zu werden, müssen Datenanzeigen schon das ästhetische Empfinden ihres Betrachters ansprechen. Selbst einfachste Informationen sollten in Form von Animationen oder Videos und in lebendigen Farben und komplexen Shadings aufbereitet werden.

Die Kehrseite ist jedoch, dass hohe Auflösungen, satte Farbpaletten, Echtzeit-Animationen und Videos die Prozessorleistung bei Seitenaufbau und Seitenanzeige enorm herausfordern. Der Betrachter erwartet seinerseits eine saubere, flimmer- und störungsfreie Wiedergabe am Bildschirm. Während die Anzeigegeräte eine immer bessere Auflösung bieten, beanspruchen das Inhaltsangebot der Seiten und die bei ihrem Aufruf im Hintergrund stattfindenden Abläufe und Datenbewegungen immer höhere Prozessorleistungen und Speicherkapazitäten.

In diesem Artikel geht es ausschließlich um High-End-Prozessoren, die für die Wiedergabe komplexer Grafiken geeignet sind. Dafür sind in der Regel Prozessoren mit hoher Taktfrequenz und einer Befehlsbreite von mindestens 32 Bit erforderlich. Außerdem sind eine hohe RAM-Geschwindigkeit, ein großer Cache sowie ein direkter Speicherzugriff von Vorteil. Alle in diesem Artikel erwähnten Komponenten, Datenblätter, Anleitungen und Systeme sind auf der Website von DigiKey verfügbar.

Anforderungen und Angebot

Die wenigsten dürften das Glück haben, dass ihre Designs millionenfach produziert werden. Deshalb kommen ASIC-Prozessoren in der Regel als kosten-, zeit- oder risikoarme Option nicht infrage, sondern eher höherpreisige FPGAs bzw. andere leistungsstarke Prozessoren, die Grafiken handeln und zugleich weitere Systemfunktionen ausführen können.

Videos sind heutzutage längst keine triviale Anforderung mehr. Im Gegenteil, denn Datenformatierungen, Sprites, Overlays, Scrollvorgänge, Farbübergänge u. v. m. sind äußerst prozess- und datenintensiv. Das i-Tüpfelchen setzen 3D-Rendering und Shadings auf, die noch einmal zusätzliche Prozessorressourcen schlucken.

Während besonders leistungsfähige Prozessoren direkt als periphere Grafikprozessoren programmierbar sind, können diese Komponenten in der Regel auch eine Vielzahl zusätzlicher Aufgaben bewältigen. Zu den darin enthaltenen High-End-Peripheriekomponenten können eine projiziert-kapazitive Touch-Oberfläche oder Stereo-Soundkomponenten gehören, aber auch Ethernet und andere Kommunikationsprotokolle, die dem Anwendungsprozessor ein möglichst unterbrechungsarmes Arbeiten ermöglichen. Das ist dann in etwa ein „Doppelherz“-Prinzip. Ein leistungsfähiger Speicherdirektzugriff, eine externe Busschnittstellenlogik sowie Universal-E/As sind gemeinhin die Norm.

Die TFT-Displays eines Tablets bieten zumeist Auflösungen zwischen 1.024 x 600 und 2.560 x 1.600 Pixel. Diese große Bandbreite wirkt sich hemmend auf die Systemleistung aus und benötigt viel Arbeitsspeicher (siehe Tabelle 1.) Bei einer vollständigen 24-Bit-Farbpalette werden zum Aufbau einer Seite auf einem 2.560 x 1.600-Display, wie es teils bei Samsung Galaxy, Amazon Kindle und Toshiba-Tablets vorzufinden ist, mehr als 12 MB Arbeitsspeicher benötigt.

Verhältnis zwischen typischen Tablet-Displays und Speicherbedarf bei Seitenaufruf

Tabelle 1: Verhältnis zwischen typischen Tablet-Displays und Speicherbedarf bei Seitenaufruf

Selbst mit einem 32-Bit-Datenbus müssen pro Sekunde 368.640.000 Single-Cycle 24-Bit-Speichertransfers ausgeführt werden, um einen Videostream mit 30 fps (Bilder pro Sekunde) wiederzugeben. Das entspricht 2,7 ns pro Übertragung und ist sehr viel für einen Prozess, der Daten rendert und verschiebt. Selbst ohne Echtzeit-Dekodierung komprimierter Videoformate wie MPEG ist das Rendering schwieriger, als man denken mag.

Weitere Faktoren sind der interne Highspeed-Cache-Speicher und die Schnelligkeit der externen Busschnittstelle. Bei sehr hohen Taktfrequenzen führen Wartezustände am externen Bus-RAM zu einer Überlastung der Prozessoren und zur Beeinträchtigung der Systemperformance. Mit einer hochwertigen SDRAM-Schnittstelle an der externen Busschnittstelle Ihres Prozessors können Sie erreichen, dass die Seiten im Hintergrund aktualisiert werden und sich der Prozessor vollständig dem Rendern widmen kann.

Leistungsstarke Prozessoren und insbesondere solche, die zur schnellen Ein- und Ausgabe von Daten in der Lage sind, können speziell zur Grafiksteuerung verwendet werden. Ein Beispiel für eine mustergültig implementierte Highspeed-SDRAM-Schnittstelle ist der auf dem PC MPC603e basierende Freescale MPC8245LVV333D, der Teil der MPC82xx-Serie ist. Dieser 32-Bit, 352-polige Prozessor hat eine Taktfrequenz von 333 MHz; andere Vertreter aus dieser Baureihe takten teils sogar noch schneller. Der Prozessor ist als 2 V-, 1,8 V- und 1,5 V-Ausführung erhältlich und kann damit zur Verringerung des Strombedarfs für dieses 4,5 Millionen Transistoren umfassende Gerät beitragen.

Der MPC8245 kombiniert die Power PC-Architektur mit einer PCI-Brücke, was die zeitsparende Systementwicklung mithilfe von Peripheriegeräten für PCI und weiteren Standardschnittstellen ermöglicht. Seine CPU ist imstande, unterschiedliche Frequenzen zu verarbeiten, wodurch Leistung und Stromverbrauch angepasst werden können. Dank der peripheren Steuereinheit, die auch die DMA-Funktionen in die externe Bus-Schnittstellenlogik kaskadiert, können SDRAM-Synchronisierung und -Ansteuerung unabhängig voneinander erfolgen, wodurch die Daten autonom und mit hoher Geschwindigkeit an Anzeigegeräte übertragen werden können. Dies setzt Prozessorspeicher frei, der dann zum Rendern im Hintergrund verfügbar ist (Abbildung 1).

Optimierter Prozessorblock, gekoppelt mit leistungsfähiger externer Highspeed-Speicherschnittstelle

Abbildung 1: Ein optimierter Prozessorblock, der mit einer leistungsstarken externen Highspeed-Speicherschnittstelle gekoppelt ist, ist ein geeigneter Kandidat für einen dedizierten Grafikprozessor und als halbautonomes High-End-Peripheriebauteil nutzbar. Für bestimmte Anwendungen kann dies schon ausreichend sein.

Die SDRAM-Schnittstelle unterstützt bemerkenswerte 2 GByte SDRAM. Der Bus mit hoher Bandbreite kann Übertragungszyklen von 32 oder 64 Bit stemmen. Die integrierte DMA-Steuerung ermöglicht Scatter/Gather-Operationen und unterstützt die Verkettung von DMA-Übertragungen zur automatischen Verbindung von DMA-Pufferspeichern. Damit hat der Hauptprozessor eine Aufgabe weniger zu erledigen.

Texas Instruments, ein langjähriger Entwickler und Wegbereiter auf dem Sektor der digitalen Grafik und Bildbearbeitung, bietet mit seiner Serie OMAP35x Prozessoren und Tools an, die sich sehen lassen können. Die OMAP-Plattform vereint einen leistungsfähigen, superskalaren 600 MHz ARM® Cortex™-A8-Kern mit vier möglichen OMAP-Anwendungsprozessoren.

Besonders interessant ist der als bester seiner Klasse für Video-, Bild- und Grafikverarbeitung beworbene OMAP3530, der eine direkte Unterstützung für Video-Streaming, mobile 2D/3D-Games sowie Videoaufnahmen bietet. Der OMAP3530 enthält einen Grafikbeschleuniger und eigene Video-Eingangs- und -Ausgangsports.

Hervorzuheben sind die 64-Kanal- DMA-Unterstützung und die sparsame DDR-Schnittstelle. Wie auch bei anderen Prozessoren ist der RAM recht ressourcenintensiv, wobei der 64 K große Allround-Arbeitsspeicher in diesem Fall normalerweise jeweils eine oder zwei Scanlines enthält. Ebenfalls nicht verkehrt ist der auf dem Chip vorhandene 256 KB große Cache-Speicher der Ebene 2, in dem Vorlagen und zum Teil Hintergrundgrafikdaten gespeichert werden können. Zu beachten ist ferner, dass weitere 96 KB Arbeitsspeicher für DSP-Rendering und -Nutzung zur Verfügung stehen. Darüber hinaus ist im 3530 ein hardwarebasierter Grafikbeschleuniger integriert.

Diese Komponenten werden sowohl durch TI als auch durch Dritthersteller von Entwicklungstools unterstützt. Das BeagleBoard von Circuitco Electronics unterstützt OMAP3530 und illustriert Verbindungen zu SDRAM-, S-Video- und DVI-D-Schnittstellen sowie sämtliche LCD-Schnittstellensignale (Abbildung 2). Auf der DigiKey-Website finden sich ein Online-Produktschulungsmodul für BeagleBoard sowie eine illustrierte Videoanleitung für die Steuerung von Pico-Projektoren mithilfe von BeagleBoards und Linux. Diese Projektoren können als Videoschnittstelle sehr interessant sein.

BeagleBoard nutzt OMAP-Prozessorarchitektur

Abbildung 2: Das BeagleBoard nutzt die OMAP-Prozessorarchitektur und dient als leistungsfähige Test- und Entwicklungsplattform besonders für eingebettete Linux-Designs. Es eignet sich bestens zur Displayansteuerung und für Pico-Projektoren.

Logic PD wandelt den SOMOMAP3530-11-1782JFIR in eine Entwicklungs- und Evaluierungsplattform, die den OMAP3530 unterstützt und den ARM Cortex-M8-Prozessor mit einem TMS320C64x DSP-Prozessor kombiniert. Während dies zwar primär auf die Signalverarbeitung zielt, handelt es sich dabei um ein durchaus nützliches Plattform-Entwicklungstool.

Multicore-Alternativen

Multi-Prozessorchips sind mitunter eine gute Alternative zur Implementierung von Multiprozessorsystemen. Während es bei der Nutzung desselben Speichers bzw. derselben peripheren Busse zu Einschränkungen hinsichtlich der Bandbreite kommen kann, arbeiten Multicore-Prozessoren auch dann sehr zuverlässig – vorausgesetzt, die Aufgaben werden effizient partitioniert.

Eine bekannte und weit verbreitete Multicore-Familie stammt von Freescale. Es handelt sich um die leistungsfähige ARM 8- bis ARM 11-basierte Prozessorbaureihe i.MX 6, die in den verschiedensten Ausführungen bis hin zu einer Quad-Core-Komponente mit 1,2 GHz und einer 64-Bit DDR 3- sowie zwei 32-Bit DDR 2-Schnittstellen erhältlich ist.

Eine geeignete Freescale i.MX6sololite-Komponente für 2D- und 3D-Grafiken ist der MCIMX6L3DVN10AA, ein 432-poliger, ROM-loser Prozessor mit 1 GHz-Einzelkern. Bemerkenswert sind die 256 kB On-Chip-RAM sowie die Stromversorgung, die sich auf 0,95 V herunter dimmen lässt.

Diese skalierbaren Bauteile sind explizit für Multimedia- und Grafikanwendungen geschaffen. Ein Hardware-Grafikbeschleunigungsblock ist speziell für Vektor- sowie 2D- und 3D-Grafiken zuständig und verschont den Prozessor mit diesen datenintensiven Prozessen. Ein weiterer spezieller Block für die Bildverarbeitung kümmert sich um Kontraste, Inversionen, Rotationen, Scrollen, Größenänderungen und Blending, um nur einige Funktionen zu nennen. Ein dritter Hardwareblock bildet eine Schnittstelle für Kameras und Displays (Abbildung 3).

Die beste Leistung lässt sich erzielen, wenn dedizierte Hardwareblöcke auf Highspeed-Busse und umfangreiche Speicherpools zugreifen können.

Abbildung 3: Die beste Leistung lässt sich erzielen, wenn dedizierte Hardwareblöcke auf Highspeed-Busse und umfangreiche Speicherpools zugreifen können. Damit kann eine ASIC-ähnliche Performance erzielt werden – zu geringeren Kosten und mit mehr integrierten Peripheriekomponenten.

Der größere 624-polige MCIMX6S5DVM10AB von Freescale kommt ebenfalls ohne ROM daher, dafür mit dedizierter Grafikhardware und einem ARM Cortex-A9. Eine Stufe höher angesiedelt sind die Doppel- oder Vierkernprozessoren. Diese bieten Funktionen, die Einzelkern-CPUs nicht in Echtzeit bewältigen können. Die i.MX6-Reihe umfasst auch Quad-Core-Prozessoren mit 1,2 GHz wie den MCIMX6Q5EYM10AC. Diese Komponenten bieten außerdem eine duale 2D-Grafikunterstützung sowie eine 3D-Unterstützung mit vier zusätzlichen Shader-Einheiten.

Zusammenfassend lässt sich sagen, dass ASIC-Prozessoren zwar eine effektive Lösung für komplexe Grafiken und Videos sind, jedoch mit einem hohen zeitlichen und finanziellen Aufwand verbunden sind, den sich die wenigsten Entwickler leisten können. Doch glücklicherweise gibt es, wie in diesem Artikel gezeigt, darüber hinaus eine Vielzahl überzeugender Prozessoren mit intelligenten Video- und Bildbearbeitungsfunktionen, die problemlos mithalten können.

Weitere Informationen zu den in diesem Artikel beschriebenen Komponenten finden Sie über die bereitgestellten Links zu den Produktseiten auf der DigiKey-Website.

Haftungsausschluss: Die Meinungen, Überzeugungen und Standpunkte der verschiedenen Autoren und/oder Forumsteilnehmer dieser Website spiegeln nicht notwendigerweise die Meinungen, Überzeugungen und Standpunkte der DigiKey oder offiziellen Politik der DigiKey wider.

Über den Autor

Jon Gabay

Über den Verlag

Electronic Products

Das Magazin "Electronic Products" und "ElectronicProducts.com" dienen Ingenieuren und technischen Führungskräften, die für die Entwicklung elektronischer Geräte und Systeme verantwortlich sind.