Mike
Administrator
Comdex: Nvidia präsentiert neuen 3D-Grafikchip GeForceFX
Nvidias neuer 3D-Prozessor GeForceFX, bislang unter der Codebezeichnung NV30 gehandelt, bricht mit 125 Millionen Transistoren und 500 MHz Speichertakt einmal mehr alle Rekorde. Er soll durch Cinematic Rendering die letzte Hürde zu realistisch wirkenden 3D-Welten nehmen.
Wie erwartet nutzt der Chip keinen 256-Bit-Datenbus, sondern weiterhin einen 128 Bit breiten Datenpfad zum lokalen Speicher. Die erforderliche Speicherleistung erzielt Nvidia durch Einsatz der schnellsten verfügbaren DDR2-Speicherchips von Samsung, die für 500 MHz Speichertakt spezifiziert sind und eine effektive Datentransferrate von 1 GHz erreichen. Damit kommt Nvidia allerdings nicht an das theoretische Maximum von 19,8 GByte/s des Radeon 9700 Pro heran, sondern muss sich mit 16 GByte/s begnügen. Beide Architekturen haben ihre Vor- und Nachteile: Der Nvidia-Speicher lässt sich effektiver nutzen, da die kleinste adressierbare Einheit nur halb so groß ist wie beim Radeon 9700/9500. Und ATI hat wegen der niedrigeren Taktfrequenz von 310 MHz weniger Latenz und weniger Wartezyklen im Speichertiming.
Beide Hersteller nutzen zudem Kompressionsverfahren für die Grafikdaten, was die Speicherleistung indirekt weiter erhöht. Nvidia verweist beim GeForceFX auf eine verlustlose 4:1-Kompression der Pixeldaten und ein schnelles Löschen des Framebuffers (Intellisample). ATI spricht beim Radeon 9700/9500 lediglich von einer Z-Daten-Kompression und einem Fast-Z-Clear (HyperZ III). Welche Methode wirksamer ist, muss die Praxis zeigen.
Bei der Taktfrequenz des Chips selbst ist sich Nvidia noch nicht sicher. Sie soll aber eher bei beindruckenden 500 MHz als bei 400 MHz liegen. Der Geometriedurchsatz soll jedenfalls das Dreifache eines GeForce4 Ti4600 betragen, was für einen vierfach parallelen Vertex Shader und annähernd 500 MHz spricht. Man möchte jedenfalls die höchst mögliche Leistung aus der neuen 0,13-µm-Technik herausholen. Schließlich führt der Chipfabrikant TSMC die interne Verdrahtung nicht mehr in Aluminium, sondern in Kupfer aus (copper interconnect), das die Signale schneller zwischen den Baugruppen des Chips transportiert. Kompromisslos ist auch die Kühltechnik: Heatpipes leiten die Abwärme des Chips zu einem Wärmetauscher beim Slotblech, über den der Lüfter kühle Außenluft ansaugt. Dass die Grafikkarte zwei Slots belegt und wie bei ATI ihren Strom über einen separaten Anschluss direkt vom Netzteil bezieht, dürfte dann auch nicht mehr überraschen.
Hohe Speichereffizienz macht sich spätestens beim Antialiasing bezahlt. Nvidia fügt den AA-Modi des GeForce4 (2X, Qunicuncx, 4X, 4XS) noch die Modi 6XS und 8X hinzu. Allerdings nutzen die Modi 4X und 8X lediglich ein regelmäßiges Subpixel-Raster (ordered grid), mit dem die Glättungswirkung der Kanten weniger gut ausfällt. Ein gutes Ergebnis kann man dagegen von den Modi 4XS und 6XS (skewed grid) erwarten. Leider stehen sie nur unter Direct3D zur Verfügung.
Eine andere Neuerung ist adaptive Textur-Filterung. GeForceFX ka
nn die Zahl und den Typ der Samples für die Texturierung den Gegebenheiten anpassen und so die Geschwindigkeit bei trilinearer und anisotroper Filterung erhöhen. Die Bildqualität würde dabei nicht beeinträchtigt. Dieser Filter-Modus ist abschaltbar.
DirectX 9 übererfüllt
Der wesentliche Unterschied zwischen den beiden DirectX-9-Chips Radeon 9700/9500 und GeForceFX ist zweifellos in den Fähigkeiten der jeweiligen Vertex und Pixel Shader zu suchen. Der ATI-Chip ist ein relativ exaktes Abbild von DirectX 9.0 und verarbeitet Pixel-Shader-Programme mit einer Länge von maximal 160 Befehlen. Für Konstanten und Zwischenergebnisse stehen 44 Register zur Verfügung. Der GeForceFX kann dagegen Shader aus maximal 1024 Befehlen verarbeiten und verfügt über 64 Register. Auch der Befehlssatz geht bei Nvidia über die Vorgaben von DirectX 9 hinaus. Insbesondere ist mittels Schreibmasken die bedingte Ausführung von Programmteilen möglich, wodurch sich Code-Teile mehrfach verwenden lassen und lange Shader-Programme erst sinnvoll einsetzbar sein sollen. Vertex-Shader-Programme sind beim Nvidia-Chip ebenfalls länger und flexibler. Prinzipiell ist der Radeon 9700/9500 gleichfalls in der Lage, komplexe Pixel-Shader-Programe auszuführen. Allerdings muss er diese in mehrere Teile zerlegen und im Multipass-Verfahren abarbeiten.
Auch bei der Genauigkeit legt der GeForceFX eins drauf. Farbberechnungen führt sein Pixel-Shader in einem 32-Bit-Gleitkommaformat aus. Alternativ steht noch ein doppelt so schnelles 16-Bit-Format zur Verfügung. Der ATI-Shader arbeitet bei Farbberechnungen mit einem 24-Bit-Gleitkommaformat.
Im Pixel Shader sieht Nvidia den Schlüssel zu besseren Bildern. Um schwierige Flächen wie Fell, Haut, Vinyl, gebürstetes Metall oder blätternde Farbe zu erzeugen, seien für jedes Pixel hunderte von Berechnungen zu durchlaufen. Mit genügend Shader-Power lassen sich anstelle vorgefertigter Texturen auch prozedurale Texturen für Stein- oder Holzmaserungen direkt im Grafikchip errechnen. All diese Möglichkeiten findet man in gleicher Weise in Profi-Software wie Softimage oder RenderMan, die Animationsstudios für Effekte in TV- und Kinoproduktionen einsetzen. Nvidia hat nämlich nicht nur Spiele im Auge, sondern möchte aus Prestige-Gründen, dass der GeForceFX auch für Animationsstudios interessant ist.
Die dort eingesetzten Software-Renderer bewältigen zwar beliebig komplexe Effekte, lassen den Designer aber auf jede simple Preview minutenlang warten. In der Praxis ist dadurch die Zahl der Optimierungsschritte für Texturierung, Ausleuchtung und Reflexionsverhalten begrenzt. Dagegen präsentiert Hardware wie der Radeon 9700 oder der GeForceFX das Ergebnis nicht nur unmittelbar sondern auch als bewegliches 3D-Modell -- ein Traum für jeden 3D-Designer. Nvidia unterstützt die Entwicklung von Shader-Programmen mit einem Compiler für die eigene Grafiksprache Cg, der in Softimage, 3D Studio und Maya als Plugin zur Verfügung steht.
Spielepraxis
In Spielen sind hochkomplexe Shader-Programme für ultrarealistische Effekte nur bedingt praktikabel. Hunderte von Rechenschritten auf Pixelebene sind mit den erforderlichen Bildraten vo
n mindestens 30 fps allenfalls vereinbar, wenn das betreffende Objekt das Bild nicht dominiert. Es ist daher schwer vorstellbar, dass Spieleentwickler die Shader des GeForceFX voll ausreizen. Wahrscheinlicher ist, dass man sich auf die ATI-Fähigkeiten als größten gemeinsamen Nenner beschränkt. Für die Spielepraxis wird ausschlaggebender sein, welche der beiden Architekturen beim Antialiasing und anisotroper Texturfilterung schneller ist und besser aussieht. Natürlich ist auch der reine Polygon- und Pixeldurchsatz von Interesse.
Nvidia macht zur Zeit noch keine Angaben zu verschiedenen Geschwindigkeits-Versionen oder kostenoptimierten Ablegern des GeForceFX, sondern arbeitet noch daran, die Chipausbeute zu erhöhen. In diesem Jahr werden allenfalls einzelne Exemplare in den Handel kommen. Mit breiter Verfügbarkeit ist dagegen erst Januar oder Februar 2003 zu rechnen. Der Preis der entsprechenden Grafikkarte wird voraussichtlich über 600 Euro liegen.
Nvidias neuer 3D-Prozessor GeForceFX, bislang unter der Codebezeichnung NV30 gehandelt, bricht mit 125 Millionen Transistoren und 500 MHz Speichertakt einmal mehr alle Rekorde. Er soll durch Cinematic Rendering die letzte Hürde zu realistisch wirkenden 3D-Welten nehmen.
Wie erwartet nutzt der Chip keinen 256-Bit-Datenbus, sondern weiterhin einen 128 Bit breiten Datenpfad zum lokalen Speicher. Die erforderliche Speicherleistung erzielt Nvidia durch Einsatz der schnellsten verfügbaren DDR2-Speicherchips von Samsung, die für 500 MHz Speichertakt spezifiziert sind und eine effektive Datentransferrate von 1 GHz erreichen. Damit kommt Nvidia allerdings nicht an das theoretische Maximum von 19,8 GByte/s des Radeon 9700 Pro heran, sondern muss sich mit 16 GByte/s begnügen. Beide Architekturen haben ihre Vor- und Nachteile: Der Nvidia-Speicher lässt sich effektiver nutzen, da die kleinste adressierbare Einheit nur halb so groß ist wie beim Radeon 9700/9500. Und ATI hat wegen der niedrigeren Taktfrequenz von 310 MHz weniger Latenz und weniger Wartezyklen im Speichertiming.
Beide Hersteller nutzen zudem Kompressionsverfahren für die Grafikdaten, was die Speicherleistung indirekt weiter erhöht. Nvidia verweist beim GeForceFX auf eine verlustlose 4:1-Kompression der Pixeldaten und ein schnelles Löschen des Framebuffers (Intellisample). ATI spricht beim Radeon 9700/9500 lediglich von einer Z-Daten-Kompression und einem Fast-Z-Clear (HyperZ III). Welche Methode wirksamer ist, muss die Praxis zeigen.
Bei der Taktfrequenz des Chips selbst ist sich Nvidia noch nicht sicher. Sie soll aber eher bei beindruckenden 500 MHz als bei 400 MHz liegen. Der Geometriedurchsatz soll jedenfalls das Dreifache eines GeForce4 Ti4600 betragen, was für einen vierfach parallelen Vertex Shader und annähernd 500 MHz spricht. Man möchte jedenfalls die höchst mögliche Leistung aus der neuen 0,13-µm-Technik herausholen. Schließlich führt der Chipfabrikant TSMC die interne Verdrahtung nicht mehr in Aluminium, sondern in Kupfer aus (copper interconnect), das die Signale schneller zwischen den Baugruppen des Chips transportiert. Kompromisslos ist auch die Kühltechnik: Heatpipes leiten die Abwärme des Chips zu einem Wärmetauscher beim Slotblech, über den der Lüfter kühle Außenluft ansaugt. Dass die Grafikkarte zwei Slots belegt und wie bei ATI ihren Strom über einen separaten Anschluss direkt vom Netzteil bezieht, dürfte dann auch nicht mehr überraschen.
Hohe Speichereffizienz macht sich spätestens beim Antialiasing bezahlt. Nvidia fügt den AA-Modi des GeForce4 (2X, Qunicuncx, 4X, 4XS) noch die Modi 6XS und 8X hinzu. Allerdings nutzen die Modi 4X und 8X lediglich ein regelmäßiges Subpixel-Raster (ordered grid), mit dem die Glättungswirkung der Kanten weniger gut ausfällt. Ein gutes Ergebnis kann man dagegen von den Modi 4XS und 6XS (skewed grid) erwarten. Leider stehen sie nur unter Direct3D zur Verfügung.
Eine andere Neuerung ist adaptive Textur-Filterung. GeForceFX ka
nn die Zahl und den Typ der Samples für die Texturierung den Gegebenheiten anpassen und so die Geschwindigkeit bei trilinearer und anisotroper Filterung erhöhen. Die Bildqualität würde dabei nicht beeinträchtigt. Dieser Filter-Modus ist abschaltbar.
DirectX 9 übererfüllt
Der wesentliche Unterschied zwischen den beiden DirectX-9-Chips Radeon 9700/9500 und GeForceFX ist zweifellos in den Fähigkeiten der jeweiligen Vertex und Pixel Shader zu suchen. Der ATI-Chip ist ein relativ exaktes Abbild von DirectX 9.0 und verarbeitet Pixel-Shader-Programme mit einer Länge von maximal 160 Befehlen. Für Konstanten und Zwischenergebnisse stehen 44 Register zur Verfügung. Der GeForceFX kann dagegen Shader aus maximal 1024 Befehlen verarbeiten und verfügt über 64 Register. Auch der Befehlssatz geht bei Nvidia über die Vorgaben von DirectX 9 hinaus. Insbesondere ist mittels Schreibmasken die bedingte Ausführung von Programmteilen möglich, wodurch sich Code-Teile mehrfach verwenden lassen und lange Shader-Programme erst sinnvoll einsetzbar sein sollen. Vertex-Shader-Programme sind beim Nvidia-Chip ebenfalls länger und flexibler. Prinzipiell ist der Radeon 9700/9500 gleichfalls in der Lage, komplexe Pixel-Shader-Programe auszuführen. Allerdings muss er diese in mehrere Teile zerlegen und im Multipass-Verfahren abarbeiten.
Auch bei der Genauigkeit legt der GeForceFX eins drauf. Farbberechnungen führt sein Pixel-Shader in einem 32-Bit-Gleitkommaformat aus. Alternativ steht noch ein doppelt so schnelles 16-Bit-Format zur Verfügung. Der ATI-Shader arbeitet bei Farbberechnungen mit einem 24-Bit-Gleitkommaformat.
Im Pixel Shader sieht Nvidia den Schlüssel zu besseren Bildern. Um schwierige Flächen wie Fell, Haut, Vinyl, gebürstetes Metall oder blätternde Farbe zu erzeugen, seien für jedes Pixel hunderte von Berechnungen zu durchlaufen. Mit genügend Shader-Power lassen sich anstelle vorgefertigter Texturen auch prozedurale Texturen für Stein- oder Holzmaserungen direkt im Grafikchip errechnen. All diese Möglichkeiten findet man in gleicher Weise in Profi-Software wie Softimage oder RenderMan, die Animationsstudios für Effekte in TV- und Kinoproduktionen einsetzen. Nvidia hat nämlich nicht nur Spiele im Auge, sondern möchte aus Prestige-Gründen, dass der GeForceFX auch für Animationsstudios interessant ist.
Die dort eingesetzten Software-Renderer bewältigen zwar beliebig komplexe Effekte, lassen den Designer aber auf jede simple Preview minutenlang warten. In der Praxis ist dadurch die Zahl der Optimierungsschritte für Texturierung, Ausleuchtung und Reflexionsverhalten begrenzt. Dagegen präsentiert Hardware wie der Radeon 9700 oder der GeForceFX das Ergebnis nicht nur unmittelbar sondern auch als bewegliches 3D-Modell -- ein Traum für jeden 3D-Designer. Nvidia unterstützt die Entwicklung von Shader-Programmen mit einem Compiler für die eigene Grafiksprache Cg, der in Softimage, 3D Studio und Maya als Plugin zur Verfügung steht.
Spielepraxis
In Spielen sind hochkomplexe Shader-Programme für ultrarealistische Effekte nur bedingt praktikabel. Hunderte von Rechenschritten auf Pixelebene sind mit den erforderlichen Bildraten vo
n mindestens 30 fps allenfalls vereinbar, wenn das betreffende Objekt das Bild nicht dominiert. Es ist daher schwer vorstellbar, dass Spieleentwickler die Shader des GeForceFX voll ausreizen. Wahrscheinlicher ist, dass man sich auf die ATI-Fähigkeiten als größten gemeinsamen Nenner beschränkt. Für die Spielepraxis wird ausschlaggebender sein, welche der beiden Architekturen beim Antialiasing und anisotroper Texturfilterung schneller ist und besser aussieht. Natürlich ist auch der reine Polygon- und Pixeldurchsatz von Interesse.
Nvidia macht zur Zeit noch keine Angaben zu verschiedenen Geschwindigkeits-Versionen oder kostenoptimierten Ablegern des GeForceFX, sondern arbeitet noch daran, die Chipausbeute zu erhöhen. In diesem Jahr werden allenfalls einzelne Exemplare in den Handel kommen. Mit breiter Verfügbarkeit ist dagegen erst Januar oder Februar 2003 zu rechnen. Der Preis der entsprechenden Grafikkarte wird voraussichtlich über 600 Euro liegen.