
GeForce GTX 480 (Fermi) – nowa generacja kart graficznych NVIDI-i (w końcu!)
Przyszłość według NVIDI-i
Trochę architektury – umarł TPC, niech żyje GPC!
W końcu trochę o zmianach związanych z generowaniem grafiki. A nastąpiła tutaj mała rewolucja. Jak zapewne sobie przypominacie, w architekturze GT200 występowało coś takiego jak TPC (czyli połączenia trzech multiprocesorów i współdzielonych jednostek teksturujących). Teraz każdy multiprocesor ma własne cztery jednostki teksturujące, którymi nie musi się dzielić. Nowy podział został przedstawiony na poniższym fragmencie slajdu:
Widzimy, że multiprocesory są pogrupowane w cztery GPC. W skład każdego GPC wchodzi rasteryzator (nazywany po prostu Raster Engine), który we wszystkich poprzednich kartach graficznych był pojedynczym „bytem”. Poza tym każdy z multiprocesorów otrzymał własny PolyMorph Engine, którego najważniejszą częścią jest teselator. Mamy więc tutaj do czynienia z 16 teselatorami. Dla porównania, wszystkie karty AMD serii HD 2000, HD 3000, HD 4000 i HD 5000 mają... jeden teselator.
Jest to istotnie mała rewolucja, ponieważ dzięki temu „zniknęły” ostatnie dwa elementy karty graficznej, które nie były zrównoleglone. I stanowczo nie było to łatwe zadanie. Ale po kolei.
Oto PolyMorph Engine:
PolyMorph Engine ma za zadanie zajmować się wierzchołkami. Najpierw pobiera je z pamięci i przesyła do multiprocesora, w którym ich współrzędne są transformowane z przestrzeni obiektów do współrzędnych przestrzeni świata (wytłumaczenie, co to dokładnie znaczy, to temat na oddzielny artykuł, więc wybaczcie te ogólne stwierdzenia). Dodatkowo są określane wszystkie początkowe dane potrzebne do teselacji, np. stopień teselacji i sposób wyznaczenia nowego kształtu teselowanej powierzchni. Tak przygotowane dane na temat wierzchołków i tego, co z nimi zrobić w trakcie teselacji, wracają do teselatora, który generuje nową siatkę wierzchołków i informacje o tym, w jaki sposób są one ze sobą połączone. Dane te wysyła z powrotem do multiprocesora (często w tym momencie w grę wchodzi mapa przesunięć), w którym są obrabiane przez shader domeny i shader geometrii, dzięki czemu uzyskujemy ostateczne współrzędne nowo powstałych w procesie teselacji wierzchołków.
Po końcowej obróbce w PolyMorph Engine przygotowane wielokąty trafiają do Raster Engine, gdzie są poddawane rasteryzacji.
Najpierw pobierane są informacje o wierzchołkach prymitywu, który chcemy poddać rasteryzacji, i są obliczane jego brzegi. Pojedynczy Raster Engine może obliczyć w jednym cyklu zegara brzegi jednego trójkąta. Ponieważ w GF100 mamy cztery takie jednostki, to cała karta jest może przygotować cztery trójkąty na cykl zegara. Taki zestaw informacji trafia do rasteryzatora, który przelicza, które piksele ekranu wypadają na powierzchni danego wielokąta. Na końcu dane o wielokątach są przesyłane do jednostki Z-cull, która odrzuca piksele należące do niewidocznych wielokątów lub ich części.
Jak już wspominaliśmy, wcześniej cała karta graficzna musiała się zadowolić jednym rasteryzatorem. Pojedynczy rasteryzator spokojnie pobierał sobie kolejne wierzchołki i wypluwał z siebie piksele. Nikt wcześniej nie wziął się za zwielokrotnienie tych jednostek, ponieważ nie było to szczególnie potrzebne, a przy tym rozdzielenie pracy pomiędzy rasteryzatory jest zadaniem trudnym i wymagającym wielu dodatkowych obliczeń. Udało nam się dowiedzieć, że NVIDIA, aby to osiągnąć, postanowiła podzielić ekran na części (kafelki – ang. tiles). Ile części? Tego się nie dowiedzieliśmy. Po tym, jak PME przygotowały wierzchołki i przekształciły ich współrzędne na przestrzeń świata, jest możliwe określenie, w którym kawałku ekranu znajduje się dany wielokąt, i na podstawie tego zostaje on przydzielony do odpowiedniego rasteryzatora. Problematyczne są wielokąty, które leżą na powierzchni kilku kafelków, ale NVIDIA ponoć przygotowała jakiś sprytny algorytm wyrównywania obciążenia rasteryzatorów, aby zawsze miały one tyle samo pracy.
Po co to całe zamieszanie i te wszystkie kombinacje? Głównie chodzi o teselację. Obiekty po przejściu przez proces teselacji mogą się składać nawet z kilku milionów wielokątów w miejsce początkowych kilku tysięcy. I karta graficzna jakoś musi sobie z tym poradzić. Pojedynczy teselator i rasteryzator to za mało. Pokazuje to choćby uruchomienie benchmarku Heaven na Radeonie HD 5870. Po włączeniu w nim teselacji i zwróceniu kamery na jakiś mocno teselowany obiekt liczba klatek na sekundę jest praktycznie stała niezależnie od rozdzielczości. Jest to dowód na to, że w takiej sytuacji wąskim gardłem są możliwości karty w obliczaniu geometrii. NVIDIA zaprojektowała GPU zdolny zająć się tymi wszystkimi wielokątami.
Jest to odważny ruch. Nakład pracy musiał być ogromny. Liczba dodatkowych tranzystorów – pewnie też. A wszystko to po to, aby zapewnić jak najwyższą wydajność w grach DirectX 11 korzystających z teselacji, których jednak na razie jest bardzo niewiele. Jeśli teselacja się przyjmie, będzie to strzał w dziesiątkę, w przeciwnym razie ogrom pracy pójdzie na marne.
Przy okazji powstał ciekawy efekt uboczny. W praktyce pojedynczy GPC to prawie kompletny układ graficzny. Dzięki temu NVIDIA ma bardzo uproszczone zadanie przy projektowaniu kart graficznych z niższej półki. Wystarczy wziąć jeden, dwa lub trzy GPC, połączyć je pamięcią podręczną drugiego poziomu, dodać GigaThreadEngine, odpowiednią liczbę ROP-ów oraz kontrolerów pamięci – i otrzymujemy nowy układ graficzny. Czy to oznacza, że w końcu pojawią się słabsze karty oparte na nowej architekturze? Mamy nadzieję, że tak i że nie będziemy musieli czekać na nie zbyt długo (hm... GT200...).
- 1.Trochę architektury – widok z góry
- 2.Trochę architektury – pamięć podręczna, zarządca, kontroler pamięci
- 3.Trochę architektury – multiprocesor i okolice
- 4.Trochę architektury – umarł TPC, niech żyje GPC!
- 5.Modele i specyfikacja kart
- 6.Filtrowanie tekstur i wygładzanie krawędzi
- 7.Fermi pręży muskuły – wydajność teselacji i DirectCompute
- 8.3DVision, OptiX i inne CUDA
- 9.GeForce GTX 480 – karta referencyjna
- 10.Zestaw testowy
- 11.3DMark Vantage
- 12.Battlefield: Bad Company 2 DX 10
- 13.Borderlands
- 14.Call of Duty: Modern Warfare 2
- 15.Colin McRae: DiRT 2 DX 9
- 16.Crysis: Warhead
- 17.Enemy Territory: Quake Wars
- 18.Left 4 Dead 2
- 19.Metro 2033 DX 10
- 20.Need for Speed: Shift
- 21.S.T.A.L.K.E.R.: Zew Prypeci DX 10.1
- 22.Battlefield: Bad Company 2 DX 11
- 23.Colin McRae: DiRT 2 DX 11
- 24.Metro 2033 DX 11
- 25.S.T.A.L.K.E.R.: Zew Prypeci DX 11
- 26.Pobór mocy, głośność, temperatura
- 27.Podkręcanie
- 28.Podsumowanie
- Pogłębiony test Radeona HD 7970 – multi-GPU, GPGPU, kodowanie wideo, karty różnych firm, podkręcanie ekstremalne 128
- Radeon HD 7950 – kontynuacja ofensywy Graphics Core Next 131
- Test 104 kart graficznych DirectX 11 168
- Radeon HD 7970 – „bombowe” wejście Graphics Core Next 302
- MSI R6970 Lightning kontra Asus Matrix GTX 580 – starcie kart graficznych dla entuzjastów 193
- GeForce GTX 580 – pięć kart, pięć różnych systemów chłodzenia, w tym wodny. Test porównawczy 48
- Radeon HD 6770 i HD 6750 – AMD gra na bis 100
- Radeon HD 6570 – wydajność 38
- OC School – podkręcanie kart graficznych, materiał wideo 47
- Test 104 kart graficznych DirectX 11 168
- Radeon HD 7970 – „bombowe” wejście Graphics Core Next 302
- Przerabiamy radeona HD 6950 na HD 6970 43
- OC School, czyli szkoła podkręcania. Część 1. – karty graficzne 89
- AMD Radeon HD 6990 – czy mamy nowego króla kart graficznych? 174
- Radeon HD 6770 i HD 6750 – AMD gra na bis 100
- GeForce GTX 590 – czy korona wydajności wróci do obozu Nvidii? 180
- AMD Radeon HD 6790 – twardy przeciwnik dla GeForce'a GTX 550 Ti 119
- MSI R6970 Lightning kontra Asus Matrix GTX 580 – starcie kart graficznych dla entuzjastów 193
- Asus GTX580 DirectCU II i MSI N580GTX Lightning – pojedynek kart dla entuzjastów wydajności 108
- Pogłębiony test Radeona HD 7970 – multi-GPU, GPGPU, kodowanie wideo, karty różnych firm, podkręcanie ekstremalne 128
- AMD Radeon HD 6790 – twardy przeciwnik dla GeForce'a GTX 550 Ti 119
- Radeon HD 7970 – „bombowe” wejście Graphics Core Next 302
- Test 104 kart graficznych DirectX 11 168
- GeForce GTX 590 – czy korona wydajności wróci do obozu Nvidii? 180
- AMD Radeon HD 6990 – czy mamy nowego króla kart graficznych? 174
- MSI R6970 Lightning kontra Asus Matrix GTX 580 – starcie kart graficznych dla entuzjastów 193
- OC School – podkręcanie kart graficznych, materiał wideo 47
- PowerColor przygotowuje jeszcze jednego Radeona HD 7970 9
- Jak duży będzie w końcu Kepler? 18
- AMD wprowadza karty FirePro V3900 15
- Nowe karty graficzne Nvidii w szczegółach - specyfikacje, ceny i daty pojawienia się na rynku 111
- Zwodowany Radeon HD 7970 11
- Sea Islands, czyli następna generacja GPU firmy AMD 19
- Radeon HD 7950 z trzema wentylatorami 15
- Radeony 7700 i 7800 tuż tuż? 37
- Radeon HD 7970 z pamięcią o szybkości ponad 2 GHz 7
- Nowe karty graficzne Nvidii w szczegółach - specyfikacje, ceny i daty pojawienia się na rynku 111
- Sea Islands, czyli następna generacja GPU firmy AMD 19
- Jak duży będzie w końcu Kepler? 18
- Zwodowany Radeon HD 7970 11
- AMD wprowadza karty FirePro V3900 15
- PowerColor przygotowuje jeszcze jednego Radeona HD 7970 9
- Sea Islands, czyli następna generacja GPU firmy AMD 19
- AMD wprowadza karty FirePro V3900 15
- Zwodowany Radeon HD 7970 11
- PowerColor przygotowuje jeszcze jednego Radeona HD 7970 9
- Nowe karty graficzne Nvidii w szczegółach - specyfikacje, ceny i daty pojawienia się na rynku 111
- Jak duży będzie w końcu Kepler? 18
- Google Bouncer – sposób na ostateczne rozprawienie się ze szkodliwymi programami w Android Markecie? 0
- JUŻ JEST AIWI MOTION DETECTOR KOZUMI W POLSCE! Dostępny tylko w ACTION! Sprawdź już dziś! 2
- Podróże z kamerą w samochodzie 1
- ZyNOS 4.0: nowe certyfikowane oprogramowanie IPv6 do przełączników ZyXELa 0
- Brennestuhl: domowy sprzęt elektryczny na wyciągnięcie ręki 1
- Niezależny test programów antywirusowych - dostajesz to, za co płacisz 2
- Komputronik Pro-DH600: kompaktowe desktopy dla firm 3
- Legendarne etui G-Form do tabletów na polskim rynku 5
- Genius na CES 2012 4
- Trojany kradnące dane bankowe atakują tysiące komputerów każdego dnia 0
- Xavax: tańsze ogrzewanie domu przez Internet 6
- Tablety Lark FreeMe: tak tanio jeszcze nie było 2
- Atak phishingowy na użytkowników Allegro - rzekome zwolnienie z prowizji 2
- Polska premiera kart Radeon HD 7950: Asus, HIS, Gigabyte 2
- 2011 - dobry rok dla graczy sponsorowanych przez SteelSeries. 2012 zapowiada się równie dobrze... 2
- 11Czy tablet byłby dobrym rozwiązaniem ?22:05 | piotrGTX
- 3Kabel AUX - Dźwięk22:05 | Bosman712
- 2[url] Kot pacz22:04 | BlackBishop
- 3Rewizja B3 s15522:04 | patmil18
- 43Allegro, problem z towarem.22:04 | mlody_tarnow
- 723Dell 22 Ultrasharp 2209WA matryca IPS22:03 | blabla123
- 8Słuchawki 250 zł muzyka22:03 | nhom
- 2Geforce 7600gt -> hd 5450, problem z karta?22:03 | Siadak
- 2Pendrive 32 GB Kingston22:03 | Drozda
- 10nowy sprzęt i problem z fps22:03 | dabomb
- 723Dell 22 Ultrasharp 2209WA matryca IPS22:03 | blabla123
- 190Głosujemy na PO22:01 | Sony84
- 3077World of Tanks22:00 | CeHa
- 111Pomoc w wyborze imienia dla dziecka22:00 | Kagava
- 3255FIFA 1221:57 | FC_BARCELONA
- 525Zestawienie wydajności Battlefield 321:56 | adamtb
- 2668AMD Radeon HD7000 Series - oficjalny temat21:51 | -MistrzZ-
- 7904Karty Graficzne na Luty 2012r.21:49 | damyan123
- 26667Battlefield 321:47 | Wyczochrany
- 227Dlaczego Jaruzelskiego nie zamknęli jeszcze za stan wojenny?21:40 | lones

