
NVIDIA czyni CUDA
NVIDIA CUDA to nic nadprzyrodzonego - to Compute Unified Device Architecture. Na czym polega niezwykłość tej architektury?
Jej podstawą jest 8 jednostek cieniowania, z których każda udostępnia 16 jednostek obliczeniowych SP - Streaming Processor. Łącznie G80 dysponuje zatem 128 jednostkami SP! Są to 32-bitowe skalarne jednostki zmiennoprzecinkowe. Zupełne zaprzeczenie dotychczasowych architektur, w których jednostki shaderów realizowano jako wektorowe, zdolne do pracy na czteroelementowych wektorach. Nie koniec na tym - procesory strumieniowe pracują z zegarem 1,35 GHz (w GeForce 8800 GTX), dużo szybszym niż zwykliśmy spotykać w GPU. Dlaczego zrezygnowano z jednostek wektorowych? Odpowiedź jest prosta - trzy lub cztery jednostki SP poradzą sobie z obróbką wektora czy macierzy położenia równie dobrze jak jednostka wektorowa, natomiast w przypadku zmiennej o charakterze skalarnym 3/4 potencjału obsługującej ją jednostki wektorowej pozostałoby niewykorzystane. W pojedynczym shaderze, poza jednostkami SP, znajduje się także zestaw modułów odpowiedzialnych za operacje na teksturach (na schemacie oznaczone kolorem niebieskim). Moduły zoptymalizowano pod kątem obliczeń HDR i obsługują one zarówno tryby FP16, jak i FP32. Prześledźmy, jak przebiega standardowy wciąż proces budowy modelu 3D, realizowany jako CUDA.
Kolejne fazy przetwarzania przesyłane są, jedna po drugiej, do jednostek SP w ten sposób, że jednostka kończąca pracę w roli vertex shadera może przejąć obróbkę fragmentu powierzchni również jako jednostka pixel shader. Elastyczność konfiguracji przyniosła jeszcze jedno dość istotne usprawnienie - wprowadzenie pełnej potokowości. W dotychczasowych architekturach mówiło się co prawda o "potoku przetwarzania", ale w rzeczywistości potok ten był dość poprzerywany. Popatrzmy zresztą:
W architekturze G7x jednostka shadera na pewnym etapie obróbki elementu musi oczekiwać na nałożenie tekstury na ten element. W architekturze G8x jednostka kończąca obróbkę matematyczną może podjąć kolejne zadanie, pracując nad następnym pikselem czy werteksem, bez oczekiwania na wynik pracy jednostek teksturujących - po nałożeniu tekstury praca zostanie przekazana do kolejnej jednostki SP. Taka elastyczność może, w połączeniu z elastycznością podejmowania zadań przez jednostki SP, przynieść znaczny wzrost wydajności.
Nowe możliwości
Zespół 128 procesorów strumieniowych, zawarty w G80, to prawdziwa potęga obliczeniowa. Każdy z nich może w jednym cyklu wykonać dwie instrukcje klasy MAD, czyli działania z zakresu mnożenia-dodawania oraz jedną MUL, czyli operację mnożenia. SP pracują na 32-bitowych danych zmiennoprzecinkowych, w formacie zgodnym ze standardem IEEE 754. Są wprawdzie jednostkami skalarnymi, ale można łączyć ich grupy w zespoły wektorowe, pracujące w trybie SIMD.
Jaka jest wydajność obliczeniowa G80? Pracując z zegarem 1,35 GHz, zespół 128 jednostek SP dysponuje mocą obliczeniową bliską 520 Gflops (miliardów operacji zmiennoprzecinkowych na sekundę). Czy to dużo? Superklaster Trójmiejskiej Akademickiej Sieci Komputerowej, wyposażony w 266 procesorów Itanium 2, dysponuje mocą 1510 Gflops, zaledwie nieco ponad trzykrotnie większą. Moc obliczeniowa G80 jest ponadto stosunkowo łatwo dostępna, dzięki zastosowaniu standardowego formatu danych, a także dzięki opracowaniu w ramach wspomnianego wcześniej programu CUDA silnego wsparcia programowego do tworzenia aplikacji wykorzystujących wolną moc SP.
Na początek należy się spodziewać przede wszystkim obsługi warstwy fizycznej. Elementy symulacji fizycznej zaimplementowane są już w DirectX 10, więc można być spokojnym, że G80 będzie je sprzętowo obsługiwać. Pod nazwą NVIDIA Quantum Effects producenci gier będą mieli ponadto do dyspozycji znacznie szerszy zestaw możliwości modelowania warstwy fizycznej. Zapowiadane dziesiątki tysięcy obiektów, fizyka ciał sztywnych, cieczy i cząstek umożliwiają nie tylko bardziej naturalną wizualizację dotychczas wykorzystywanych efektów, ale także tworzenie modeli nieobsługiwanych przez obecny standard wizualizacji.
- 1.Wstęp do rewolucji
- 2.NVIDIA czyni CUDA
- 3.CSAA - nowa metoda wygładzania krawędzi
- 4.DirectX 10 - co nowego?
- 5.GeForce 8800 GTX i GTS
- 6.ASUS EN8800GTX
- 7.ASUS EN8800GTS
- 8.MSI NX8800GTS
- 9.Zestaw testowy
- 10.Testy wydajności
- 11.Testy - cd.
- 12.Podkręcanie i temperatura
- 13.Pobór mocy
- 14.Maskotki GeForce 8800
- 15.Gry nowej generacji
- Pogłębiony test Radeona HD 7970 – multi-GPU, GPGPU, kodowanie wideo, karty różnych firm, podkręcanie ekstremalne 133
- Radeon HD 7950 – kontynuacja ofensywy Graphics Core Next 131
- Test 104 kart graficznych DirectX 11 168
- Radeon HD 7970 – „bombowe” wejście Graphics Core Next 302
- MSI R6970 Lightning kontra Asus Matrix GTX 580 – starcie kart graficznych dla entuzjastów 193
- GeForce GTX 580 – pięć kart, pięć różnych systemów chłodzenia, w tym wodny. Test porównawczy 48
- Radeon HD 6770 i HD 6750 – AMD gra na bis 100
- Radeon HD 6570 – wydajność 38
- OC School – podkręcanie kart graficznych, materiał wideo 47
- Test 104 kart graficznych DirectX 11 168
- Radeon HD 7970 – „bombowe” wejście Graphics Core Next 302
- Przerabiamy radeona HD 6950 na HD 6970 43
- OC School, czyli szkoła podkręcania. Część 1. – karty graficzne 89
- AMD Radeon HD 6990 – czy mamy nowego króla kart graficznych? 174
- Radeon HD 6770 i HD 6750 – AMD gra na bis 100
- GeForce GTX 590 – czy korona wydajności wróci do obozu Nvidii? 180
- AMD Radeon HD 6790 – twardy przeciwnik dla GeForce'a GTX 550 Ti 119
- MSI R6970 Lightning kontra Asus Matrix GTX 580 – starcie kart graficznych dla entuzjastów 193
- Asus GTX580 DirectCU II i MSI N580GTX Lightning – pojedynek kart dla entuzjastów wydajności 108
- Pogłębiony test Radeona HD 7970 – multi-GPU, GPGPU, kodowanie wideo, karty różnych firm, podkręcanie ekstremalne 133
- AMD Radeon HD 6790 – twardy przeciwnik dla GeForce'a GTX 550 Ti 119
- Radeon HD 7970 – „bombowe” wejście Graphics Core Next 302
- Test 104 kart graficznych DirectX 11 168
- GeForce GTX 590 – czy korona wydajności wróci do obozu Nvidii? 180
- AMD Radeon HD 6990 – czy mamy nowego króla kart graficznych? 174
- MSI R6970 Lightning kontra Asus Matrix GTX 580 – starcie kart graficznych dla entuzjastów 193
- OC School – podkręcanie kart graficznych, materiał wideo 47
- PowerColor przygotowuje jeszcze jednego Radeona HD 7970 9
- Jak duży będzie w końcu Kepler? 18
- AMD wprowadza karty FirePro V3900 15
- Nowe karty graficzne Nvidii w szczegółach - specyfikacje, ceny i daty pojawienia się na rynku 112
- Zwodowany Radeon HD 7970 11
- Sea Islands, czyli następna generacja GPU firmy AMD 19
- Radeon HD 7950 z trzema wentylatorami 15
- Radeony 7700 i 7800 tuż tuż? 37
- Radeon HD 7970 z pamięcią o szybkości ponad 2 GHz 7
- Nowe karty graficzne Nvidii w szczegółach - specyfikacje, ceny i daty pojawienia się na rynku 112
- Sea Islands, czyli następna generacja GPU firmy AMD 19
- Jak duży będzie w końcu Kepler? 18
- Zwodowany Radeon HD 7970 11
- PowerColor przygotowuje jeszcze jednego Radeona HD 7970 9
- AMD wprowadza karty FirePro V3900 15
- Sea Islands, czyli następna generacja GPU firmy AMD 19
- AMD wprowadza karty FirePro V3900 15
- Zwodowany Radeon HD 7970 11
- PowerColor przygotowuje jeszcze jednego Radeona HD 7970 9
- Nowe karty graficzne Nvidii w szczegółach - specyfikacje, ceny i daty pojawienia się na rynku 112
- Jak duży będzie w końcu Kepler? 18
- Google Bouncer – sposób na ostateczne rozprawienie się ze szkodliwymi programami w Android Markecie? 0
- JUŻ JEST AIWI MOTION DETECTOR KOZUMI W POLSCE! Dostępny tylko w ACTION! Sprawdź już dziś! 2
- Podróże z kamerą w samochodzie 1
- ZyNOS 4.0: nowe certyfikowane oprogramowanie IPv6 do przełączników ZyXELa 0
- Brennestuhl: domowy sprzęt elektryczny na wyciągnięcie ręki 1
- Niezależny test programów antywirusowych - dostajesz to, za co płacisz 2
- Komputronik Pro-DH600: kompaktowe desktopy dla firm 3
- Legendarne etui G-Form do tabletów na polskim rynku 5
- Genius na CES 2012 4
- Trojany kradnące dane bankowe atakują tysiące komputerów każdego dnia 0
- Xavax: tańsze ogrzewanie domu przez Internet 6
- Tablety Lark FreeMe: tak tanio jeszcze nie było 2
- Atak phishingowy na użytkowników Allegro - rzekome zwolnienie z prowizji 2
- Polska premiera kart Radeon HD 7950: Asus, HIS, Gigabyte 2
- 2011 - dobry rok dla graczy sponsorowanych przez SteelSeries. 2012 zapowiada się równie dobrze... 2
- 1Pytanie o evga gtx 460 i 56000:23 | WujaKarolus
- 12Crysis 2 niski fps00:22 | KMateusz
- 3Asus 1215 bios haslo00:22 | romo
- 10Netgear DGN2200 - problem z pingiem00:22 | stabilo
- 1Jakie sa objawy padajacego zasilacza00:21 | RayvenPL
- 2Problem z HP DV6-6b15EW00:20 | AlINeK
- 1Wybór nowej karty dźwiękowej00:20 | Kiciunio
- 5i7 2600k box, Noctua NH-D14, Asus Maximus IV Gene-Z00:20 | Colin_MC
- 2160Lab znowu muli00:19 | Quicksand
- 1Problem z Vertex 3D Radeon HD 6870X2 2GB00:18 | WujaKarolus
- 2160Lab znowu muli00:19 | Quicksand
- 2435Battlefield 300:16 | Vulc
- 3078World of Tanks00:12 | JustEvil
- 24233Wszystko na temat Playstation 300:06 | Singularity
- 3258FIFA 1200:04 | Cödename
- 206i5 2500k czy fx 812023:59 | Xender
- 197Zakaz sprzedaży gry? PEGI 18+23:51 | Vulc
- 3559Wspólne zakupy PSS23:48 | piteX2
- 2669AMD Radeon HD7000 Series - oficjalny temat23:38 | Chise
- 191Głosujemy na PO23:35 | x123x


