Karty graficzne
Artykuł
Piotr Gołąb, Czwartek, 9 marca 2017, 15:02

Budowa i architektura

GeForce GTX 1080 Ti jest oparty na najmocniejszym układzie graficznym spośród tych, które do tej pory wyprodukowała Nvidia, GP 102. Ten sam GPU zastosowano w modelu Titan X (Pascal). Możemy więc spodziewać się bardzo zbliżonej wydajności. GP 102 projektowano zwłaszcza z myślą o jak najszybszym taktowaniu układu graficznego i jak największej efektywności prądowej. Do tej pory to karty oparte na układach z rodziny Pascal osiągają najszybsze taktowanie.

Architektura

Każdy GeForce GTX 1080 Ti jest wyposażony w jeden układ GP 102, a każdy taki układ składa się z 28 jednostek obliczeniowych (Streaming Multiprocessor, SM). W skład tych jednostek wchodzą: 3584 jednostki CUDA, 88 jednostki ROP oraz 224 jednostki teksturujące TMU. Całość jest taktowana z bazową częstotliwością 1480 MHz, a w trybie Boost wzrasta ona do 1582 MHz. Łatwo zauważyć, że te wartości prawie się pokrywają z parametrami modelu Titan X (Pascal). Obie konstrukcje różnią się jednak liczbą jednostek ROP: Titan X ma ich 96. 

Pamięć

Przyjrzyjmy się teraz pamięci. Tu różnice między kartami są większe. GeForce GTX 1080 Ti jest wyposażony w kości GDDR5X nowej generacji. Moduły te osiągają 11 Gb/s. Oczywiście, układy poprzedniej generacji też mogły zapewnić zbliżone wartości, ale nie zawsze i nie zawsze tak stabilnie. Ilustracja na dole pokazuje różnice pomiędzy kośćmi obu generacji GDDR5X.

Gddr5X

Po lewej stronie mamy GDDR5X pierwszej generacji. Widać, jak bardzo zaszumione jest okno transferu i jak duża jest fluktuacja odchylenia sygnału (jitter). Po prawej mamy pamięć GDDR5X drugiej generacji. Widać, że okno transferu jest znacznie szersze i oczyszczone z zakłóceń wynikających z dużego jittera i dużego zaszumienia sygnału. Dzięki temu o wiele prościej i szybciej można odczytać informacje przesyłane przez pamięć. Sygnał jest znacznie lepszej jakości i nie dochodzi do utraty informacji w trakcie przesyłu.

GeForce GTX 1080 Ti ma 11 GB własnej pamięci GDDR5X drugiej generacji taktowanej z częstotliwością 5505 MHz, a Titan X – 12 GB GDDR5X pierwszej generacji, taktowanej z częstotliwością 5000 MHz.

Szerokość szyny pamięci w GTX-ie 1080 Ti wynosi 352 b, a w Titanie X (Pascal) – 384 b. Różnica ta spowodowana jest brakiem jednego modułu pamięci oraz jednego kontrolera pamięci w modelu GeForce GTX 1080 Ti. Słabszy brat, GeForce GTX 1080, nie bardzo ma się czym pochwalić w tym towarzystwie, ma on bowiem szynę pamięci o szerokości 256 b.

Nvidia w swojej najnowszej karcie zastosowała jeszcze jedną funkcję, żeby powiększyć przepustowość pamięci i zwiększyć jej efektywność: Tiled Cashing. Ta technika pierwszy raz została użyta w kartach z układem graficznym Maxwell, jednak dopiero teraz ją dopracowano i w pełni wykorzystano.

Na czym polega działanie tej techniki? Żeby to zrozumieć, trzeba prześledzić, jak renderowany jest obraz. Są dwa rodzaje renderowania obrazu: na komputerach osobistych używany jest renderer bezzwłoczny (immediate rendering), a na urządzeniach przenośnych bardzo często używany jest renderer kafelkowy (tiled rendering). Pokazuje to poniższa grafika.

Tiled Cache

W trybie bezzwłocznym (immediate renderer) każde polecenie, które trafia do listy kolejkowania, musi zostać wykonane w całości. Jeśli poleceniem jest trójkąt, wówczas cały trójkąt zostanie narysowany, zanim renderer będzie mógł przejść do wykonywania następnego zadania z kolejki. Wadą tego trybu jest wielokrotne renderowanie niewidocznych na obrazie pikseli, co wymaga użycia większej przepustowości szyny pamięci.

Tiled Cache

W trybie kafelkowym (tiled renderer) obraz podzielony jest na wiele kwadratów, a cały proces tworzenia obrazu podzielony jest na dwa przebiegi. Pierwszy analizuje geometrię i decyduje, które z kwadratów przykrywane są przez siatkę geometryczną, a następnie zapisuje tę informację do pamięci DRAM karty graficznej. W drugim przebiegu wyliczana jest na nowo lista geometryczna dla każdego kafelka z osobna,  obraz zaś renderowany jest w procesorze karty, kolejno kafelek po kafelku. Do pamięci karty trafia tylko finalna informacja o ich kolorze.

Przetwarzanie kafelkowe ma dwie wady. Pierwszą jest znacznie większe skomplikowanie sterownika karty graficznej oraz dodanie funkcji kafelkowania (binning) w procesie przetwarzania obrazu, co może powodować opóźnienia w wyświetlaniu. Drugim, i poważniejszym, problemem jest odczytywanie i zapis informacji do pamięci karty graficznej w procesie kafelkowania obrazu. Potrzebny na to czas jest wprost proporcjonalny do skomplikowania sceny. W grach, w których występują niezbyt skomplikowane obiekty, ta technika sprawdza się bardzo dobrze. Jednak w najnowszych tytułach, w których skomplikowanie obrazu jest bardzo duże, podobnie jak ilość przetwarzanych przez pamięć informacji, pamięć może się przepełnić.

Tiled Cache

W najnowszych kartach Nvidii połączono te dwie techniki. Obraz jest renderowany w trybie bezzwłocznym, a cała geometria sceny jest wysyłana do procesora graficznego przez pamięć L2 przy okazji podziału obrazu na kafelki. I wraz z zapełnianiem się pamięci L2 cała scena jest renderowana kafelek po kafelku. Dzięki temu GPU może szybciej renderować poszczególne klatki i nie dochodzi do przepełnienia pamięci.

GeForce GTX 1080 Ti obsługuje DirectX 12 wraz z obliczeniami asynchronicznymi. Na poniższych slajdach widać, z których funkcji obliczeń asynchronicznych korzysta.

Async

Async

Async

Async

Async

GeForce GTX 1080 Ti obsługuje też wszystkie efekty graficzne i fizyczne, które Nvidia implementuje w najnowszych grach stworzonych w programie partnerskim Nvidia Gameworks. Poza doskonale znanymi efektami, takimi jak: HairWorks, Volumetric Lighting, HFTS/PCSS (znacznie naturalniejsze cienie w grach), HBAO+, jest jeden nowy, który do tej pory nigdzie nie został wykorzystany. Mowa o Turf Effects, którego pierwszy raz użyto w grze Ghost Recon: Wildlands i który odpowiada za realistyczne zachowanie się trawy: jej cieniowanie, model  fizyczny i szczegółowość zależnie od odległości.

Nvidia Turf

 

Ocena artykułu:
Ocen: 11
Zaloguj się, by móc oceniać
Artykuły spokrewnione
Aktualności spokrewnione
Facebook
Ostatnio komentowane