Karty graficzne
Artykuł
Piotr Gołąb, Piątek, 14 września 2018, 15:01

Nvidia kazała nam wyjątkowo długo czekać na nową architekturę kart graficznych, ale się doczekaliśmy. Mamy już jeden ze zbudowanych w niej modeli i już teraz możemy się z Wami podzielić szczegółami technicznymi dotyczącymi zmian, które w niej nastąpiły.

Długo wyczekiwane karty graficzne GeForce RTX będzie można kupić już niebawem, ale wcześniej postaramy się przybliżyć Wam, co tak naprawdę znajduje się w najnowszych rdzeniach Turing i czego możemy się spodziewać za kilka dni.

TU102

Najnowsza seria kart graficznych GeForce RTX jest reklamowana jako pierwsza generacja, która umożliwia raytracing w czasie rzeczywistym w grach komputerowych i zarazem nie kosztuje fortuny. Oczywiście, na rynku profesjonalnym mamy takie produkty, choćby stację roboczą DGX z czterema kartami Quadro GV100. Typowego użytkownika na pewno jednak nie będzie na nią stać, bo musiałby ją spłacać w łatwych ratach po 19,99 dol. przez trzy tysiące miesięcy :)

 

Przełom w grafice komputerowej – hybrydowy system generowania obrazu łączący raytracing i rasteryzację

Architektura Turing

Obraz w grach komputerowych do tej pory generowany był tylko z wykorzystaniem techniki rasteryzacji. Twórcy gier i producenci kart graficznych decydowali się na rasteryzację z kilku powodów; najważniejszym argumentem są uzyskiwane efekty i – jak to w przypadku popularnych rozwiązań – doskonała znajomość możliwości. Rasteryzacja ma także ograniczenia, a do najważniejszych trzeba zaliczyć niepoprawne odbicia w powierzchniach refleksyjnych. Symulacja naturalnego oświetlenia jest w zasadzie nieosiągalna; pomimo dużych nakładów pracy cienie i tak nie będą wyglądały naturalnie. Problemy te rozwiązuje raytracing. Niestety, wymaga olbrzymiej mocy obliczeniowej.

Nvidia postanowiła zmierzyć się z tym problemem, z uwzględnieniem, oczywiście, dostępnej obecnie mocy obliczeniowej, co przełożyło się na wybór Hybrydowej Metody Generacji Obrazu. Podczas tworzenia sceny używane są obie metody, zarówno raytracing, jak i rasteryzacja.

Rasteryzacja i bufor Z są wykorzystywane do określania widoczności obiektów na scenie (na razie jest to wykonywane szybciej niż w przypadku użycia raytracingu). Ten etap tworzenia sceny może zostać zastąpiony wypuszczeniem pierwszych promieni na scenę, tzw. promieni pierwotnych (ang. primary rays). Następnie do działania przystępuje raytracing i na podstawie miejsc przecięcia się promieni pierwotnych obliczane są promienie odbite, które tworzą efekty świetlne, cieniowania i odbić.

Architektura Turing

 

Turing w liczbach

Wystarczy spojrzeć na dane techniczne, żeby się przekonać, jak duży jest najnowszy układ Turing. Pełny rdzeń TU102 ma powierzchnię 754 mm², co stawia go w ścisłej czołówce pod względem wielkości. Ale taka powierzchnia nie wzięła się tylko z chęci posiadania w ofercie bardzo dużego rdzenia, jest on bowiem zbudowany z 18,6 mld tranzystorów.

Architektura Turing

Największy dostępny rdzeń, TU 102, składa się z 72 modułów SM, 4608 rdzeni CUDA, 576 rdzeni Tensor, 72 rdzeni RT, 36 jednostek geometrycznych (które wcześniej funkcjonowały jako moduły Polymorph engine 4.0), 288 jednostek teksturujących TMU oraz 96 jednostek rasteryzujących ROP.

 

Konstrukcja bloków SM

W nowych rdzeniach Turing wprowadzono bardzo dużo zmian w konstrukcji bloków SM. Na przykładzie pojedynczego bloku SM widać, że obok standardowych bloków wykonujących operacje FP32 i INT32 można wyróżnić dwa dodatkowe wykonawcze. Są to rdzenie Tensor, odpowiedzialne za funkcję głębokiego uczenia się (SI), oraz nowe rdzenie, RT, sprzętowo przyspieszające raytracing. 

Architektura Turing

Do tej pory operacje na liczbach całkowitych (INT) i zmiennoprzecinkowych (FP) były przeprowadzane naprzemiennie, np. w grze Battlefield 1 obok 100 operacji FP wykonywanych było 13 INT. W blokach SM w architekturze Turing te funkcje wykonywane są równolegle, co powinno przełożyć się na wzrost wydajności, ponieważ wszystkie rdzenie CUDA będą pracować przez cały czas. Jak duży wpływ będzie to miało na wydajność, będziemy wiedzieć dopiero po testach.

Architektura Turing 

Pamięć podręczna pierwszego i drugiego poziomu

Następną nowością niewidoczną na pierwszy rzut oka jest zmiana organizacji pamięci podręcznej pierwszego poziomu (L1), pamięci współdzielonej oraz pamięci drugiego poziomu (L2). W architekturze Pascal występował podział na pamięć L1 i pamięć współdzieloną i tylko współdzielona miała dostęp do pełnej przepustowości kontrolera pamięci. W rdzeniu Turing pamięć L1 i współdzielona zostały połączone w jeden blok, dzięki czemu udało się osiągnąć dwukrotnie większą przepustowość pomiędzy poszczególnymi rdzeniami w bloku SM a pamięcią podręczną. Na skutek tego do L2 będą trafiać większe porcje danych. Wcześniej L1 miała do dyspozycji bufor o wielkości 24 kB i właśnie takimi paczkami danych była zapełniana pamięć drugiego poziomu, L2. Teraz pamięć podręczna pierwszego poziomu i współdzielona mogą wysyłać znacznie większe paczki do L2, odpowiednio o wielkości 32 kB i 64 kB. Ponadto L2 została dwukrotnie powiększona, z 3 MB do 6 MB.

Architektura Turing

 

Nowa pamięć GDDR6

GDDR6

Następną bardzo istotną zmianą jest zastąpienie pamięci GDDR5X nową GDDR6. Nowe kości mają dwie istotne zalety w porównaniu z GDDR5X. Po pierwsze, wzrasta prędkość przesyłania danych, z 11 Gb/s do 14 Gb/s (wiemy, że nie jest to maksimum możliwości GDDR6). Kości o takiej prędkości przesyłu danych produkują trzy firmy: Micron, SK Hynix i Samsung. Które z nich będą najlepsze? Naszym zdaniem – Samsunga. Najwyraźniej podobnego zdania jest Nvidia, ponieważ to właśnie one są montowane w kartach dla profesjonalistów Nvidia Quadro. Nie jest jeszcze pewne, jakiej marki kości Nvidia wybrała do wersji konsumenckiej.

Firma informuje także, że ścieżki, po których przemieszczają się dane, są teraz lepiej izolowane względem siebie i że tzw. przesłuch, wpływający na liczbę błędów w potoku danych, został zmniejszony o 40 procent.

GDDR6

Ocena artykułu:
Ocen: 13
Zaloguj się, by móc oceniać
BluFox (2018.09.14, 15:08)
Ocena: 19

0%
Czy jeżeli ludożerca je nożem i widelcem – to postęp?

Autor: Stanisław Jerzy Lec
Stefan999 (2018.09.14, 15:30)
Ocena: 15

0%
RT kolejna technologia, która będzie miała sensowne zastosowanie za generacje albo nawet dwie.
Adi-C (2018.09.14, 15:31)
Ocena: 11

0%


:E

Ciekawe jak będzie z wydajnością/jakością NVENC.
Edytowane przez autora (2018.09.14, 16:08)
gret (2018.09.14, 15:52)
Ocena: 6

0%
Stefan999 @ 2018.09.14 15:30  Post: 1164633
RT kolejna technologia, która będzie miała sensowne zastosowanie za generacje albo nawet dwie.

albo wymrze za nim się narodzi :P
prosiacek (2018.09.14, 15:55)
Ocena: 3

0%
Fajny prospekt.
pwil (2018.09.14, 16:29)
Ocena: 26

0%
Podpisaliście papier nVidii, czy pozostajecie bezstronni?
Edytowane przez autora (2018.09.14, 16:29)
Zaloguj się, by móc komentować
Aktualności spokrewnione
Facebook
Ostatnio komentowane