aktualności

Nvidia Pascal: architektura nowych GPU

28
19 marca 2015, 06:26 Piotr Gontarczyk

Nvidia oficjalnie do swojego harmonogramu wprowadziła zmiany związane z następnymi architekturami procesorów grafiki - Pascal oraz Volta. Od poznania szczegółów związanych z architekturą Volta dzieli nas jeszcze sporo czasu, ale szef Nvidii, Jen-Hsun Huang potwierdził trzy konkretne cechy Pascala, które mają sprawiać, że będzie to architektura dziesięciokrotnie bardziej wydajna od obecnej, a więc Maxwella.

Wiemy już, że Pascal zastąpi Maxwella w przyszłym roku i będzie wykorzystywać najnowsze rozwiązania Nvidii w zakresie projektowania GPU, ale także stosów 3D pamięci, które będą umieszczane w jednej obudowie z rdzeniem GPU i zapewnią przepustowość sięgającą aż 1 TB/s. Integracja pamięci 3D w rdzeniu GPU pozwoli nie tylko na zwiększenie samej przepustowości, ale także zapewni czterokrotnie lepszą sprawność, a pojemność będzie mogła zwiększyć się ponad dwukrotnie. Wszystko to razem ma dawać bardzo wysoką wydajność, gotową do wykorzystania w przyszłych grach na ekranach o bardzo wysokich rozdzielczościach. Warto zauważyć, że niebawem firma AMD zaprezentuje swoje pierwsze układy grafiki ze stosami pamięci 2.5D o przepustowości do 640 GB/s. Nvidia natomiast zamierza od razu przejść na technikę 3D o większych możliwościach i lepszej wydajności, choć nastąpi to później.

W porównaniu do karty GeForce GTX Titan X, konstrukcja wykorzystująca pamięć 3D HBM będzie oferować aż trzykrotnie lepszą przepustowość od obecnie najszybszych układów GDDR5 w Titanie X, osiągających częstotliwość efektywną 7 GHz. Jen-Hsun Huang wspomniał już, że najmocniejsze karty graficzne z układami opartymi na architekturze Pascal pojawią się z 32 GB pamięci. Warto zauważyć, że obecny flagowiec Nvidii i najmocniejsza, jednoprocesorowa karta graficzna na rynku ma 12 GB pamięci RAM typu GDDR5.

Pamięć HBM swoją niespotykaną obecnie w produktach konsumenckich przepustowość i pojemność osiągać może m. in. dzięki zastosowaniu bardzo szerokiego łącza. Każda "kostka" HBM, składająca się kilku stosów pamięci, do procesora grafiki podłączona jest za pośrednictwem interfejsu o szerokości aż 1024 bitów. Moduły HBM pracują ze stosunkowo małymi częstotliwościami, w porównaniu chociażby do układów GDDR5, ale to właśnie szeroki interfejs sprawia, że ostatecznie mogą one zapewniać nawet dziewięciokrotnie lepszą wydajność.

GeForce GTX Titan SLI kontra Radeon R9 290X CrossFire

Architektura Pascal wykorzystywać ma też NVLink, a więc nowy interfejs mający wspierać technikę Unified Memory, o przepustowości od pięciu do dwunastu razy większej niż w przypadku typowego łącza PCI Express. Rozwiązanie to ma wyeliminować wiele problemów z przepustowością i opóźnieniami, z którymi mierzyć się muszą obecnie stosowane procesory grafiki. Jedną z ważnych zalet NVLinka ma być to, że interfejs ten ma umożliwiać łączenie równolegle wielu GPU, niezależnie od tego czy będzie to konfiguracja SLI dla gracza czy zastosowań profesjonalnych. Szef Nvidii zwracał uwagę wprost na to, że dzięki NVLink możliwe będzie łączenie już nie maksymalnie czterech, a aż ośmiu kart graficznych w jednej platformie sprzętowej.

Szybki interfejs łączący GPU z CPU powinien mocno poprawić ogólną wydajność oprogramowania, które wykorzystuje obliczenia równoległe na GPU, choć nie tylko. Zwracamy uwagę na to, że procesory grafiki z reguły dysponują szybką pamięcią RAM, ale o stosunkowo niewielkiej pojemności, podczas gdy jednostka centralna (CPU) do swojej dyspozycji ma pamięć o znacznie większej pojemności, ale jednocześnie o relatywnie niskiej wydajności. Zastąpienie interfejsu PCI Express nowym NVLinkiem sprawi, że przenoszenie danych pomiędzy CPU a GPU będzie znacznie szybsze, co w efekcie powinno korzystnie wpłynąć na wydajność całego systemu. Wraz z pojawieniem się Pascala wykorzystującego pamięć 3D HBM, GPU jeszcze bardziej zyska na lokalnej przepustowości, ale także na pojemności.

Z wystąpienia szefa Nvidii dowiedzieliśmy się też, że w porównaniu do Maxwella architektura Pascall będzie aż dwukrotnie lepsza w kwestii sprawności energetycznej. Maxwell już dziś robi spore wrażenie, jako architektura, w której już Nvidia poczyniła spory postęp względem Keplera. W przypadku wydajności mieszanej precyzji, Pascal ma być względem Maxwella czterokrotnie bardziej wydajny. Warto zwrócić uwagę na wspomnianą kwestię mieszanej precyzji obliczeń zmiennoprzecinkowych FP16. Pascal będzie pierwszą architekturą Nvidii, która takie rozwiązanie będzie oferować. Jego dodanie do Pascala ma być ważne przede wszystkim w sektorze urządzeń z niskimi poziomami zasilania, takich jak np. tablety, phablety oraz smartfony. Mieszana precyzja w komputerach osobistych też może mieć swoje znaczenie w aplikacjach, które nie wymagają wyższych poziomów precyzji (FP32 czy FP64), w wyniku czego możliwe będzie uzyskanie mniejszego poboru mocy w trakcie pracy.

Procesory grafiki oparte na architekturze Pascal będą dla Nvidii pierwszymi, które wykorzystają 16-nanometrową litografię FinFET firmy TSMC (Taiwan Semiconductor Manufacturing Company). Przejście na nowy proces oznaczać będzie znacząco lepszą sprawność energetyczną oraz możliwość upakowania większej ilości tranzystorów na danej powierzchni, w porównaniu do litografii 28-nanometrowej. W efekcie możliwe będzie produkowanie znacznie bardziej skomplikowanych i zaawansowanych procesorów grafiki.

GeForce GTX Titan X – test najwydajniejszej karty graficznej

dapeZobacz profil
Poziom ostrzeżenia: 0%
dape2015.03.19, 06:49
-4#1
10x? Czyli czeka nas znów 10% do wydajności i 10% do ceny :)
lukasiastyZobacz profil
Poziom ostrzeżenia: 0%
lukasiasty2015.03.19, 06:58
-9#2
Czyli w takim razie zakup nowej karty będzie wiązał się z zakupem nowej płyty głównej a co za tym idzie procesora i pamięci ram. Dosyć spora inwestycja jak na wymianę 'tylko' karty graficznej.
OrgiuszZobacz profil
Poziom ostrzeżenia: 0%
Orgiusz2015.03.19, 07:02
11#3
Przydałoby się to w nowych konsolach.
golyZobacz profil
Poziom ostrzeżenia: 0%
goly2015.03.19, 07:06
24#4
szkoda, że tak daleko do premiery, bo zapowiada się grubo
strach pomyśleć, jaka będzie przepaść do konsol
KazHZobacz profil
Poziom ostrzeżenia: 0%
KazH2015.03.19, 07:08
12#5
dape @ 2015.03.19 06:49  Post: 847820
10x? Czyli czeka nas znów 10% do wydajności i 10% do ceny :)


Teraz różnice w wydajności GPU będą mogły być znacznie większe niż wcześniej bo CPU przestanie być ograniczeniem dzięki DX12 i Vulcan. Gry zamiast używać jednego rdzenia do komunikacji CPU-GPU zaczną używać 4-8 rdzeni. A to oznacza że GPU dostanie kilka razy więcej danych do policzenia w jednostce czasu. Czyli producenci GPU będą mogli robić jeszcze bardziej rozbudowane GPU bo CPU nie będzie już ograniczało najszybszych konstrukcji. W 2016r układy mają mieć 14nm a więc będzie możliwość użycia znacznie większej ilości tranzystorów przy tym samym TDP a DX12 i Vulcan będą już standardem. To będzie złoty czas dla producentów GPU
KwantZobacz profil
Poziom ostrzeżenia: 0%
Kwant2015.03.19, 07:17
13#6
Ciekawe jak zapanują nad TPD. GPU i pamięci w jednym miejscu oznacza, że praktycznie całe ciepło będzie musiało być odebrane z jednego chipa.

Dodatkowo, jeżeli pamięć położymy na GPU (rozumiem, że jest to kanapka) to transfer ciepła z GPU do radiatora będzie gorszy.

Na pewno pomoże niskie taktowanie pamięci, przez co będą się słabo grzały.

Bardzo bardzo ciekawa technologia, już widzę jakie będą opóźnienia we wdrażaniu ;-) Mimo to czekam z niecierpliwością na detale technologii i same układy.
RuthvenZobacz profil
Poziom ostrzeżenia: 0%
Ruthven2015.03.19, 07:54
Ciekawe jak ma się to NVlink do kart AMD, czy płyty główne będą robione z pcie czy nvlink czy może z jednym i drugim. A może AMD też będzie działać na NVlink. Tak czy inaczej, wymiana całego komputera dla karty graficznej trochę mi się nie widzi
Castiel15Zobacz profil
Poziom ostrzeżenia: 0%
Castiel152015.03.19, 07:58
-7#8
No to ja już wiem na co wymienię moją siedemset-osiemdziesiątkę ;)
A tak na marginesie to czy takie karty graficzne nie będą potrzebowały dużooo wydajniejszych procków? w sumie intel na pewno coś mocnego wyda ale może się okazać że nie wykorzystamy w pełni możliwości karty właśnie przez procki...
ghs2015.03.19, 08:02
zielonym kombinatorom należy przyznać: slajdy mają konkretne, nie leją wody jak ''fachowcy'' wytrenowani przez Rory'ego Read'a
VanterZobacz profil
Poziom ostrzeżenia: 0%
Vanter2015.03.19, 08:18
Czyli teraz trzeba się przygotować że gdzieś za 4 lata trzeba będzie wymienić cały zestaw ciekawi mnie co w tym czasie za progres nastąpi w CPU.
No i ciekawi mnie jaka będzie różnica w dla pojedynczej karty na obydwu interfejsach i czy za niedługo nie dowiemy się o nowej rewizji pciExpres o zbliżonych możliwościach i kompatybilności wstecznej :)
Zaloguj się, by móc komentować
1