Aktualność
Mateusz Brzostek, Środa, 7 listopada 2018, 07:30

AMD przedstawia akceleratory obliczeniowe Radeon Instinct MI60 i MI50 z pierwszym na świecie GPU 7 nm.

Zapowiadany od wielu miesięcy procesor graficzny o nazwie roboczej Vega 20 trafi niedługo do użytku. AMD przygotowało dwa akceleratory obliczeniowe z rodziny Radeon Instinct: modele MI60 i MI50 z tym procesorem.

Oba warianty są zbudowane na podstawie tego samego jądra GPU; MI50 ma nieco mniej jednostek wykonawczych i dwa razy mniej pamięci. GPU jest wykonane w procesie technologicznym klasy 7 nm w fabrykach TSMC. Ma powierzchnię 331 mm² (tylko 40% powierzchni procesora Nvidia GV100) i zawiera 13,2 miliarda tranzystorów.

Vega 20 – więcej pamięci, więcej instrukcji

Układ Vega 20 został zbudowany w nieco zmienionej architekturze Vega. Ma tyle samo procesorów strumieniowych, co procesor Vega 10 w kartach graficznych Radeon RX Vega 64. Dodano do nich dwa dodatkowe interfejsy HBM2 – GPU komunikuje się z czterema stosami HBM2, co daje przepustowość pamięci 1 TB/s. To dwa razy więcej, niż w kartach Radeon RX Vega oraz 11% więcej, niż w akceleratorze Nvidia Tesla V100.

Procesory strumieniowe zostały nieco przebudowane zgodnie z wymaganiami rynku uczenia maszynowego. Podobnie jak w starszych GPU Vega, moga wykonywać operacje zmiennoprzecinkowych o podwójnej precyzji (FP64) z połową tej przepustowości, z jaką wykonują instrukcje FP32, co od dawna jest charakterystyczną cechą profesjonalnych, obliczeniowych GPU. Nowościa w Vedze 20 jest możliwość wykonywania operacji o zmniejszonej precyzji na liczbach 8-bitowych i 4-bitowych (INT8 i INT4) – te są szeroko wykorzystywane w pracy sieci neuronowych w fazie wnioskowania (czyli kiedy już wyuczona sieć ma dawać odpowiedzi). Te operacje są wykonywane na 4 lub 8 liczbach jednocześnie.

Przyspieszono również pamięć podręczną GPU, choć nie ujawniono, o ile. Cała hierarchia pamięci – wszystkie rejestry, wszystkei poziomy pamięci podręcznej oraz pamięć HBM2 – jest chroniona przez ECC.

PCI-E 4.0 i Infinity Fabric w GPU

Vega 20 łączy się z procesorem za pomocą PCI Express 4.0 – to pierwszy procesor graficzny, który obsługuje ten standard. Tak się składa, że nadchodzące procesory Epyc drugiej generacji również mają PCI-E 4.0 – będą dobrą podstawą dla maszyny obliczeniowej z Radeonami Instinct. PCI-E 4.0 jest kluczowe dla dobrej wydajności wielu obliczeń na GPU, szczególnie tych, gdzie zbiór danych jest większy, niż lokalna pamięć GPU i musi być od czasu do czasu wymieniany przez PCI-E.

Oprócz łącza z procesorem Vega 20 ma dwa łącza Infinity Fabric o łacznej przepustowości 200 GB/s, służące do bezpośredniej komunikacji pomiędzy procesorami graficznymi. Jeśli komuś nasuwa się porównanie do łącza NVLink w GPU Nvidii, to bardzo dobrze: te dwie techniki spełniają podobną rolę. Infinity Fabric w Radeonach Instinct ma architekturę pierścienia; może łączyć dwa lub cztery GPU, co pozwala stworzyć wspólną pulę pamięci i obrabiać dwa lub cztery razy większe zbiory danych. W serwerze z ośmioma GPU (jak na jednym ze zdjęć poniżej) są one połączone w dwie grupy po cztery.

Do połączenia IF pomiedzy Radeonami Instinct służy płytka ze złączami przypominająca szeroki mostek SLI lub mostek NVLink znany z kart GeForce RTX 2080 Ti. Przepustowość łącza IF jest mniejsza, niż NVLink 2.0 (300 GB/s łącznie, po 150 GB/s w każdym kierunku). NVLink może również łączyć więcej niż 4 GPU, ale tylko za pomocą osobnych układów scalonych pełniących funkcję switcha; taka konfiguracja jest dostępna wyłącznie w gotowych, zamkniętych komputerach DGX Nvidii. Co ciekawe, Nvidia oferuje akceleratory Tesla V100 w wersji z NVLink lub w wersji z PCI-E 3.0, ale nie z oboma interfejsami jednocześnie. Quadro RTX 8000 i Quadro RTX 6000 mają i PCI-E, i NVLink, ale to drugie złącze tylko w wersji o przepustowości 100 GB/s i umożliwiające połączenie maksymalnie dwóch GPU.

Oczekiwana wydajność

Jak twierdzi AMD, Radeon Instinct MI60 zapewnia podobną lub lepszą wydajność, co Nvidia Tesla V100 – przynajmniej w zastosowaniach nie wykorzystujących funkcji przyspieszających operacje na tensorach.

Jedno GPU, wielu użytkowników... albo na odwrót

Podobnie jak starsze GPU Vega, Radeony Instinct MI60 i MI50 obsługują sprzętową wirtualizację, szyfrowanie zawartości pamięci i izolację maszyn wirtualnych. To pozwala na bardzo elastyczne przydzielanie GPU do maszyn wirtualnych. Jeden procesor graficzny może służyć dwóm, czterem, ośmiu lub szesnastu użytkownikom; jedna maszyna wirtualna może korzystać z jednego, dwóch, czterech lub ośmiu GPU.

Ponieważ wirtualizacja GPU i szyfrowanie pamięci są realizowane sprzętowo i niewidzialne dla oprogramowania, teoretycznie Radeon Instinct zapewniają większe bezpieczeństwo danych przetwarzanych w publicznej chmurze.

Radeony Instinct MI60 i MI50 będą dostępne od 18 listopada do wynajęcia w usługach chmurowych, a jakiś czas później również do kupienia. Prawdopodobnie procesor Vega 20 nigdy nie trafi do „cywilnych” kart graficznych.

Źródło: AMD, własne
Ocena aktualności:
Ocen: 5
Zaloguj się, by móc oceniać
yendrek (2018.11.07, 08:12)
Ocena: 14

0%
Duchu @ 2018.11.07 07:48  Post: 1173494
(...)Prawdopodobnie procesor Vega 20 nigdy nie trafi do „cywilnych” kart graficznych.

I kolejna nadzieja na przełamanie monopolu umarła w tragicznych okolicznościach.

Pozdr.

To jest przebudowana pod kątem uczenia maszynowego konsumencka vega z dodatkiem ficzerów zbędnych 'u cywili'. Może vega 64/56 w 7 nm będzie dla mas?
decorator12 (2018.11.07, 08:19)
Ocena: 3

0%
Przecież Instinct był w 14nm dla Pro i dla cywili, także jaki problem aby to teraz też zrobic? :E
Tylko że jak przenieść te '25% wyższy zegar przy tym samym poborze prądu' na GPU to i tak jest za mało na Turinga.
No chyba że HBM będzie lepiej działać i kolejne mm słupków fps na wykresach będą właśnie z niego.
bigovsky (2018.11.07, 08:33)
Ocena: 2

0%
Navi to najpewniej skrojona pod konsole konsumencka Vega 7nm. Widocznie mają zbyt mały uzysk na jakikolwiek inny rynek poza profesjonalnym
nirvan (2018.11.07, 08:44)
Ocena: 4

0%
decorator12 @ 2018.11.07 08:19  Post: 1173500
Przecież Instinct był w 14nm dla Pro i dla cywili, także jaki problem aby to teraz też zrobic? :E
Tylko że jak przenieść te '25% wyższy zegar przy tym samym poborze prądu' na GPU to i tak jest za mało na Turinga.
No chyba że HBM będzie lepiej działać i kolejne mm słupków fps na wykresach będą właśnie z niego.


Vega bardziej przyśpieszała po podkręceniu pamięci niż gpu - czyli cierpiała na zbyt małą przepustowość pamięci i problem z wykarmieniem jednostek obliczeniowych z tym związany. Poszerzenie szyny z 2048 do 4096 mogłoby pozwolić jej nabrać wiatru w żagle.

Problem jest taki, że HBM dalej jest drogie i taka Vega 20 na rynku konsumenckim też by musiała być droga... Chyba lepiej poczekać na Navi z GDDR6.
Skullek (2018.11.07, 09:02)
Ocena: 11

0%
decorator12 @ 2018.11.07 08:19  Post: 1173500
Przecież Instinct był w 14nm dla Pro i dla cywili, także jaki problem aby to teraz też zrobic? :E
Tylko że jak przenieść te '25% wyższy zegar przy tym samym poborze prądu' na GPU to i tak jest za mało na Turinga.
No chyba że HBM będzie lepiej działać i kolejne mm słupków fps na wykresach będą właśnie z niego.

decorator12 @ 2018.11.07 08:19  Post: 1173500
Przecież Instinct był w 14nm dla Pro i dla cywili, także jaki problem aby to teraz też zrobic? :E
Tylko że jak przenieść te '25% wyższy zegar przy tym samym poborze prądu' na GPU to i tak jest za mało na Turinga.
No chyba że HBM będzie lepiej działać i kolejne mm słupków fps na wykresach będą właśnie z niego.



Tyle że MI25 (Instinct w 14nm) ma kiepskie FP64 .. Tutaj FP64 jest .. spore ;) AMD nie utnie FP64 i nie zrobi vegi dla graczy bo to nie ma sensu...

Na wielu forach ludzie się plują, że jak na 300+ mm^2 to prawie zerowy postęp, ale fp64 swoje bierze ..
orrey (2018.11.07, 10:07)
Ocena: 10

0%
'za mało na Turinga'
Jesli Turing pożyje wystarczająco długo by wykazać swoją wyższość...
iwanme (2018.11.07, 10:19)
Ocena: 22

0%
orrey @ 2018.11.07 10:07  Post: 1173516
'za mało na Turinga'
Jesli Turing pożyje wystarczająco długo by wykazać swoją wyższość...

No jasne że pożyje, przecież dwa tygodnie pracy to one wytrzymują, a benchmark zajmuje chwilę ;)
voodoo34 (2018.11.07, 10:33)
Ocena: -2

0%
yendrek @ 2018.11.07 08:12  Post: 1173498

To jest przebudowana pod kątem uczenia maszynowego konsumencka vega z dodatkiem ficzerów zbędnych 'u cywili'. Może vega 64/56 w 7 nm będzie dla mas?


To jest nowa wersja Vegi MI25 nie konsumenckiej V64.
eyesore (2018.11.07, 10:38)
Ocena: 5

0%
Pójdzie na tym Crysis?
Zaloguj się, by móc komentować
Aktualności
Rusza kolejna edycja największego plebiscytu technologicznego w Polsce – Tech Awards 2018, który organizuje nasza redakcja wspólnie z Komputer Świat i Verdykt.pl. 47
Pierwsze takie chipy w pełni zgodne ze standardem JEDEC. 0
Smartfon może być dopiero początkiem. 3
Długie oczekiwanie ma zostać w końcu nagrodzone. 16
Wzrost będzie, ale w specyficznych zastosowaniach. 27
Red Dead Redemption 2 kontra „exy” Sony. 3
Posiadacze GeForce’ów RTX w końcu się doczekali. 35
Pakiet z optymalizacjami dla trzech dużych produkcji. 5
To pierwszy raz, kiedy firma zrobi coś takiego. 10
Długie oczekiwanie ma zostać w końcu nagrodzone. 16
Odpowiednik GeForce’a RTX 2070 na rynek profesjonalny. 4
Jasna deklaracja Phila Spencera. 19
Odświeżony projekt i funkcje dla wymagających. 7
Aktualności spokrewnione
Facebook
Ostatnio komentowane