aktualności

Nvidia Tesla V100 - testy

44 18 września 2017, 08:39 Piotr Gontarczyk

Ogromna moc nowej architektury. Ruszyły dostawy kart obliczeniowych z procesorami Nvidia V100, opartymi na architekturze Volta. Nowy GPU to przede wszystkim 12-nanometrowa litografia, ale także łącze NVLink 2.0, układy pamięci HBM2, rdzenie Tensor, czy wreszcie nowa architektura stworzona pod kątem skomplikowanych obliczeń, czy zastosowań w AI (Deep Learning).

Dystrybuowane karty Tesla V100 dają okazję do testowania ich wydajności. W bazie Geekbench 4 pojawiły się wpisy dotyczące testów systemu Nvidia DGX-1, a więc gotowego super-komputera, który najwyraźniej zapewnia ogromną moc obliczeniową. Z oficjalnych danych Nvidii wynika, że względem Pascala (Tesla P100), moc obliczeniowa FP16 w Volcie (Tesla V100) wzrosła ze 170 do aż 960 TFLOPS.

Jeśli chodzi o specyfikację to DGX-1 wyposażony jest w osiem GPU Tesla V100. Każdy z nich ma po 5120 rdzeni CUDA, co łącznie daje liczbę aż 40.960 rdzeni, a także 5120 rdzeni Tensor (640 na każdy GPU). W DGX-1 znajduje się też procesor Intel Xeon E5-2698 V4, a więc jednostka 20-rdzeniowa z obsługą 40 wątków, działająca z zegarem 2,2 GHz. Oprócz tego komputer ma 512 GB pamięci RAM typu DDR4, cztery nośniki SSD o łącznej pojemności 1,92 TB, spięte w macierzy RAID 0, a także dwa 10-gigabitowe kontrolery Ethernet i cztery łącza IB (InfiniBand) EDR (25,78 Gb/s). Całości dopełnia zasilacz o mocy 3,2 kW.

Co do wyników testów, to w Geekbenchu 4 Nvidia DGX-1 okazuje się być niepokonany i wygląda na to, że jeszcze przez jakiś czas pozostanie na samym szczycie. W teście pojedynczego rdzenia, komputer z Teslą V100 uzyskał wynik aż 743.537 punktów (CUDA). Dla porównania najmocniejszy super-komputer z Teslą P100 (Pascal) ma wynik 320.031 punktów. W teście OpenCL Volta też wszelką konkurencję pozostawia daleko w tyle, uzyskując wynik aż 481.504 punktów. Z tym samym API następny wynik to 278.706 punktów, uzyskany z komputerem HP Z8 G4, aczkolwiek ten dysponuje nie ośmioma, a dziewięcioma kartami Quadro GP100 (Pascal).

Obecnie architekturę Volta poznajemy pod postacią produktów dla zastosowań korporacyjnych i serwerowych. Możemy jednak spodziewać się jej także w produktach przeznaczonych na rynek konsumencki. Planowane na przyszły rok nowe procesory grafiki to GV110, GV102 oraz GV104.

Pierwszy z nich ma być podstawą do stworzenia najważniejszych flagowców spośród kart GeForce. Firma zapewne będzie z tymi kartami celować w segment cenowy z okolic 400 dolarów i możemy spodziewać się dwóch wariantów tego samego GPU - jednego pełnowartościowego oraz drugiego z pewnymi cięciami w specyfikacji. Nie byłoby to nic zaskakującego, gdyż Nvidia robi tak z układami Gxx04 już od jakiegoś czasu. Karty z procesorami GV104, a więc GeForce GTX 3080 i GTX 3070, wyposażone mają być w 16 i 8 GB pamięci RAM typu GDDR6, podpiętej do GPU 256-bitowym interfejsem, zapewniając przepustowość 512 GB/s, a więc o 32 GB/s większą niż w karcie Titan X z 384-bitowym interfejsem RAM. GV102 powinien być bezpośrednim następcą procesora GP102, stosowanego obecnie na kartach Titan X. Ma to być najmocniejszy GPU Nvidii dla kart konsumenckich.

Źródło: Wccftech, opr. wł.
iwanmeZobacz profil
Poziom ostrzeżenia: 0%
iwanme2017.09.18, 09:10
17#1
Czyli że pójdzie na tym Crysis? :)

Ogólnie to wow... Ciekawe jak będą te rdzenie się sprawowały przy renderowaniu grafiki do gier jak już wejdą do cywilnych zastosowań...
Szkoda, że AMD tak z Vegą wtopiło...

CryKonZobacz profil
Poziom ostrzeżenia: 0%
CryKon2017.09.18, 09:16
-17#2
To, że Crysis tak wolno działał nie było spowodowane słabym sprzętem wtedy, lecz cienkim programowaniem.
GraveZobacz profil
Poziom ostrzeżenia: 0%
Grave2017.09.18, 09:36
21#3
I to jest wlasciwe podejscie. Konkurencja w tyle a NV zamiast stanąć i poczekać (vide Intel) idzie do przodu żeby nie dac się dogonić AMD.
DuchuZobacz profil
Poziom ostrzeżenia: 0%
Duchu2017.09.18, 09:45
13#4
Tak właśnie miażdży się konkurencję!

Gdyby Raja Koduri zrobił swoją robotę jak należy... :(


Pozdrawiam.
GrLTZobacz profil
Poziom ostrzeżenia: 0%
GrLT2017.09.18, 10:05
-6#5
Duchu @ 2017.09.18 09:45  Post: 1095422
Tak właśnie miażdży się konkurencję!

Gdyby Raja Koduri zrobił swoją robotę jak należy... :(

Pozdrawiam.

Jakby był dobry to by pracował dla zielonych a nie dla AMD. :E
Pawelek6Zobacz profil
Poziom ostrzeżenia: 0%
Pawelek62017.09.18, 10:11
Co jak co, ale przyrost mocy względem Tesli Pascal jest ogromny.

AMD jak odbiło się od dna z procesorami, tak teraz pewnie przez jakiś czas będą w czarnej d**ie z grafikami, jak to do niedawna wyglądało z procesorami FX...
Vega nic nie dała. Nie jest w stanie nawiązać walki z najmocniejszym Pascalem, a w dodatku pożera ogromne ilości energii, którą następnie trzeba jeszcze oddać w postaci ciepła.
Kris194Zobacz profil
Poziom ostrzeżenia: 0%
Kris1942017.09.18, 10:18
-9#7
Gdzie tu niby jest ten skok? Ja nic nie jestem w stanie sprawdzić na podstawie tych wyników, widzę jedynie, że znacznie większy układ pokonuje mniejszy układ, też mi nowość. Pomijam już fakt, że geekbench to kiepski wyznacznik wydajności, nawet nie można zweryfikować ile kart faktycznie jest w danej maszynie.
jankesdzZobacz profil
Poziom ostrzeżenia: 0%
jankesdz2017.09.18, 10:37
-9#8
To coś nowego, więcej cache L1 niż L2? W takim razie po co dawać wolniejszą i z większymi opóźnieniami L2? Więcej keszu w Maxwellach dało ładny rezultat. Jeśli tutaj faktycznie polecieli tak z pierwszym poziomem to w niektórych zastosowaniach może być przepaść. Nie po to daje się prawie 8x tyle drogiej pamięci żeby był marny przyrost.
voodoo34Zobacz profil
Poziom ostrzeżenia: 0%
voodoo342017.09.18, 10:39
-6#9
Duchu @ 2017.09.18 09:45  Post: 1095422
Tak właśnie miażdży się konkurencję!

Gdyby Raja Koduri zrobił swoją robotę jak należy... :(


Pozdrawiam.


AMD nie ma rdzeni CUDA więc odniesienia w tym benchu żadnego nie sposób znaleźć.

Raja nie odpowiada za architekturę GCN, jego dzieło to prawdopodobnie dopiero zobaczymy w Navi.
Orzel94Zobacz profil
Poziom ostrzeżenia: 0%
Orzel942017.09.18, 10:40
28#10
CryKon @ 2017.09.18 09:16  Post: 1095415
To, że Crysis tak wolno działał nie było spowodowane słabym sprzętem wtedy, lecz cienkim programowaniem.

akurat crysis 1 był bardzo dobrze zoptymalizowany patrząc na to jaki poziom grafiki reprezentował na tle innych gier z tego okresu i wiele lat później
Zaloguj się, by móc komentować
1