aktualności

Nvidia A100 - prezentacja akceleratora z rodziny Ampere

29
14 maja 2020, 15:37 Adrian Kotowski

Nvidia zaprezentowała dzisiaj szereg nowych rozwiązań, korzystających z układów Ampere. Podstawą jest w tym przypadku konstrukcja Nvidia A100, przygotowana przede wszystkim z myślą o przyspieszeniu zadań związanych ze sztuczną inteligencją, analizą danych, ale też wysokowydajnymi obliczeniami. Nowy rdzeń jest potężny i zapewnia równie ogromną wydajność, znacząco przewyższającą to, co widzieliśmy w przypadku układu V100.

Nvidia A100 nazywana jest przez swojego producenta jako Tensor Core GPU, co ma nam pokazać, że mówimy o jednostce mającej służyć do obliczeń SI. Układ został zbudowany z ponad 54 mld tranzystorów i wykonany w litografii 7 nm. Jedną z jego kluczowych cech jest obecność na pokładzie rdzeni Tensor 3. generacji z Tensor Float (TF32). Zdaniem Nvidii, ta nowość przekłada się na ponad 20-krotnie wyższą wydajność w wybranych zadaniach względem V100 przy zerowych zmianach w kodzie. Poza tym mamy też 2-krotny wzrost wydajności w obliczeniach wykorzystujących automatyczną mieszaną precyzję i FP16.

Ze względu na zmiany w budowie, Nvidia zaprezentowała sporo danych o maksymalnej wydajności:

  • szczytowa wydajność w obliczeniach FP64: 9,7 TFLOPS,
  • szczytowa wydajność w obliczeniach FP64 Tensor Core: 19,5 TFLOPS,
  • szczytowa wydajność w obliczeniach FP32: 19,5 TFLOPS,
  • szczytowa wydajność w obliczeniach FP32 TFLOPS: 156 TFLOPS / 312 TFLOPS,
  • szczytowa wydajność w obliczeniach BFLOAT16 Tensor Core: 312 TFLOPS / 624 TFLOPS,
  • szczytowa wydajność w obliczeniach FP16 Tensor Core: 312 TFLOPS / 624 TFLOPS,
  • szczytowa wydajność w obliczeniach INT8 Tensor Core: 624 TOPS / 1248 TOPS,
  • szczytowa wydajność w obliczeniach INT 4 Tensor Core: 1248 TOPS / 2496 TOPS.

Do każdego układu przypisano 40 GB pamięci HBM2 o przepustowości 1555 GB/s. Urządzenie korzysta też z interfejsów NVLink 600 GB/s i PCIe 4. Ważną cechą Nvidia A100 jest obsługa MIG, czyli systemu dzielącego GPU na maksymalnie siedem niezależnych instancji. Za sprawą tego rozwiązania kilku użytkowników ma dostęp do pojedynczego układu graficznego i może z niego korzystać niezależnie w swoich projektach. TDP nowego chipu wynosi 400 W.

Nvidia A100 jest już produkowana na masową skalę i wiadomo, że zostanie wykorzystana w budowanych właśnie superkomputerach tworzonych w ośrodkach badawczych w Stanach Zjednoczonych i Niemczech.

Źródło: Nvidia
SkullekZobacz profil
Poziom ostrzeżenia: 0%
Skullek2020.05.14, 15:44
40#1
Piekło zamarzło bo DGX A100, w którym siedzi ten chip korzysta z 2 procesorów EPYC. Nvidia porzuciła Intela i przerzuciła się na AMD. Fanboje Intela będą mieli ciężko z przetrawieniem tego
darkmartinZobacz profil
Poziom ostrzeżenia: 0%
darkmartin2020.05.14, 15:45
16#2
Piekielnie szybka bestia. Tylko, że ta stacja robocza kosztuje 1 mln zł. Nie dziwi EPYC, to jedyna platforma z PCI Express 4.0. 8 Ampere to akurat 128 linii PCI Express, tyle ta platforma daje z 2 procesorami EPYC Rome.
Edytowane przez autora (2020.05.14, 15:47)
DaviMZobacz profil
Poziom ostrzeżenia: 0%
DaviM2020.05.14, 16:17
29#3
@up, w Intelu są szczęśliwi, że nie muszą się użerać z kolejnym roszczeniowym klientem. Według Intela:

'Nvidia stała się ostatnio wobec nas bardzo roszczeniowa. Zażądali od nas procesorów ze znacznie powiększoną liczbą rdzeni, znacznie szybszych, wykonanych w niższym procesie technologicznym, obsługujących najnowsze technologie w tym PCIe4.0, posiadających znacznie więcej linii PCIe, bezpiecznych, bez dziur, i w dodatku tańszych.
Ale przecież to jest niemożliwe! Może jedną z tych rzeczy dałoby się zrobić za 2-3 lata, ale nie wszystkie na raz i nie teraz!!!
Intel.'
Darko7Zobacz profil
Poziom ostrzeżenia: 0%
Darko72020.05.14, 16:17
15#4
No dobra ale czy Crysis na tym pójdzie?
szatkusZobacz profil
Poziom ostrzeżenia: 0%
szatkus2020.05.14, 16:23
Skullek @ 2020.05.14 15:44  Post: 1243751
Piekło zamarzło bo DGX A100, w którym siedzi ten chip korzysta z 2 procesorów EPYC. Nvidia porzuciła Intela i przerzuciła się na AMD. Fanboje Intela będą mieli ciężko z przetrawieniem tego

Ale czemu zamarzło? Nvidia nigdy nie twierdziła, że Intel jest super albo z nimi jakoś poważniej współpracowali. Nie przypominam sobie, żeby kiedyś polecali procki konkretnego producenta (poza IBM, ale to już inna historia). Epyci są teraz lepsze, więc je wybrali do tego zestawu.

Już nie mówiąc, że w dawnych czasach polecanym zestawem był procek od AMD i grafa od Nvidii (wtedy nVidii). I chipsetem zrobionym przez NV :)
Edytowane przez autora (2020.05.14, 16:26)
Heinrich07Zobacz profil
Poziom ostrzeżenia: 0%
Heinrich072020.05.14, 16:25
-3#6
Proszę, proszę, Nvidia korzysta z AMD? :) Ojojoj, to co, czas robić przerzutkę z zielonych okularów czy niebieskich?
Adam524Zobacz profil
Poziom ostrzeżenia: 0%
Adam5242020.05.14, 16:31
Szkoda że nie zrobili porównania opłacalności do serwerów opartych na radeonach.
luki172Zobacz profil
Poziom ostrzeżenia: 0%
luki1722020.05.14, 16:38
No dobra, a co z kartami do gier? Z tego co widze to specyfikacja mocniejsza niz w Volcie, ale juz tensor core jest mniej
szatkusZobacz profil
Poziom ostrzeżenia: 0%
szatkus2020.05.14, 16:40
Adam524 @ 2020.05.14 16:31  Post: 1243766
Szkoda że nie zrobili porównania opłacalności do serwerów opartych na radeonach.

AMD do tej pory nie wydało takiej platformy. Zresztą dopóki nie wypuszczą MI100 to nie mają czym walczyć, ale Vegi radziły sobie całkiem dobrze z Voltami (2/3 wydajności za ułamek ceny). Mają Infinity Fabric, więc potencjalnie jeśli znajdą partnera, który im dostarczy komponenty sieciowe to mogą coś podobnego zbudować.
SasiltonZobacz profil
Poziom ostrzeżenia: 0%
Sasilton2020.05.14, 16:56
Darko7 @ 2020.05.14 16:17  Post: 1243762
No dobra ale czy Crysis na tym pójdzie?

Z tego co słuchałem, to odpalisz nawet 7 Crysisów na raz.
Zaloguj się, by móc komentować
1