Aktualność
Adrian Kotowski, Czwartek, 13 września 2018, 12:33

Konstrukcja deklasuje swojego poprzednika. Nvidia zaprezentowała dzisiaj swój nowy akcelerator Tesla T4 bazujący na architekturze Turing. Jest to urządzenie przygotowane z myślą o obliczeniach związanych z maszynowym uczeniem i wnioskowaniem, charakteryzujące się stosunkowo niewielkimi rozmiarami i małym poborem energii elektrycznej.

Nvidia Tesla T4 to akcelerator mający na pokładzie 2560 rdzeni CUDA i 320 rdzeni Tensor. Jego wydajność w obliczeniach pojedynczej precyzji to 8,1 TFLOPS, co oznacza, że taktowanie jest na poziomie około 1580 MHz. Konstrukcja ma na pokładzie 16 GB pamięci GDDR6 o przepustowości 320 GB/s, korzysta z interfejsu PCIe x16, a jej TDP wynosi tylko 75 W.

Nvidia Tesla T4

Jako że mamy do czynienia z akceleratorem do wnioskowania, to oczywiście sprzęt bez problemu radzi sobie z obliczeniami w obniżonej precyzji. W przypadku obliczeń FP16 mówimy o wydajności na poziomie 65 TFLOPS, gdy przejdziemy do INT8 to wartość ta wzrasta do 130 TFLOPS, a dalsze obniżenie szczegółowości obliczeń do INT4 pozwala osiągnąć aż 260 TFLOPS. Warto wspomnieć, że Tesla P4, a więc poprzedniczka nowego modelu, korzystająca z architektury Pascal, mogła pochwalić się wynikami wynoszącymi zaledwie 5,5 TFLOPS dla FP16 i 22 TFLOPS dla obliczeń INT8.

Ciekawą nowością w Tesli T4 jest też eksperymentalna obsługa obliczeń z precyzją INT1. Urządzenie jest ponadto zoptymalizowane do przetwarzania materiałów wideo. Nowy akcelerator Nvidii może w tym samym momencie dekodować aż 38 filmów w rozdzielczości 1080p. Urządzenie jest w pełni kompatybilne z Nvidia TensorRT 5, służącym do optymalizacji sieci neuronowych do zróżnicowanych obciążeń oraz serwerem inferencyjnym Nvidia TensorRT, umożliwiającym aplikacjom korzystanie z modeli sztucznej inteligencji w centrach danych. Cena sprzętu nie została niestety podana. Wiemy za to, że jego instalację w swoich systemach zapowiedziały już takie firmy jak Microsoft i Google.

Sprawdź ceny popularnych kart graficznych dostępnych w Polsce

Źródło: Nvidia
Ocena aktualności:
Ocen: 9
Zaloguj się, by móc oceniać
=-Mav-= (2018.09.13, 13:09)
Ocena: -4

0%
INT1? Co się szczypią, niech od razu zrobią INT0, dopiero będzie szybko. I ten slogan rekkamowy:

'Najszybsza karta do obliczeń zmiennoprzecinkowych na świecie! *

*pod warunkiem że nie będziesz potrzebować żadnych cyfr po przecinku'
Edytowane przez autora (2018.09.13, 13:12)
CryKon (2018.09.13, 13:16)
Ocena: 11

0%
=-Mav-= @ 2018.09.13 13:09  Post: 1164403
INT1?
*pod warunkiem że nie będziesz potrzebować żadnych cyfr po przecinku'


poprzednia byla kilkukrotnie wolniejsza. O co ci chodzi malkontencie?
Wibowit (2018.09.13, 13:22)
Ocena: 24

0%
INT to i tak nie są liczby zmiennoprzecinkowe tylko całkowite. FLOAT to liczby zmiennoprzecinkowe.

INT1 natomiast brzmi dziwnie, bo intuicyjnie INT1 powinno być tożsame z pojedynczym bitem (bool/ boolean/ itp). Operacje na pojedynczych bitach to coś raczej standardowego od dawna.
Edytowane przez autora (2018.09.13, 13:26)
Aargh (2018.09.13, 13:23)
Ocena: 9

0%
=-Mav-= @ 2018.09.13 13:09  Post: 1164403
INT1? Co się szczypią, niech od razu zrobią INT0, dopiero będzie szybko. I ten slogan rekkamowy:

'Najszybsza karta do obliczeń zmiennoprzecinkowych na świecie! *

*pod warunkiem że nie będziesz potrzebować żadnych cyfr po przecinku'

Ale wiesz, że nie każde obliczenia wymagają od razu pełnej 32 bitowej precyzji (lub nawet 16)?
=-Mav-= (2018.09.13, 13:50)
Ocena: 10

0%
Wibowit @ 2018.09.13 13:22  Post: 1164408
INT to i tak nie są liczby zmiennoprzecinkowe tylko całkowite. FLOAT to liczby zmiennoprzecinkowe.

Racja, nie zwróciłem uwagi że mówią o intach, nie fp. I rzeczywiście, int1 wygląda na zwykłe true/false.
szatkus (2018.09.13, 14:21)
Ocena: 0

0%
Wibowit @ 2018.09.13 13:22  Post: 1164408

INT1 natomiast brzmi dziwnie, bo intuicyjnie INT1 powinno być tożsame z pojedynczym bitem (bool/ boolean/ itp). Operacje na pojedynczych bitach to coś raczej standardowego od dawna.

Jeśli trzymasz je w tablicy to tak, wystarczą stare, dobre maski bitowe. Tutaj chodzi o operacje na tensorach INT1.
Kwant (2018.09.13, 15:47)
Ocena: 4

0%
=-Mav-= @ 2018.09.13 13:50  Post: 1164412
Wibowit @ 2018.09.13 13:22  Post: 1164408
INT to i tak nie są liczby zmiennoprzecinkowe tylko całkowite. FLOAT to liczby zmiennoprzecinkowe.

Racja, nie zwróciłem uwagi że mówią o intach, nie fp. I rzeczywiście, int1 wygląda na zwykłe true/false.


Tu chodzi o obliczenia arytmetyczne, w szczególności obliczenia wektorowe przy użyciu TensorFlow na liczbach zapisanych na... jednym bicie czyli dwuwartościowych {-1, 1}.

To o czym piszesz - true/false to są operacje logiczne. To jest jednak coś innego niż operacje arytmetyczne. W szczególności 8 liczb (jednobitowych) zapisanych w bajcie i wektorowo dodanych do drugiego takiego bajtu to nie będzie równoznaczne z operacją logiczną OR bit-wise pomiędzy tymi dwoma bajtami.
Zaloguj się, by móc komentować
Aktualności
Gorzej niż wcześniej, ale i tak świetnie. 46
Spodziewajcie się wzrostu wydajności. 19
Edycja specjalna. AMD zamierza hucznie obchodzić swoje 50. 15
Akcja wsparcia w związku z pożarem katedry Notre-Dame de Paris. 29
APU z 2 rdzeniami, 4 wątkami, układem graficznym Vega 3 i dwoma kontrolerami LAN 10 Gb/s. 5
Aktualności spokrewnione
Artykuły spokrewnione
Forum
Facebook
Ostatnio komentowane