aktualności

Intel Knights Landing: 72 rdzenie Silvermont

13
13 kwietnia 2015, 12:10 Piotr Gontarczyk

Intel chce umacniać swoją ofertę procesorów dla wysokowydajnych platform obliczeniowych i przygotowuje nowy procesor Xeon Phi, który ma być wyposażony w aż 72 rdzenie Silvermont, 16 GB pamięci HBM (High-bandwith Memory) i sześciokanałowym kontrolerem pamięci RAM.

Nowe informacje na temat Xeonów Phi Knights Landing mamy bezpośrednio od Intela, a ich źródłem jest dokumentacja, która pojawiła się przed konferencją IDF 2015 (Intel Developer Forum). Warto zauważyć, że nowy Xeon Phi pojawiał się już wcześniej w doniesieniach, ale wtedy znany był jako jednostka maksymalnie 60-rdzeniowa. Teraz mamy potwierdzoną informację o tym, że Intel planuje jeszcze bardziej rozbudowaną konstrukcję.

Intel w swojej dokumentacji opisuje plany dalszego rozwoju oferty dla równoległych obliczeń z wykorzystaniem architektury x86. Tego typu zastosowania wymagają kilku kluczowych elementów, spośród których trzy najważniejsze to bardzo wysoka wydajność jednostki CPU, bardzo szeroki interfejs pamięci RAM oraz bardzo duża pojemność owej pamięci.

Wraz z procesorami Knights Landing Intel zamierza zapewnić wszystko to, a nawet więcej. Nowa konstrukcja wyposażona jest w 72 rdzenie Silvermont, z czego każdy może obsługiwać maksymalnie cztery wątki. W efekcie całość to jednostka 288-wątkowa. W układzie zastosowano sześciokanałowy kontroler pamięci RAM typu DDR4-2400, której maksymalna pojemność może wynosić 384 GB. Niestety we wspomnianej dokumentacji Intel nie ujawnił jeszcze dokładnej i pełnej mocy obliczeniowej swojego nowego układu. Wiemy jednak, że Knights Landing w obliczeniach podwójnej precyzji (FP64) może osiągać wydajność na poziomie 3 TFLOPS, a więc większą niż ta, którą obecnie mogą zapewniać karty graficzne z procesorami AMD i Nvidii.

Kluczowym elementem warunkującym wydajność Knights Landing jest obecność bardzo szybkich stosów pamięci HBM, która ma pełnić funkcję pamięci podręcznej trzeciego poziomu. Z jednej strony rozwiązanie to nie zapewnia tak dużych prędkości działania, w porównaniu do SRAM czy DRAM w postaci pamięci L3, ale z drugiej strony jej zaletą jest przede wszystkim o wiele większa pojemność oraz szerokość interfejsu, która przechyla szalę na stronę rozwiązania HBM. Wygląda na to, że pamięć HBM stanie się już niebawem standardem zarówno na rynku CPU i GPU. Wiemy już, że AMD niebawem zaprezentuje swoje pierwsze układy z pamięci HBM, a Nvidia zrobi to w przyszłym roku. Także Intel zamierza korzystać z tego rozwiązania, a to daje już pewność, że HBM nie jest tylko przelotnym romansem.

Jeśli chodzi o sam CPU, to 14-nanometrowy Knights Landing ma wykorzystywać nowe rdzenie Silvermont, które według Intela zapewniają nawet trzykrotnie większą wydajność jednego wątku, w porównaniu do ostatniej generacji Xeonów Phi. Jednocześnie sprawność energetyczna ma być nawet trzykrotnie lepsza. Intel robi co tylko może aby zapewnić sobie pozycję na rynku obliczeń równoległych, który w dużej mierze opanowany jest przez procesory grafiki, które w wyniku ewolucji przestały być już tylko jednostkami generującymi grafikę 2D i 3D. Obliczenia równoległe z wykorzystaniem układów x86 ma jednak swoją przewagę przede wszystkim pod względem łatwości programowania. Wykorzystanie GPU zapewnia z drugiej strony na razie lepszą wydajność i sprawność energetyczną. Co ciekawe oba fronty coraz mocniej się do siebie zbliżają. Intel konsekwentnie poprawia czystą wydajność oraz sprawność energetyczną, podczas gdy producenci GPU starają się zapewniać coraz lepsze narzędzia programistyczne. Obecnie trudno stwierdzić czy na rynku sprzętu dla obliczeń równoległych czeka nas jakieś większe przetasowanie. Intel z pewnością nie zamierza odpuszczać.

TelvasZobacz profil
Poziom ostrzeżenia: 0%
Telvas2015.04.13, 17:42
Amitoza @ 2015.04.13 15:20  Post: 855999
Telvas @ 2015.04.13 12:43  Post: 855896
(...)

Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?

(...)

Tak, to nowy Atom: http://en.wikipedia.org/wiki/Silvermont
A jaka to różnica? Tak czy siak trzeba odpowiednio przygotować soft. W pierwszym wypadku pod avx3.1 i 512bitowe simd, a w drugim pod cuda.

Tylko że 'przygotowanie softu' pod nowe AVX to kwestia aktualizacji kompilatora...
A w ogóle działać to będzie i bez tego. Poza tym nie każde zastosowanie wykorzystuje AVX.
Znacznie łatwiej zoffloadować istniejący kod na kompatybilnego z x86 Xeona Phi, niż przepisywać go na CUDA, które jest całkowicie innym modelem programistycznym. Jak ktoś się w to wpakował, to będzie tam siedział, bo mu się nie opłaca spędzać 2 lata na przepisywaniu softu. Jak ktoś się jednak dopiero rozgląda za HPC, to Xeon Phi często jest naturalnym wyborem ze względu na mniejszą złożoność wdrożenia i lepszą kompatybilność.

barwniak @ 2015.04.13 12:53  Post: 855906
Telvas @ 2015.04.13 12:43  Post: 855896

Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?


To i tak nie będzie dla żadnego innego rynku jak superkomputery(ze względu na cenę zestawu), a na tym rynku Tesla, to już żadna nowość, jest dużo narzędzi od NV. Ci co zajmują się programowaniem na najwydajniejszych superkomputerach, już dobrze poznali zasady implementacji rozwiązań NV.

Wiadomo, HPC to głównie superkomputery. Ale masz też wsparcie dla Xeonów Phi w jakichś pakietach oprogramowania do obliczeń inżynierskich, symulacji, itp.
Do do NV - tak, poznali CUDA dobrze. Ale x86_64 poznali jeszcze lepiej i wcześniej :D
motiffZobacz profil
Poziom ostrzeżenia: 0%
motiff2015.04.13, 16:34
-1#12
Telvas @ 2015.04.13 12:48  Post: 855901
motiff @ 2015.04.13 12:41  Post: 855895
72 rdzenie, każdy 4 wątki masakra i to Atom. Co z tego, pecety dostają 4 rdzeniki do usranej śmierci.

No nie przesadzaj, jak potrzebujesz dużo rdzeni, to i do desktopa już teraz możesz wsadzić znacznie więcej, niż 4. Pytanie, jak $ilną ma$z motywację :D
http://ark.intel.com/products/family/79318...essors#@Desktop
http://ark.intel.com/products/family/78584...-Family#@Server
Można, ale kupujesz serwer, a nie pecet, niestety to oznacza, że programistom dalej będzie wisiało czy masz więcej niż 4 rdzenie.
AmitozaZobacz profil
Poziom ostrzeżenia: 0%
Amitoza2015.04.13, 15:54
-1#11
Markiz88 @ 2015.04.13 15:46  Post: 856025
Amitoza @ 2015.04.13 15:20  Post: 855999
(...)
A jaka to różnica? Tak czy siak trzeba odpowiednio przygotować soft. W pierwszym wypadku pod avx3.1 i 512bitowe simd, a w drugim pod cuda.

właściwie to taka, że w przypadku wykorzystania AVX2 to nie trzeba będzie przerabiać nic w sofice bo soft taki powstaje od czasów HSW. Tylko że wtedy stracimy przewagę wynikającą z zastosowania AVX3.1.

O AVX 3.0 też na razie też nic powiedzieć nie można, bo procesorów obsługujące to rozszerzenie dopiero się pojawią i to tylko dla profesjonalistów. A soft jak wiadomo odpowiednio później.

No to masz co najwyżej połowę mocy tego układu. Więc tak czy siak trzeba będzie wprowadzić odpowiednie modyfikacje.

Haswell E wyszedł dopiero trochę ponad pol roku temu, więc w serwerach avx2.0 jest i tak nowością.
Markiz88Zobacz profil
Poziom ostrzeżenia: 0%
Markiz882015.04.13, 15:46
Amitoza @ 2015.04.13 15:20  Post: 855999
Telvas @ 2015.04.13 12:43  Post: 855896
(...)

Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?

(...)

Tak, to nowy Atom: http://en.wikipedia.org/wiki/Silvermont
A jaka to różnica? Tak czy siak trzeba odpowiednio przygotować soft. W pierwszym wypadku pod avx3.1 i 512bitowe simd, a w drugim pod cuda.

właściwie to taka, że w przypadku wykorzystania AVX2 to nie trzeba będzie przerabiać nic w sofice bo soft taki powstaje od czasów HSW. Tylko że wtedy stracimy przewagę wynikającą z zastosowania AVX3.1.

O AVX 3.0 też na razie też nic powiedzieć nie można, bo procesorów obsługujące to rozszerzenie dopiero się pojawią i to tylko dla profesjonalistów. A soft jak wiadomo odpowiednio później.
AmitozaZobacz profil
Poziom ostrzeżenia: 0%
Amitoza2015.04.13, 15:20
Telvas @ 2015.04.13 12:43  Post: 855896
barwniak @ 2015.04.13 12:24  Post: 855882
To, że fajna rzecz jest to widać, pytanie kiedy? Czy jeszcze 2015, czy 2016. Bo jak w 2016 to będzie Tesla na nowej architekturze i wtedy to ten Xeon nie będzie już top, tylko równoważny przeciwnik.

Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?

zakius @ 2015.04.13 12:33  Post: 855887
Silvermont... To atom tak?

Tak, to nowy Atom: http://en.wikipedia.org/wiki/Silvermont
A jaka to różnica? Tak czy siak trzeba odpowiednio przygotować soft. W pierwszym wypadku pod avx3.1 i 512bitowe simd, a w drugim pod cuda.
VP11Zobacz profil
Poziom ostrzeżenia: 0%
VP112015.04.13, 13:24
barwniak @ 2015.04.13 12:53  Post: 855906
Telvas @ 2015.04.13 12:43  Post: 855896

Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?


To i tak nie będzie dla żadnego innego rynku jak superkomputery(ze względu na cenę zestawu), a na tym rynku Tesla, to już żadna nowość, jest dużo narzędzi od NV. Ci co zajmują się programowaniem na najwydajniejszych superkomputerach, już dobrze poznali zasady implementacji rozwiązań NV.

Lecz nie wszystcy jeszcze wykorzystuja obliczenia na kartah graficznych, wiec intel moze jeszcze zmienic podejscie, przynajmniej odepchnac pomysl wdrozenia obliczen na grafice. Tylko niestety wiele takich producentow oprogramowania zycze sobie duzo za mozliwosc obliczenia na dodatkowym jednym rdzeniu. A czasy jednowatkowych procesorow juz dawno odeszly w niepamiec.
barwniakZobacz profil
Poziom ostrzeżenia: 0%
barwniak2015.04.13, 12:53
Telvas @ 2015.04.13 12:43  Post: 855896

Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?


To i tak nie będzie dla żadnego innego rynku jak superkomputery(ze względu na cenę zestawu), a na tym rynku Tesla, to już żadna nowość, jest dużo narzędzi od NV. Ci co zajmują się programowaniem na najwydajniejszych superkomputerach, już dobrze poznali zasady implementacji rozwiązań NV.
TelvasZobacz profil
Poziom ostrzeżenia: 0%
Telvas2015.04.13, 12:48
11#6
motiff @ 2015.04.13 12:41  Post: 855895
72 rdzenie, każdy 4 wątki masakra i to Atom. Co z tego, pecety dostają 4 rdzeniki do usranej śmierci.

No nie przesadzaj, jak potrzebujesz dużo rdzeni, to i do desktopa już teraz możesz wsadzić znacznie więcej, niż 4. Pytanie, jak $ilną ma$z motywację :D
http://ark.intel.com/products/family/79318...essors#@Desktop
http://ark.intel.com/products/family/78584...-Family#@Server
TelvasZobacz profil
Poziom ostrzeżenia: 0%
Telvas2015.04.13, 12:43
barwniak @ 2015.04.13 12:24  Post: 855882
To, że fajna rzecz jest to widać, pytanie kiedy? Czy jeszcze 2015, czy 2016. Bo jak w 2016 to będzie Tesla na nowej architekturze i wtedy to ten Xeon nie będzie już top, tylko równoważny przeciwnik.

Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?

zakius @ 2015.04.13 12:33  Post: 855887
Silvermont... To atom tak?

Tak, to nowy Atom: http://en.wikipedia.org/wiki/Silvermont
motiffZobacz profil
Poziom ostrzeżenia: 0%
motiff2015.04.13, 12:41
-6#4
72 rdzenie, każdy 4 wątki masakra i to Atom. Co z tego, pecety dostają 4 rdzeniki do usranej śmierci.
Funkcja komentowania została wyłączona. Do dyskusji zapraszamy na forum.
1