Intel chce umacniać swoją ofertę procesorów dla wysokowydajnych platform obliczeniowych i przygotowuje nowy procesor Xeon Phi, który ma być wyposażony w aż 72 rdzenie Silvermont, 16 GB pamięci HBM (High-bandwith Memory) i sześciokanałowym kontrolerem pamięci RAM.
Nowe informacje na temat Xeonów Phi Knights Landing mamy bezpośrednio od Intela, a ich źródłem jest dokumentacja, która pojawiła się przed konferencją IDF 2015 (Intel Developer Forum). Warto zauważyć, że nowy Xeon Phi pojawiał się już wcześniej w doniesieniach, ale wtedy znany był jako jednostka maksymalnie 60-rdzeniowa. Teraz mamy potwierdzoną informację o tym, że Intel planuje jeszcze bardziej rozbudowaną konstrukcję.
Intel w swojej dokumentacji opisuje plany dalszego rozwoju oferty dla równoległych obliczeń z wykorzystaniem architektury x86. Tego typu zastosowania wymagają kilku kluczowych elementów, spośród których trzy najważniejsze to bardzo wysoka wydajność jednostki CPU, bardzo szeroki interfejs pamięci RAM oraz bardzo duża pojemność owej pamięci.
Wraz z procesorami Knights Landing Intel zamierza zapewnić wszystko to, a nawet więcej. Nowa konstrukcja wyposażona jest w 72 rdzenie Silvermont, z czego każdy może obsługiwać maksymalnie cztery wątki. W efekcie całość to jednostka 288-wątkowa. W układzie zastosowano sześciokanałowy kontroler pamięci RAM typu DDR4-2400, której maksymalna pojemność może wynosić 384 GB. Niestety we wspomnianej dokumentacji Intel nie ujawnił jeszcze dokładnej i pełnej mocy obliczeniowej swojego nowego układu. Wiemy jednak, że Knights Landing w obliczeniach podwójnej precyzji (FP64) może osiągać wydajność na poziomie 3 TFLOPS, a więc większą niż ta, którą obecnie mogą zapewniać karty graficzne z procesorami AMD i Nvidii.
Kluczowym elementem warunkującym wydajność Knights Landing jest obecność bardzo szybkich stosów pamięci HBM, która ma pełnić funkcję pamięci podręcznej trzeciego poziomu. Z jednej strony rozwiązanie to nie zapewnia tak dużych prędkości działania, w porównaniu do SRAM czy DRAM w postaci pamięci L3, ale z drugiej strony jej zaletą jest przede wszystkim o wiele większa pojemność oraz szerokość interfejsu, która przechyla szalę na stronę rozwiązania HBM. Wygląda na to, że pamięć HBM stanie się już niebawem standardem zarówno na rynku CPU i GPU. Wiemy już, że AMD niebawem zaprezentuje swoje pierwsze układy z pamięci HBM, a Nvidia zrobi to w przyszłym roku. Także Intel zamierza korzystać z tego rozwiązania, a to daje już pewność, że HBM nie jest tylko przelotnym romansem.
Jeśli chodzi o sam CPU, to 14-nanometrowy Knights Landing ma wykorzystywać nowe rdzenie Silvermont, które według Intela zapewniają nawet trzykrotnie większą wydajność jednego wątku, w porównaniu do ostatniej generacji Xeonów Phi. Jednocześnie sprawność energetyczna ma być nawet trzykrotnie lepsza. Intel robi co tylko może aby zapewnić sobie pozycję na rynku obliczeń równoległych, który w dużej mierze opanowany jest przez procesory grafiki, które w wyniku ewolucji przestały być już tylko jednostkami generującymi grafikę 2D i 3D. Obliczenia równoległe z wykorzystaniem układów x86 ma jednak swoją przewagę przede wszystkim pod względem łatwości programowania. Wykorzystanie GPU zapewnia z drugiej strony na razie lepszą wydajność i sprawność energetyczną. Co ciekawe oba fronty coraz mocniej się do siebie zbliżają. Intel konsekwentnie poprawia czystą wydajność oraz sprawność energetyczną, podczas gdy producenci GPU starają się zapewniać coraz lepsze narzędzia programistyczne. Obecnie trudno stwierdzić czy na rynku sprzętu dla obliczeń równoległych czeka nas jakieś większe przetasowanie. Intel z pewnością nie zamierza odpuszczać.



Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?
Tak, to nowy Atom: http://en.wikipedia.org/wiki/Silvermont
Tylko że 'przygotowanie softu' pod nowe AVX to kwestia aktualizacji kompilatora...
A w ogóle działać to będzie i bez tego. Poza tym nie każde zastosowanie wykorzystuje AVX.
Znacznie łatwiej zoffloadować istniejący kod na kompatybilnego z x86 Xeona Phi, niż przepisywać go na CUDA, które jest całkowicie innym modelem programistycznym. Jak ktoś się w to wpakował, to będzie tam siedział, bo mu się nie opłaca spędzać 2 lata na przepisywaniu softu. Jak ktoś się jednak dopiero rozgląda za HPC, to Xeon Phi często jest naturalnym wyborem ze względu na mniejszą złożoność wdrożenia i lepszą kompatybilność.
Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?
To i tak nie będzie dla żadnego innego rynku jak superkomputery(ze względu na cenę zestawu), a na tym rynku Tesla, to już żadna nowość, jest dużo narzędzi od NV. Ci co zajmują się programowaniem na najwydajniejszych superkomputerach, już dobrze poznali zasady implementacji rozwiązań NV.
Wiadomo, HPC to głównie superkomputery. Ale masz też wsparcie dla Xeonów Phi w jakichś pakietach oprogramowania do obliczeń inżynierskich, symulacji, itp.
Do do NV - tak, poznali CUDA dobrze. Ale x86_64 poznali jeszcze lepiej i wcześniej
No nie przesadzaj, jak potrzebujesz dużo rdzeni, to i do desktopa już teraz możesz wsadzić znacznie więcej, niż 4. Pytanie, jak $ilną ma$z motywację
http://ark.intel.com/products/family/79318...essors#@Desktop
http://ark.intel.com/products/family/78584...-Family#@Server
właściwie to taka, że w przypadku wykorzystania AVX2 to nie trzeba będzie przerabiać nic w sofice bo soft taki powstaje od czasów HSW. Tylko że wtedy stracimy przewagę wynikającą z zastosowania AVX3.1.
O AVX 3.0 też na razie też nic powiedzieć nie można, bo procesorów obsługujące to rozszerzenie dopiero się pojawią i to tylko dla profesjonalistów. A soft jak wiadomo odpowiednio później.
No to masz co najwyżej połowę mocy tego układu. Więc tak czy siak trzeba będzie wprowadzić odpowiednie modyfikacje.
Haswell E wyszedł dopiero trochę ponad pol roku temu, więc w serwerach avx2.0 jest i tak nowością.
Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?
Tak, to nowy Atom: http://en.wikipedia.org/wiki/Silvermont
właściwie to taka, że w przypadku wykorzystania AVX2 to nie trzeba będzie przerabiać nic w sofice bo soft taki powstaje od czasów HSW. Tylko że wtedy stracimy przewagę wynikającą z zastosowania AVX3.1.
O AVX 3.0 też na razie też nic powiedzieć nie można, bo procesorów obsługujące to rozszerzenie dopiero się pojawią i to tylko dla profesjonalistów. A soft jak wiadomo odpowiednio później.
Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?
Tak, to nowy Atom: http://en.wikipedia.org/wiki/Silvermont
Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?
To i tak nie będzie dla żadnego innego rynku jak superkomputery(ze względu na cenę zestawu), a na tym rynku Tesla, to już żadna nowość, jest dużo narzędzi od NV. Ci co zajmują się programowaniem na najwydajniejszych superkomputerach, już dobrze poznali zasady implementacji rozwiązań NV.
Lecz nie wszystcy jeszcze wykorzystuja obliczenia na kartah graficznych, wiec intel moze jeszcze zmienic podejscie, przynajmniej odepchnac pomysl wdrozenia obliczen na grafice. Tylko niestety wiele takich producentow oprogramowania zycze sobie duzo za mozliwosc obliczenia na dodatkowym jednym rdzeniu. A czasy jednowatkowych procesorow juz dawno odeszly w niepamiec.
Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?
To i tak nie będzie dla żadnego innego rynku jak superkomputery(ze względu na cenę zestawu), a na tym rynku Tesla, to już żadna nowość, jest dużo narzędzi od NV. Ci co zajmują się programowaniem na najwydajniejszych superkomputerach, już dobrze poznali zasady implementacji rozwiązań NV.
No nie przesadzaj, jak potrzebujesz dużo rdzeni, to i do desktopa już teraz możesz wsadzić znacznie więcej, niż 4. Pytanie, jak $ilną ma$z motywację
http://ark.intel.com/products/family/79318...essors#@Desktop
http://ark.intel.com/products/family/78584...-Family#@Server
Tak, ale zastanów się, co łatwiej wykorzystać? Stare dobre x86_64 (z ulepszeniami), czy wymagające specyficznego, dedykowanego podejścia GPU?
Tak, to nowy Atom: http://en.wikipedia.org/wiki/Silvermont