aktualności

Xeon Phi, czyli zwieńczenie projektu "Larrabee"

32 20 czerwca 2012, 22:52 Eryk Napierała

Niebieski rywal profesjonalnych kart Nvidii i AMD. "Larrabee", czyli przygotowywana przez Intela karta graficzna oparta na rdzeniach x86, jeszcze trzy lata temu budziła nadzieję na znaczące zmiany na rynku akceleratorów przeznaczonych dla PC-tów. Niestety firma dość mocno się przeliczyła. Stworzone prototypy co prawda miały równać się (według nieoficjalnych informacji) GeForce'om i Radeonom z wysokiej półki, ale... tym z 2009, co nie nastawiało optymistycznie, skoro finalny produkt miał trafić do sklepów co najmniej rok później. Koniec końców, trzy miesiące po obiecującej prezentacji świat obiegła informacja, że Intel anuluje projekt "Larrabee" i nie stworzy własnej karty graficznej. Na pół roku sprawa ucichła i oto w sierpniu 2010 roku procesorowy gigant przedstawił Knigts Ferry, czyli korzystający ze znanej koncepcji akcelerator obliczeń, który miał konkurować już nie z GeForce'ami i Radeonami, a z kartami Tesla i FireStream. Właśnie takie urządzenie Intel wprowadza teraz na rynek pod nazwą Xeon Phi.

Prezentacja "Larrabee" we wrześniu 2009 roku.

Prototyp "Knights Ferry" z sierpnia 2010.

W przeciwieństwie do innych produktów z tej rodziny, Phi (nazwa robocza "Knights Corner") nie jest procesorem montowanym w podstawce na płycie głównej, a osobnym, pełnym podsystemem składającym się z minimum 50 rdzeni x86 i co najmniej 8GB szybkiej pamięci GDDR5. Całość łączy się z komputerem jak każda inna karta rozszerzeń – za pomocą interfejsu PCI Express.

Rdzenie, z których zbudowany jest Phi, zostały stworzone z tranzystorów 3-D Tri-Gate w procesie technologicznym 22 nm – zupełnie jak najnowsze procesory "Ivy Bridge". Nie ma jednak żadnego potwierdzenia, że architektura MIC (Many Integrated Core) ma cokolwiek wspólnego z tą stosowaną w układach desktopowych czy zwykłych Xeonach. Rdzenie "Larrabee" miały być podobne do tych z procesorów Pentium I (P54C), ale wyposażone dodatkowo w 512-bitową jednostkę wektorową, pozwalającą na przetwarzanie 16 liczb zmiennoprzecinkowych pojedynczej precyzji w tym samym czasie. Obecność takiego ALU w Xeonach Phi jest potwierdzona, ale to jedyne, co Intel ujawnia jak na razie o architekturze MIC. Reszty trzeba domyślać z materiałów o "Larrabee".

Teoretyczna wydajność Xeona Phi w operacjach na liczbach zmiennoprzecinkowych podwójnej precyzji wynosi 1 teraflops, czyli tyle samo, ile zapewnia najnowsza karta AMD z rodziny FirePro – oparty na dwóch procesorach Tahiti model W9000. Wygląda na to, że AMD i Nvidia mają się czego bać... o ile wynalazek Intela okaże się konkurencyjny nie tylko pod względem wydajności, ale także poboru mocy, bo to obecnie równie ważna kwestia.

Według producenta, ogromna przewaga Xeona Phi nad konkurencyjnym rozwiązaniami wynika z możliwości zastosowania znanego modelu programowania i braku konieczności zmuszania doświadczonych programistów do uczenia się od podstaw takich technologii jak CUDA czy OpenCL. Architekturę MIC można programować tak jak każdą inną korzystającą z zestawu rozkazów x86, co ma nie tylko przyspieszyć proces tworzenia oprogramowania, ale także pozwolić na uruchamianie aplikacji przygotowanych wcześniej dla standardowych procesorów.

Intel podkreśla, że dzięki Phi, najszybsze superkomputery cały czas będą mogły wykorzystywać jednolitą architekturę – tak jak czwarty w rankingu Top500 niemiecki SuperMUC, najpotężniejszy superkomputer w Europie, który opiera się jedynie na procesorach Intela. Co ciekawe, klaster obliczeniowy złożony z koprocesorów Phi i 8-rdzeniowych procesorów Xeon E5 już działa – znajduje się w komputerze Discovery, zajmującym 150 miejsce w rankingu Top500.

Chociaż na pełnoprawną kartę graficzną ze stajni Intela nie ma co liczyć, praca inżynierów pracujących przy "Larrabee" nie poszła jak widać na marne. Procesorowy gigant wkracza z obiecującym produktem na segment rynku, który producenci GPU zdawali się mieć już w kieszeni. Konkurencja napędza postęp, a skoro Nvidia i AMD zostaną zmuszone do poprawy wydajności swoich układów przeznaczonych na rynek profesjonalny, nie przejdzie to bez echa w segmencie kart graficznych. W końcu chipy są te same, niezależnie od tego, czy służą do renderowania scen gier w domowych PC-tach, czy do wykonywania o wiele bardziej poważnych zadań w superkomputerach.

Źródła: Intel, Anandtech, HPCWire

gotrunksZobacz profil
Poziom ostrzeżenia: 0%
gotrunks2012.06.20, 23:04
-10#1
Hmm czyli to jakby nie karta graficzna tylko dodatkowe procesory na karcie PCIE? taka ciekawostka raczej...
sesefZobacz profil
Poziom ostrzeżenia: 0%
sesef2012.06.20, 23:09
Niby x86, ale i tak trzeba będzie stosować techniki programowania równoległego, żeby zapełnić te rdzenie, więc OpenCL jest tutaj jak najbardziej na miejscu bo zapewni łatwy sposób zapełnienia tych rdzeni. Jedyny plus będzie dla programów które nie używają OpenCL a obsługują wielowątkowość.
AmitozaZobacz profil
Poziom ostrzeżenia: 0%
Amitoza2012.06.20, 23:10
12#3
'Teoretyczna wydajność Xeona Phi w operacjach na liczbach zmiennoprzecinkowych podwójnej precyzji wynosi 1 teraflops, czyli tyle samo, ile zapewnia najnowsza karta AMD z rodziny FirePro – oparty na dwóch procesorach Tahiti model W9000'

skoro jeden thaiti ma 950Gflops w DP, to w jaki sposób W9000 złożony z 2 takich GPU i to ponoć taktowanych zegarem 1Ghz ma... tyle samo praktycznie? Więc nie 1, a 2 Tflops.
AmitozaZobacz profil
Poziom ostrzeżenia: 0%
Amitoza2012.06.20, 23:12
-3#4
sesef @ 2012.06.20 23:09  Post: 579626
Niby x86, ale i tak trzeba będzie stosować techniki programowania równoległego, żeby zapełnić te rdzenie, więc OpenCL jest tutaj jak najbardziej na miejscu bo zapewni łatwy sposób zapełnienia tych rdzeni. Jedyny plus będzie dla programów które nie używają OpenCL a obsługują wielowątkowość.

a jaki soft serwerowy działa w open cl?
szmonZobacz profil
Poziom ostrzeżenia: 0%
szmon2012.06.20, 23:22
-12#5
sesef @ 2012.06.20 23:09  Post: 579626
Niby x86, ale i tak trzeba będzie stosować techniki programowania równoległego, żeby zapełnić te rdzenie, więc OpenCL jest tutaj jak najbardziej na miejscu bo zapewni łatwy sposób zapełnienia tych rdzeni. Jedyny plus będzie dla programów które nie używają OpenCL a obsługują wielowątkowość.


Przecież masz napisane:

Według producenta, ogromna przewaga Xeona Phi nad konkurencyjnym rozwiązaniami wynika z możliwości zastosowania znanego modelu programowania i braku konieczności zmuszania doświadczonych programistów do uczenia się od podstaw takich technologii jak CUDA czy OpenCL. Architekturę MIC można programować tak jak każdą inną korzystającą z zestawu rozkazów x86, co ma nie tylko przyspieszyć proces tworzenia oprogramowania, ale także pozwolić na uruchamianie aplikacji przygotowanych wcześniej dla standardowych procesorów.
.

Nie ma ani słowa o generowaniu obrazu przez tą kartę, ale skoro stawia się ją obok firelame to chyba generuje obraz? W końcu AMD nie ma karty do obliczeń.

Intel podkreśla, że dzięki Phi, najszybsze superkomputery cały czas będą mogły wykorzystywać jednolitą architekturę – tak jak czwarty w rankingu Top500 niemiecki SuperMUC, najpotężniejszy superkomputer w Europie, który opiera się jedynie na procesorach Intela. Co ciekawe, klaster obliczeniowy złożony z koprocesorów Phi i 8-rdzeniowych procesorów Xeon E5 już działa – znajduje się w komputerze Discovery, zajmującym 150 miejsce w rankingu Top500.


To w końcu z czym to ma konkurować? Z NVIDIA Tesla czy może Quadro i FireLame? Między kartami do grania, profesjonalnymi i kartami do obliczeń są pewne różnice. A może to tylko dodatkowy procek na pcie?
SunTzuZobacz profil
Poziom ostrzeżenia: 0%
SunTzu2012.06.20, 23:28
11#6
Amitoza @ 2012.06.20 23:12  Post: 579628
sesef @ 2012.06.20 23:09  Post: 579626
Niby x86, ale i tak trzeba będzie stosować techniki programowania równoległego, żeby zapełnić te rdzenie, więc OpenCL jest tutaj jak najbardziej na miejscu bo zapewni łatwy sposób zapełnienia tych rdzeni. Jedyny plus będzie dla programów które nie używają OpenCL a obsługują wielowątkowość.

a jaki soft serwerowy działa w open cl?

Wszelkie serwery renderujące, jak mnie pamięć nie myli np. Indygo
AssassinZobacz profil
Poziom ostrzeżenia: 0%
Assassin2012.06.20, 23:29
@Amitoza
Chodzi zapewne o kartę AMD z 1 GPU. Na tej samej konferencji, na której podali specyfikację W9000, pokazali fizyczny egzemplarz (albo makietę) karty 2-procesorowej. Stąd prawdopodobnie to przekłamanie.
aqvarioZobacz profil
Poziom ostrzeżenia: 0%
aqvario2012.06.21, 00:29
Jeśli te rdzenie x86 będą zawierały wszystkie obecne instrukcje, włącznie z SSEx i całą resztą (jak AES), to zdaje się, że zainteresowanie może być całkiem spore. Bardzo dużo zależy od realizacji sprzętowej + oprogramowanie. Czy taki linux/windows nagle zobaczą, że mają 2 procesory na pokładzie, jeden 4 rdzeniowy, a drugi 50 rdzeniowy? Jeśli tak to mogłoby wyglądać, to rewelka. I w czym te procesory będą gorsze od tych montowanych na płytach głównych? Cache? Skądś musi wynikać te 50 rdzeni na małej powierzchni i czemu Phi nie mógłby zastąpić normalnych procesorów.
szefonsZobacz profil
Poziom ostrzeżenia: 0%
szefons2012.06.21, 01:57
-7#9
aqvario @ 2012.06.21 00:29  Post: 579641

O czym ty piszesz?
kasdejaZobacz profil
Poziom ostrzeżenia: 0%
kasdeja2012.06.21, 02:02
xeon phi to 50 x 64-bitowy wariant Pentium I z dołożoną potężną jednostką wektorową

jako firmware na tym będzie pracował Linux, o windows pewnie można zapomnieć
raczej jeden system nie będzie widział naraz rdzeni xeona phi i procesora głównego (choć z czasem może i do tego dojdzie, ale modyfikacje w systemie operacyjnym musiałby być dość poważne)

http://software.intel.com/en-us/blogs/2012...ecture-support/
http://software.intel.com/en-us/blogs/2012...software-stack/
Zaloguj się, by móc komentować
1