aktualności

Rycerski układ Intela – wygląda jak karta graficzna, ale nią nie jest. Nowe szczegóły na temat spadkobiercy Larrabee

35 11 sierpnia 2010, 11:02 Eryk Napierała
Mogłoby się wydawać, że Larrabee – projekt Intela mający rozpocząć totalną rewolucję wśród układów graficznych, okazał się kompletną klapą  po zarzuceniu ze względu, między innymi, na zbyt małą optymalzację technologii i pobór prądu. Doczekał się jednak następcy, który może nie będzie dosłownie kontynuował jego idei, jednak garściami czerpie z rozwiązań opracowanych podczas wdrażania architektury x86 do segmentu układów graficznych. Tak jak poprzednik ma stanowić konkurencję dla urządzeń AMD i NVIDII. Jednak na nieco innym polu.

Pierwsze wieści o planowanej przez Intela kontynuacji zarzuconego projektu Larrabee pojawiły już ponad dwa miesiące temu. Dopiero jednak teraz znane są szczegóły techniczne dotyczące nowego układu, którego nazwa kodowa brzmi "Knights Ferry". Jak się okazuje, nie będzie to wcale karta graficzna, którą miało być Larrabee. Można powiedzieć raczej "układ przetwarzania równoległego".

Knights Ferry nie będzie wyposażony w specyficzne dla układów graficznych jednostki cieniowania, teksturowania, czy renderujące. Ma on służyć przede wszystkim nie generowaniu grafiki lecz wykonywaniu obliczeń równoległych, podobnie jak robią to procesory CUDA w kartach graficznych NVIDII. Te jednak wymagają wdrożenia niestandardowego, przez wielu programistów uważanego za trudny w zaimplementowaniu modelu aplikacji.

Knights Ferry ma niwelować ten problem, gdyż zbudowany został z wykorzystaniem tradycyjnych procesorów x86 i umożliwiać stosowanie bardziej tradycyjnego systemu wątków. Układ zawiera 32 rdzenie, każdy taktowany zegarem 1,2 GHz (procesory CUDA w rdzeniu Fermi – 1,4 GHz) i wyposażony w 64 kB pamięci podręcznej pierwszego poziomu i 8 MB drugiego współdzielonej przez całość. Nie można tu do końca mówić o 32 osobnych procesorach, ani o jednym procesorze 32-rdzeniowym, wewnętrzne połączenia zrealizowano nieco inaczej niż w jednostkach wielordzeniowych przeznaczonych na przykład dla komputerów PC. Każdy z rdzeni zawiera ponadto 512-bitową jednostkę wektorową, umożliwiającą dokonywanie 4-krotnie większej ilości obliczeń w jednym czasie niż obecne procesory x86, a w dodatku może przetwarzać jednocześnie cztery wątki na raz (4-way Hyper-Threading). Daje to w sumie 128 zadań wykonywanych w jednym czasie. Całość współpracuje z szybką pamięcią GDDR5 o pojemności do 2 GB.

Knights Ferry jest częścią większego projektu Intela – Many Integrated Core, czyli MIC (wymawiane jak "Mike" ~ "majk"). W jego ramach powstać ma również inna jednostka, znana jak na razie pod kodową nazwą Knights Corner. Ma być ona rozwinięciem Knights Ferry i składać się z 50 rdzeni wykonanych w procesie technologicznym 22 nm. Jak na razie w pierwszym projekcie wykorzystywane są procesory 45-nanometrowe. Biorąc pod uwagę, że pierwsze procesory Sandy Bridge wykorzystujące proces 22 nm planowane są na rok 2012, Knights Corner okazuje się urządzeniem, które konkurować będzie z przyszłymi układami AMD i NVIDII. Ferry ma pojawić się jako produkt finalny "już niebawem" i stanowić alternatywę dla obecnych kart Tesla i FireStream.

Mimo pozorów, to NIE JEST karta graficzna Intela :-)
marcelo92Zobacz profil
Poziom ostrzeżenia: 0%
marcelo922010.08.11, 11:13
-12#1
czyli to dołączam do swojego radeona 5850 i ona mi liczy te cuda co nvidia też oblicza......ciekawy pomysł nie trzeba kupywac płyty głównej Hydra
marcelo92Zobacz profil
Poziom ostrzeżenia: 0%
marcelo922010.08.11, 11:14
czyli to dołączam do swojego radeona 5850 i ona mi liczy te cuda co nvidia też oblicza......ciekawy pomysł nie trzeba kupywac płyty głównej Hydra
Promilus1984Zobacz profil
Poziom ostrzeżenia: 0%
Promilus19842010.08.11, 11:14
Czy ja wiem czy Knights Ferry implementuje 128 albo 256 bitowe typy zmiennych...chyba że PACKED, ale to jest zupełnie inna sprawa i nie ma nic wspólnego z precyzją ;)
Promilus1984Zobacz profil
Poziom ostrzeżenia: 0%
Promilus19842010.08.11, 11:14
double...
agent_x007Zobacz profil
Poziom ostrzeżenia: 0%
agent_x0072010.08.11, 11:21
12#5
To NIE JEST karta graficzna i nie służy do grania. (CUDA, PhysX, Stream nie będą na niej działać, ponieważ nie są robione pod grafy obsługujące x86)

Jej zadaniem jest możliwość umieszczenia we współczesnych komputerach mocy obliczeniowej klastra serwerowni. Dlaczego ?
Badania naukowe, ray tracing, itp. wymagają ogromnych mocy obliczeniowych, a z powodu coraz większej liczby aplikacji wykorzystujących wiele rdzeni Intel postanowił pójść w ślady Nvidii, która z powodzeniem wykorzystuje swoje grafy i oprogramowanie w tych segmentach przy okazji stanowiąc coraz większą konkurencję dla firmy Intel.
Po co kupować drogie podzespoły serwerowe od Intela skoro np. taki GTX280 ma kilkukrotnie (lub więcej - zależy od zastosowania) większą moc obliczeniową, zajmuje mniej miejsca i pobiera mniej energii ?
Problemem z grafą jest jednak jej interfejs programowy.
W przypadku 'grafy' z x86 takiego problemu nie ma.
KwantZobacz profil
Poziom ostrzeżenia: 0%
Kwant2010.08.11, 11:34
agent_x007 @ 2010.08.11 11:21  Post: 401556
To NIE JEST karta graficzna i nie służy do grania. (CUDA, PhysX, Stream nie będą na niej działać, ponieważ nie są robione pod grafy obsługujące x86)

Jej zadaniem jest możliwość umieszczenia we współczesnych komputerach mocy obliczeniowej klastra serwerowni. Dlaczego ?
Badania naukowe, ray tracing, itp. wymagają ogromnych mocy obliczeniowych, a z powodu coraz większej liczby aplikacji wykorzystujących wiele rdzeni Intel postanowił pójść w ślady Nvidii, która z powodzeniem wykorzystuje swoje karty w tych segmentach stanowiąc coraz większą konkurencję dla Intela.
Po co kupować drogie podzespoły serwerowe od Intela skoro np. taki GTX280 ma kilkukrotnie (lub więcej - zależy od zastosowania) większą moc obliczeniową, zajmuje mniej miejsca i pobiera mniej energii ?
Problemem z grafą jest jednak jej interfejs programowy.
W przypadku grafy x86 takiego problemu nie ma.


CUDA nie, PhysX nie był celem tej karty, Stream - a kto tego używa? Za to powinni (i mogą) zrobić port OpenCL, który staje się standardem do ciężkich i równoległych obliczeń numerycznych.
*Konto usunięte*2010.08.11, 11:39
Klaster obliczeniowy... czyli innymi słowy na tym cacku mogę obliczyć 1200 pozycję w ciągu Fibonacciego metoda rekurencyjną ? :E
scoobydoo19911Zobacz profil
Poziom ostrzeżenia: 0%
scoobydoo199112010.08.11, 11:44
-12#8
Yurciu @ 2010.08.11 11:39  Post: 401561
Klaster obliczeniowy... czyli innymi słowy na tym cacku mogę obliczyć 1200 pozycję w ciągu Fibonacciego metoda rekurencyjną ? :E

a po polsku mógłbyś
*Konto usunięte*2010.08.11, 11:47
-1#9
scoobydoo19911 @ 2010.08.11 11:44  Post: 401563

a po polsku mógłbyś


To jest po polsku, tylko slang informatyczny :E
SunTzuZobacz profil
Poziom ostrzeżenia: 0%
SunTzu2010.08.11, 11:51
O boshe...
Układ zawiera 32 rdzenie, każdy taktowany zegarem 1,2 GHz (procesory CUDA w rdzeniu Fermi – 1,4 GHz)
A NV ma 480 procesorów CUDA (vs 32) to już nie ma znaczenia .

-------------------------------
Jeżeli projekt wyjdzie.... To monstrum może być wykorzystywane do renderingu :)..... Jednak nie wiem czy będzie szybsze od GPU przyszłych generacji. Załóżmy, że to powstanie i będzie szybkie.... Czy taka specyfikacja będzie wstanie zrównać się z rozwiązaniami oparte o OpenCL na przyszłych radeonach?

Ok 50 rdzeni.... każdy będzie wykorzystywany w 100% dzięki 4-HT. Dla porównania 5870 ma ich 320 (5/cyskl=1600), NV w fermi ma ich 512 (teoretycznie i zegar jest tu podbity x2).... Zatem o wiele więcej mamy tu procesorów, które będą pracować. W praktyce jak wiemy wszystko zależy od aplikacji. Różnice są tak wielkie, że nie można porównywać ze sobą tych rozwiązań.

Rozwiązanie Intela ma sens.... wszystko zależy jednak od rozwiązania tego jak aplikacje będą korzystały z ukrytej mocy.
Zaloguj się, by móc komentować
1