artykuły

IBM POWER9 – krótka historia architektury i anatomia najnowszych procesorów serwerowych

53
26 września 2019, 11:09 Mateusz Brzostek

Trzy warianty pamięci RAM

Trzy wersje POWER9 mają trzy różne sposoby podłączenia pamięci.

Najtańsze i najprostsze procesory, wersja SO, pozwala podłączyć zwyczajne moduły DIMM – jeden kanał pamięci DDR4 ma szerokość 72 bitów (64b + 16b na sumy kontrolne ECC) i wymaga elektrycznego interfejsu zajmującego stosunkowo dużą powierzchnię w jądrze procesora. Żeby zapewnić bardzo wysoką przepustowość RAM-u, POWER9 SO ma 8-kanałowy kontroler pamięci. W każdym kanale można zainstalować maksymalnie 2 moduły UDIMM, RDIMM lub LRDIMM. Ten rodzaj podsystemu pamięci jest najtańszy (bo można wykorzystać proste w budowie i produkowane masowo moduły), ale najbardziej ograniczony – można wykorzystać tylko pamięć DDR4, a maksymalna pojemność jest ograniczona przez gęstość dostępnych na rynku modułów.

Procesory w wersji SU wykorzystują szybsze łącze i osobne układy scalone pełniące funkcję bufora. Do procesora jest podłączony produkowany przez IBM bufor Centaur; dopiero do niego jest podłączona pamięć DDR4, w formie zwykłych modułów DIMM, albo bezpośrednio, na tej samej płytce. 

IBM Centaur DIMM – moduł pamięci buforowanej dla procesorów IBM

DIMM z buforem Centaur do procesorów POWER8 i POWER9 SU

Buforowany podsystem pamięci może mieć większą pojemność i prawie dwukrotnie większą przepustowość, niż zwykła magistrala DDR4, ale powoduje nieco większe opóźnienie w dostępie do pamięci: bufor dodaje ok. 10 ns opóźnienia w skali 100-200 ns. Można również zbudować nowy rodzaj bufora, który po stronie pamięci miałby inny kontroler, niż zgodny z DDR4 – to by pozwoliło na wykorzystanie innego rodzaju pamięci, na przykład nieulotnej pamięci rezystywnej. Dotychczas jednak IBM nie oferuje innych buforów niż zgodnych z DDR4.

Najnowsza wersja POWER9 AIO wykorzystuje interfejs szeregowy o bardzo szybkim sygnałowaniu jako łącze OMI (Open Memory Interface), zaproponowane przez IBM do standardyzacji przez JEDEC. Standard OMI jest otwarty i może być wykorzystany przez różne firmy, choć do tej pory współpracują nad nim tylko IBM (procesory), Microchip (kontrolery pamięci), Samsung, Micron i SMART Modular (moduły pamięci OMI).

OMI jest pochodną łącza OpenCAPI; ma szerokość 8 bitów i może mieć różne prędkości sygnałowania. Na drugim końcu łącza OMI znajduje się kontroler pamięci, który pełni rolę bufora i odizolowuje procesor od typu pamięci wykorzystanej w module OMI.

Moduł OMI DDR4 z kontrolerem Microchip SMC 1000

Moduły OMI są mniejsze niż standardowe moduły DIMM lub buforowane moduły Centaur DIMM. Można na nich zamontować dowolny rodzaj pamięci – na razie zademonstrowano tylko DDR4, ale w przyszłości może się pojawić pamięć DDR5 lub jakiś rodzaj pamięci nieulotnej. Dostęp do pamięci OMI wiąże się z nieco większym opóźnieniem, niż do DDR4, ale to mniej niż dodatkowe 5 ns (w porównaniu do 10 ns przez bufor Centaur).

Oprócz uniwersalności i przepustowości wielką zaletą OMI w procesorach POWER9 jest niewielka powierzchnia, jaką zajmuje interfejs szeregowy na jądrze procesora. IBM podaje, że w tej samej powierzchni, co jednokanałowy intefejs DDR4 można zmieścić łącza buforowanej pamięci o trzykrotnie większej przepustowości lub łącza OMI o sześciokrotnie większej przepustowości. Dzięki temu można zaoszczędzoną powierzchnię przeznaczyć na więcej interfejsów I/O, i można wykorzystać o jeden rodzaj interfejsów mniej (OMI używa tych samych transmiterów, co łącza do akceleratorów). 

Fabrykacja: SOI, mnóstwo połączeń i pamięć podręczna EDRAM 

IBM historycznie wykorzystywało zawsze bardzo zaawansowane procesy produkcyjne i było skłonne do inwestowania w techniki, których nie opłaca się wykorzystywać w procesorach konsumenckich. W procesorach POWER9 rolę pamięci podręcznej L3 pełni EDRAM, czyli pamięć przechowująca dane w postaci ładunku elektrycznego w kondensatorze, a nie w postaci stanu przerzutnika zbudowanego z samych tranzystorów. EDRAM jest nieco gęstsza niż SRAM, ale jest trudniejsza w produkcji, bo trzeba wytrawić w krzemie głębokie kanały służące jako okładziny kondesatora.

Procesory POWER9 są produkowane na waflach krzemowych SOI, czyli pokrytych cienką warstwą krystalicznego krzemu odizolowanego od całej objętości wafla cienką warstwą tlenku krzemu. Wafle SOI są droższe od wafli bulk (jednolitych), ale pozwalają ograniczyć upływ prądu z tranzystora do podłoża, bo podłoże jest bardzo cienkie i odizolowane od większości objętości krzemu. Parę lat temu SOI i FinFET (tranzystory z trójstronną bramką) były widziane jako dwie konkurencyjne techniki ograniczenia upływu – IBM wykorzystuje je obie.

Ogromna pamięć podręczna i przepustowość interfejsów I/O wymagają bardzo wysokiej przepustowości łącz węwnątrz procesora, pomiędzy rdzeniami, pamięcią podręczną i kontrolerami IO. Wysokoprzepustowe łącza wymagają wielu przewodów, dlatego IBM wykorzystuje więcej warstw metalowych połączeń nad warstwą tranzystorów, niż inni producenci. Proste układy scalone mają maksymalnie kilka warstw metalowych, serwerowe procesory Intela i AMD mają 10-12 warstw połączeń, a IBM POWER9 – 17 warstw. To ułatwia poprowadzenie odpowiednio wielu połączeń, a przy okazji ułatwia synchronizację odległych od siebie segmentów rdzenia i osiągnięcie szybkiego taktowania.

Przyszłość Power

W 2021 roku IBM zamierza rozpocząć sprzedaż kolejnej generacji procesorów: POWER10. Mają mieć nową mikroarchitekturę, dwukrotnie szybsze interfejsy IO i podsystem pamięci wykorzystujący łącza OMI. Będą wykonane w procesie technologicznym klasy 7 nm w fabrykach Samsunga w Korei. Spodziewamy się, że nowe procesory POWER znajdą zastosowanie w jednym z jeszcze nie zapowiedzianych, ale już przygotowywanych superkomputerów w Stanach Zjednoczonych.

Otwarcie architektury Power ISA może mieć ważne skutki, ale zobaczymy je najwcześniej za kilka lat. Power ISA i RISC-V to już dwie opcje umożliwiające zbudowanie całkowicie przejrzystych, audytowalnych procesorów klasy serwerowej, w których na pewno nie ukryto niepożądanych funkcji, i które nie będą obciążone ograniczeniami licencyjnymi, patentowymi i eksportowymi. Zgodność z istniejącym oprogramowaniem i historyczne powodzenie w świecie wielkich obliczeń mogą spowodować, że Power ISA będzie dla firm spoza USA atrakcyjniejsza niż RISC-V lub własne architektury.

Strona:
krzyyssZobacz profil
Poziom ostrzeżenia: 0%
krzyyss2019.09.26, 11:40
13#1
Fajnie coś poczytać, z trudniejszej tematyki, ale napisane lżejszym językiem.

Dopiszę ciekawostkę. Ta przegrana Kasparowa nie była taka oczywista. Algorytmy szachowe świetnie liczą warianty na spore głębokości, do tego robią to bardzo dokładnie, można przyjąć, że nie przeoczą niczego (choć tu można pokazać, że szczególnie te starsze potrafiły przegapić sporo), ale słabiej radzą sobie z ofiarami pozycyjnymi. Znaczy z pozycjami, gdzie oddajemy materiał za inicjatywą/aktywność bierek. I Kasparow wiedząc o tym, poszedł w pozycję, gdzie miał gorszą, ale pod warunkiem, że komputer właśnie odda materiał za inicjatywę, czego akurat robić nie lubi. Opinia wielu (czołowych) szachistów jest taka, że Kasparow został tu oszukany, że była ingerencja człowieka w partią graną przez komputer. Dzisiaj co prawda to już nieco inna bajka, moc obliczeniowa komputerów i algorytmy szachowe na tyle dobre, że szachiści szans nie mają, ale ... stara przypadłość pozostała, komputery nadal słabiej radzą sobie w pozycjach, gdzie coś oddajemy za długotrwałą inicjatywę. A pozycje, gdzie jest przewaga materialna, potrafią pokazać jako wygrane (duża przewaga), gdzie średniej klasy szachista bez problemu utrzymuje remis.

edit
najprostszy przykład - 9 gońców jednego koloru, np białopolowe, po drugiej stronie goły król, pozycja poprawna szachowo. Silniki oceniają to jako wygraną (ogromna przewaga materialna), a tego nie da rady nijak nie tylko wygrać, ale nawet przegrać, gdyby druga strona nawet chciała się podkładać.
Edytowane przez autora (2019.09.26, 11:46)
nojeZobacz profil
Poziom ostrzeżenia: 0%
noje2019.09.26, 11:47
jestem z wami dla takich artykułów! super!
czolgista778Zobacz profil
Poziom ostrzeżenia: 0%
czolgista7782019.09.26, 12:55
IBM zawsze na propsie, firma legenda.
KenjiroZobacz profil
Poziom ostrzeżenia: 0%
Kenjiro2019.09.26, 13:09
Dałbym za ten artykuł 5 gwiazdek, ale zniknęły przy zmianie layoutu...
djryhardZobacz profil
Poziom ostrzeżenia: 0%
djryhard2019.09.26, 13:43
-19#5
Do liczenia 2+2 się nadaje bez problemu. Jeśli chodzi zaś o wygraną z Kasparowem to bajeczki można opowiadać internetowym Sebastianom znawcom IT. Polecam przeczytać pozycję 'Hello Word' - Hannah Fry. Pozycja która pięknie ośmieszą ten pseudo naukowy blekot o rzekomym powstawaniu sztucznej inteligencji i osiągnięciach cywilizacyjnych które zawdzięczamy komputerom. To fakt, od czasów ZX Spectrum komputery znacznie przyspieszyły w obliczeniach. Są natomiast tak samo głupie jak były 30 lat temu choć Google i reszta cwaniaków 'IT' będą wciskać ten kit do bólu. Zabawne artykuły tu dajecie, ale cóż Sebastiany kupią wszytko a ten portal stał się tylko pośmiewiskiem w dziedzinie szeroko rozumianego IT. Nowy właściciel, nowa polityka informacyjna dla lamerów komputerowych . Tak trzymać PClab ;-) ha ha ha
iwanmeZobacz profil
Poziom ostrzeżenia: 0%
iwanme2019.09.26, 14:00
To fakt, od czasów ZX Spectrum komputery znacznie przyspieszyły w obliczeniach. Są natomiast tak samo głupie jak były 30 lat temu choć Google i reszta cwaniaków 'IT' będą wciskać ten kit do bólu.

Nie są 'tak samo głupie', postęp w hardware jest ogromny i podobnie w stosowanych algorytmach. Powgryzaj się w uczenie maszynowe, mimo że to koncepty i algorytmy z poprzedniego wieku to dziś w powiązaniu z wydajnością obliczeń zdecydowanie komputery dają nowe możliwości. Popatrz sobie też jakie postępy robią firmy z komputerami kwantowymi.
Sztuczna inteligencja to nazwa marketingowa uczenia maszynowego, nikt poważny tu w najbliższym czasie nie przewiduje pojawienia się samodzielnej komputerowej osobowości .
122019.09.26, 15:02
djryhard @ 2019.09.26 13:43  Post: 1218460
Do liczenia 2+2 się nadaje bez problemu. Jeśli chodzi zaś o wygraną z Kasparowem to bajeczki można opowiadać internetowym Sebastianom znawcom IT. Polecam przeczytać pozycję 'Hello Word' - Hannah Fry. Pozycja która pięknie ośmieszą ten pseudo naukowy blekot o rzekomym powstawaniu sztucznej inteligencji i osiągnięciach cywilizacyjnych które zawdzięczamy komputerom. To fakt, od czasów ZX Spectrum komputery znacznie przyspieszyły w obliczeniach. Są natomiast tak samo głupie jak były 30 lat temu choć Google i reszta cwaniaków 'IT' będą wciskać ten kit do bólu. Zabawne artykuły tu dajecie, ale cóż Sebastiany kupią wszytko a ten portal stał się tylko pośmiewiskiem w dziedzinie szeroko rozumianego IT. Nowy właściciel, nowa polityka informacyjna dla lamerów komputerowych . Tak trzymać PClab ;-) ha ha ha

Widzisz drzewa, ale nie dostrzegasz lasu - taki masz problem. Samoświadomości nie da się zaprogramować bo nie wiemy jak to zrobić, jednak całe to maszynowe uczenie i inne SI bzdury rozwijane są po to aby tą samoświadomość odkryć. Najprędzej zrobi to maszyna (moc obliczeniowa), albo przypadkiem człowiek. Póki co ludzie tworzą różne algorytmy bo nie wiadomo, który z nich będzie punktem 'rozruchowym'. Wszyscy wielcy w tym siedzą bo ten kto to odkryje ten zawładnie światem, choćby gospodarczo.
Promilus1984Zobacz profil
Poziom ostrzeżenia: 0%
Promilus19842019.09.26, 15:07
@djryhard - no tak, monitoring na skrzyżowaniach, który rozpoznaje twarze, rejestracje itp. itd. to nie jest postęp ;) Z pewnością 50 ludzi kukających do baz danych by to ogarnęło w czasie rzeczywistym... a nie, jednak nie ;)

A teraz odnośnie artykułu... niestety jest babol. IBM architekturę POWER opracował SAM! AIM (Apple, IBM, Motorola) nie opracowywały POWER, opracowały PowerPC czyli design procesora dla komputerów desktop opierający się w dużej mierze na POWER ISA od IBM. PowerPC to po prostu stworzony później 'fork' od POWER, miał celować w nieco inne obszary (i swego czasu dawał radę), a mianowicie laptopy, desktopy i embedded (panele operatorskie itp.)
Jedyna rzecz opracowana wspólnie dla PowerPC, która pojawiła się w POWER to AltiVec (co najciekawsze rozszerzenie to nie było implementowane w POWER tak wcześnie jak w PowerPC).
ashaegenZobacz profil
Poziom ostrzeżenia: 0%
ashaegen2019.09.26, 15:15
-1#9
Ciekawe jak wypada na tle x86 (Epyc/Xeon) w serwerowych zastosowaniach pod względem wydajności/W
mbrzostekZobacz profil
Poziom ostrzeżenia: 0%
Autor publikacjimbrzostek2019.09.26, 15:38
Promilus1984 @ 2019.09.26 15:07  Post: 1218475
IBM architekturę POWER opracował SAM!

Przecież dokładnie to jest napisane w drugim zdaniu artykułu. Nawet gdyby tylko oglądać obrazki, to diagram powinien to zasugerować.
Funkcja komentowania została wyłączona. Do dyskusji zapraszamy na forum.
4