Internet i sieci
Artykuł
Mateusz Brzostek, Czwartek, 21 sierpnia 2014, 10:00

AMD chce się na poważnie przyłączyć do rewolucji w świecie serwerów, która w bliskiej przyszłości wypchnie z niektórych zastosowań tradycyjne maszyny z dużymi i wydajnymi procesorami. Od niedawna partnerzy firmy mogą kupować serwerowy czip AMD w architekturze ARM: Opteron A1100, znany wcześniej pod nazwą roboczą Seattle. Dostępny jest też gotowy zestaw deweloperski z tym układem. Co ma w środku taki procesor? Na niedawnej konferencji Hot Chips 2014 ujawniono szczegóły jego budowy.

Dziesięć ARM-ów w ośmiordzeniowym układzie

Każdy SoC to kombinacja częściowo samodzielnych elementów logicznych. Jakie wchodzą w skład Seattle?

Osiem razy Cortex A57

Seattle ma osiem procesorów ogólnego przeznaczenia ARM Cortex A57. Cortex A57 to wydajniejszy z dwóch przygotowanych przez ARM rdzeni zgodnych ze stosunkowo nową 64-bitową architekturą ARMv8-A.

Do tej pory 64-bitową architekturę ARM zaimplementowały tylko Apple (A7 w iPhonie 5S), Nvidia (jedna z wersji Tegry K1) i dwie serwerowe firmy: X-Gene i Cavium (ThunderX), ale wszystkie one zaprojektowały własne rdzenie zgodne z tą mikroarchitekturą. ARM-owy Cortex A57 został pierwszy raz wykorzystany właśnie przez AMD w Seattle, a wkrótce ma trafić do najwydajniejszych Snapdragonów Qualcomma i rosyjskiego procesora Bajkał. To duży i stosunkowo wydajny rdzeń, dlatego w jednym SoC-u takich rdzeni jest tylko 8 (inaczej niż w procesorach Cavium, w których ich liczba to 24 lub 48). Rdzenie A57 są pogrupowane w pary ze wspólnym 1-megabajtowym blokiem pamięci podręcznej L2.

Koprocesor kryptograficzny – CCP

Oprócz ośmiu uniwersalnych rdzeni Seattle ma dwie inne maszyny obliczeniowe. Pierwsza to CCP – Cryptographic Coprocessor. To akcelerator wszelkiego rodzaju funkcji szyfrowania; przyspiesza sprzętowo szyfrowanie AES, SHA, RSA, ECC i inne popularne protokoły. CCP korzysta z wbudowanego sprzętowego generatora liczb losowych, ale inaczej niż procesory Ivy Bridge i Haswell Intela. W nowych Intelach sprzętowy generator służy tylko do inicjowania programowego generatora, zatem ciągi kolejnych liczb nie są od siebie zupełnie niezależne. CCP w Seattle generuje liczby prawdziwie losowe, zapewne ze znacznie niższą wydajnością (nie podano szczegółów). Usługi koprocesora są dostępne dla ośmiu uniwersalnych rdzeni.

SCP – jeden ARM, by wszystkimi rządzić

Ostatnia maszyna obliczeniowa nie jest koprocesorem, bo jest nadrzędna w stosunku do pozostałych: nie współpracuje z nimi, ale zarządza ich pracą. SCP (System Control Processor) to niemal oddzielny mały komputer: ma prosty rdzeń Cortex A5, trochę pamięci na własny użytek, interfejsy łączące z resztą podsystemów. Po włączeniu maszyny z procesorem Seattle najpierw budzi się sam SCP; pracuje pod kontrolą własnego wewnętrznego oprogramowania (to mały system operacyjny czasu rzeczywistego), konfiguruje resztę systemu i dopiero potem przekazuje sterowanie do UEFI i właściwego systemu operacyjnego. W trakcie pracy system operacyjny wysokiego poziomu widzi tylko osiem rdzeni ogólnego przeznaczenia, a SCP zachowuje się jak urządzenie peryferyjne. SCP kontroluje przestrzeń adresową i zasoby wejścia-wyjścia i pilnuje podziału na strefę bezpieczną (w której wykonywany jest tylko zaufany kod) i niebezpieczną. Wspólnie z koprocesorem kryptograficznym zapewnia to zgodność z techniką TrustZone, obecną we wszystkich nowoczesnych procesorach ARM. SCP zarządza też taktowaniem i funkcjami oszczędzania energii.

Spójne pamięci podręczne i magistrala AMBA

Wszystkie rdzenie oraz kontrolery pamięci, PCI Express i sieci są połączone standardową w świecie ARM magistralą AMBA i wspólną pamięcią podręczną L3 o pojemności 8 MB. Magistrala zachowuje spójność pamięci podręcznych, co znaczy, że wszystkie procesory widzą zawsze aktualną zawartość pamięci.

Kontroler pamięci DDR3 i DDR4

Opteron A1100 ma dwa kanały pamięci, do których można podłączyć moduły DDR3 albo DDR4 (oczywiście, każda płyta główna obsługuje tylko jeden z dwóch rodzajów pamięci). Zestaw testowy oferowany obecnie przez AMD ma gniazda DDR3 i pozwala zainstalować do 128 GB RAM-u.

Peryferia: sieć, dyski, PCI Express

Seattle przeznaczono do zadań wymagających stosunkowo dużo danych i stosunkowo niewielu obliczeń, zatem musi mieć odpowiednio bogaty zestaw łączy peryferyjnych. Bezpośrednio w SoC wbudowano dwa kontrolery 10-gigabitowego Ethernetu oraz osiem portów SATA. Dodatkowo można rozbudować interfejsy sieciowe, dyskowe albo bardziej egzotyczne peryferia dzięki dwóm kontrolerom PCI Express, udostępniającym łącznie osiem linii (w ramach jednego portu lub dwóch portów po cztery linie). Dzięki SCP dostępna jest też gama interfejsów debugowania, portów szeregowych i wejść-wyjść ogólnego przeznaczenia.

Fabrykacja

Opterony A1100 są produkowane przez GlobalFoundries w procesie technologicznym 28 nm, tym samym co APU Kaveri. Cały SoC jest mały (27 mm × 27 mm) i dostępny tylko w obudowie BGA, do przylutowania bezpośrednio na płytę. Najdziwniejszy jest brak zewnętrznego łącza do innych podobnych procesorów. AMD ma przecież bardzo wydajną magistralę Freedom Fabric, opracowaną kiedyś przez SeaMicro z myślą o mikroserwerach, a Seattle aż się prosi o zbudowanie maszyny z kilkoma lub kilkunastoma takimi procesorami i ogromną ilością pamięci operacyjnej.

Brakuje też obsługi HSA, co nie dziwi, bo Seattle ma tylko jeden rodzaj uniwersalnych maszyn obliczeniowych.

Ocena artykułu:
Ocen: 5
Zaloguj się, by móc oceniać
Trismegistos (2014.08.21, 10:07)
Ocena: 7

0%
Cytuje z tekstu 'Magistrala zachowuje spójność pamięci podręcznych, co znaczy, że wszystkie procesory widzą w tym samym momencie tę samą zawartość pamięci.'

Nie jest to prawdą. Już procesory x86 nie są 'sequentialy consistent', a tym bardziej ARM ze słabyszm modelem pamięci. Sugeruję usunąć ten fragment tekstu.
SunTzu (2014.08.21, 10:14)
Ocena: 2

0%
Z tego wszystkiego pomijając, że super info najbardziej zaciekawiła mnie informacja, że ' Microsoft zamierza zaoferować ARM-ową odmianę Windows Server.'... oby nie był to Win RT bis...
Może MS nie odpuszcza ARM-a i za jakiś czas zrobi mocne uderzenie i do desktopów, a wtedy AMD będzie mogło być w uprzywilejowanej pozycji jako dostawce układów ARM/x86.

SCP bardzo ciekawie wygląda.
Edytowane przez autora (2014.08.21, 10:17)
anemus (2014.08.21, 11:15)
Ocena: -3

0%
Żadna rewolucja i arm pcha się nie na miejsce x86 ale procków transakcyjnych tyle, że to bez sensu bo arm pod żadnym względem się do tego nie nadaje, łącznie z wydajnością/wat, która przy działaniu wszystkich jednostek wykonawczych pod maksymalnym obciążeniem równocześnie w arm kuleje. To wyłącznie moda mogąc obronić się ceną ale to źle wróży AMD w każdym wariancie. Tak czy siak długo nie pociągną. Intel tam również się wcisnął psim swędem i jak widać nie bardzo zagrzał miejsce.
Edytowane przez autora (2014.08.21, 11:26)
Stjepan (2014.08.21, 11:16)
Ocena: 13

0%
Dobrze że coś robią, farma takich procesorów ma swoje zastosowania np w Data Center i biorą one małe ilości prądu.
mbrzostek (2014.08.21, 11:28)

0%
Trismegistos @ 2014.08.21 10:07  Post: 776931
Nie jest to prawdą. Już procesory x86 nie są 'sequentialy consistent'

To chyba rozsądne uproszczenie. To nie miejsce i czas, żeby wyjaśniać problem spójności pamięci w szczegółach.
mikilys (2014.08.21, 11:41)
Ocena: 6

0%
ARM i x86 w duecie... To mnie najbardziej ciekawi :)
Ale to i tak dość ciekawe rozwiązania, z którego wielu domowników korzysta w swoich NASach. Brakuje faktycznie solidnego komercyjnego Windowsa :E który da radę zutylizować procesor.
Zaloguj się, by móc komentować
Artykuły spokrewnione
Facebook