aktualności

HotChips 2019: ARM prezentuje architekturę serwerowych procesorów Neoverse N1

20
20 sierpnia 2019, 08:02 Mateusz Brzostek

HotChips to coroczna konferencja organizowana przez IEEE (Instytut Inżynierów Elektryków i Elektroników) poświęcona postępowi w budowie mikroprocesorów i komputerów. Na tym sympozjum naukowcy i praktycy przedstawiają przedsięwzięcia badawcze oraz komercyjne mikroprocesory, zwykle po ich ukończeniu.

Jesteśmy na miejscu, na Uniwersytecie Stanforda w Kaliforni, i będziemy donosić o najważniejszych wiadomościach podanych w trakcie konferencji. Jej uczestnikami i sponsorami są między innymi AMD, ARM, Intel, Nvidia, RISC-V, Western Digital, Google, Huawei i Amazon. Niektóre prezentacje będą poświęcone maszynom obliczeniowym, o których już bardzo dużo wiemy i nie spodziewamy się dowiedzieć wiele nowego (AMD Zen 2, AMD Navi, Nvidia Turing, Intel Optane). Najbardziej obiecujące są prezentacje serwerowych akceleratorów SI (Intel przedstawi nadchodzące układy Nervana Spring Crest i Spring Hill, inne prezentacje przygotowują Facebook, Google, Huawei i Xilinx) oraz technik badawczych umożliwiających obliczenia w pamięci. Podczas przemówienia szefa TSMC dowiemy się też o przewidywanych przez tajwańską firmę fabrykacyjną postępach w litografii.

ARM Neoverse N1 – prawie gotowy przepis na procesory serwerowe

Jedną z pierwszych prezentacji poświęcono ARM Neoverse – to procesory i zestaw towarzyszących połączeń i układów do z architekturą ARMv8 przeznaczonych do wykorzystania w serwerach. Oczekiwane od lat serwery z ARM zamiast x86 zdobywają rynek bardzo powoli, mimo, że układy Marvell (wcześniej Cavium) ThunderX2, Huawei Kunpeng oraz nadchodzące procesory firmy Ampere mają wiele atrybutów pozwalających na budowę nowoczesnych, uniwersalnych serwerów. System oprogramowania i urządzeń dostosowanych do ARM dojrzewa, a jedną z najnowszych oznak tego jest niedawna zapowiedź, że Nvidia przygotuje swoje narzędzia programistyczne do akceleracji wielkich obliczeń przez GPU do architektury ARM.

Urządzenia z procesorami w architekturze ARM są ogromną częścią internetu, ale większość z nich jest „końcami” sieci – to smartfony, różne urządzenia z czujnikami lub aktuatorami, które dostarczają dane do sieci i wykonują proste działania, ale nie przetwarzają danych na dużą skalę tak jak serwery.

ARM ma aspiracje, żeby ich architektura stała się podstawą sporej części internetu, począwszy od niewielkich serwerów służących małej liczbie urządzeń „końcowych”, aż do serwerów w centrach danych zapewniających działanie różnych usług internetowych. Żeby przyspieszyć i ułatwić dojście do tego stanu, firma ARM przygotowuje procesor Neoverse N1, który inne firmy będą mogły licencjonować, dostosować do własnych potrzeb i zlecić fabrykację.

Rodzina Neoverse będzie rozwijana: w dalszych latach zostaną udostępnione procesory o nazwach roboczych Zeus i Poseidon, przeznaczone do wykonania w bardziej zaawansowanych procesach produkcyjnych. ARM liczy na to, że zamiast adaptować rdzenie Cortex (tak jak AMD w procesorach Opteron A1100) albo projektować własną architekturę (tak jak Cavium/Marvell, Ampere czy Qualcomm), firmy będą licencjonować architekturę Neoverse.

Serce chipu: rdzeń ARM lepszy niż Cortex-A72

Podstawą konstrukcji procesorów N1 ma być nowy rdzeń ARM, zaprojektowany specjalnie do zadań serwerowych. Jets kompatybilny z architekturą ARMv8.2 – ta wersja architektury została zaprojekotwana w 2016 roku, i choć zawiera ważne dla serwerów usprawnienia (funkcje RAS, wbudowane w procesor liczniki pozwalające na dokładne profilowanie wydajności, rozszerzenie SVE pozwalające na obliczenia wektorowe o różnej długości wektora), to w centrach danych przydałyby się usprawnienia z ARMv8.4 i v8.5 (m. in. dodatkowe zabezpieczenia pamięci przed wykonywaniem niepożądanego kodu, rozszerzenia kryptograficzne, generator liczb losowych).

Front-end rdzenia N1 pobiera, dekoduje i podaje dalej 4 instrukcje jednocześnie: tyle samo co Vulcan (Cavium), Falkor (Qualcomm), Cortex-A76 i A77, ale znacznie mniej, niż duże rdzenie ARM Samsunga i Apple. Pamięci podręczne L1D i L1I mają pojemność 64 kB; pamięć danych jest spójna pomiędzy wszystkimi rdzeniami w jednym procesorze i zabezpieczona przez mechanizm ECC.

Pamięć L2 ma pojemność 512 kB lub 1 MB, w zależności od konfiguracji. Ulepszone układy pobierania z wyprzedzeniem i zwiększona pojemność pamięci podręcznych L1 powodują, że N1 w popularnych zastosowaniach (podano przykład serwerowych aplikacji w Javie) musi sięgać do pamięci L2 o 2/3 rzadziej, niż Cortex-A72.

N1 pozwala na atomowe operacje na pamięci, co znacznie ułatwia programowanie komputerów z trwałą pamięcią RAM, taką jak Optane DC PMM albo moduły DIMM z pamięcią flash zamiast DRAM.

Wg ARM rdzeń N1 jest przy takim samym taktowaniu i procesie produkcji średnio o 85% wydajniejszy, niż Cortex-A72, i o 30% bardziej efektywny energetycznie. Efektywność energetyczna ma znaczenie, bo ten sam rdzeń ma być wykorzystany w procesorach o bardzo różnej liczbie rdzeni: od dwóch (do zastosowań najbliżej końcowych użytkowników lub podłączonych do sieci urządzeń) aż do 128 (do centrów danych). Rdzenie N1 są pogrupowane po 2 razem z 2 segmentami pamięci podręcznej L3 (nazwanej tutaj System Level Cache). Te grupy rdzeni i cache są połączone między sobą dwuwymiarową siecią o stosunkowo niskim opóźnieniu (1 przeskok – 1 cykl zegara). Podobnie jak w procesorach AMD Zen czy Intel Skylake, choć pamięć podręczna ostatniego poziomu jest pogrupowana razem z rdzeniami, cała jej pojemność jest wspólna dla całego chipu.

Firma ARM przygotowała testowy chip, złożony z 64 rdzeni N1, ze 128 liniami PCI-E 4.0 i 8-kanałowym kontrolerem pamięci. Wykonany w procesie technologicznym klasy 7 nm układ ma taktowanie 2,6 GHz i TDP 105 W, z czego rdzenie N1 nie konsumują więcej niż 70%. ARM będzie dostarczać klientom gotowy projekt rdzeni Neoverse, sieci łączącej rdzenie, kontrolera magistrali AMBA (służącej do podłączenia różnych koprocesorów w jednym jądrze do spójnej pamięci), koprocesora kryptograficznego oraz mikrokontrolera zarządzania zasilaniem i taktowaniem. Konfiguracja, dodanie kontrolerów I/O oraz fabrykacja będą w rękach licencjobiorców.

Gama procesorów ARM jest z założenia rozdrobniona. Firmy Cavium, Qualcomm i Ampere od dawna pracują nad dostosowaniem procesorów ARM do wymagań klientów serwerowych i wypromowaniem swoich produktów. Wydaje się, że wysiłki ARM nie mają szansy na zunifikowanie różnych serwerowych wcieleń architektury ARM. Sądzimy, że Neoverse pomoże raczej firmom zainteresowanym budową chipów z wbudowanymi własnymi, wyspecjalizowanymi koprocesorami albo interfejsami I/O. Szczególnie chińscy producenci nowatorskich chipów serwerowych, kiedy będą potrzebować podstawy do zbudowania dostosowanego do swoich potrzeb chipu, mogą spojrzeć w kierunku Neoverse zamiast RISC-V lub (jak do tej pory) rdzeni Cortex.

Jutro będziemy raportować z wystąpienia dr. Philipa Wonga, który jest w TSMC szefem badań nad perspektywami technologicznymi w litografii, a w kolejnych dniach podsumujemy tematycznie najważniejsze doniesienia przedstawione na HotChips. Pozostańcie na fali!

Źródło: Sympozjum HotChips 31
jakzniszczyczswiat.part2Zobacz profil
Poziom ostrzeżenia: 0%
jakzniszczyczswiat.part22019.08.20, 08:04
KOŃCAMI SIECI - KLĘKAJCIE NARODY ZA TO TŁUMACZENIE
KenjiroZobacz profil
Poziom ostrzeżenia: 0%
Kenjiro2019.08.20, 08:09
Chińczycy nie spojrzą już na ARM, gdyż sparzyli się przy ostatniej 'okazji'. RISC-V jest dla nich znacznie lepszą alternatywą i chociaż kosztuje opracowanie własnych układów, to zyskują pełną niezależność od fochów dzieci na rządowych stołkach.
CaroozoZobacz profil
Poziom ostrzeżenia: 0%
Caroozo2019.08.20, 08:12
Zobaczcie jak ARM się rozpasło przez te lata, kombinują jak wejść na rynek serwerów :). W mojej opinii jeśli firma/instytucja ma do wyboru ugruntowaną architekturę x86 która - mimo wszystko - jest dużo wydajniejsza od ARM, to woli na nią postawić. Oczywiście serwery na ARM znajdą swoje miejsce na rynku. Premiera Epyc 2 pozamiatała i tutaj trudno będzie się już 'wgryźć', bo to są naprawdę duże pieniądze i nie ma czasu na 'kombinowanie'. Mimo wszystko rozwój jest dobry dla wszystkich.
Adam524Zobacz profil
Poziom ostrzeżenia: 0%
Adam5242019.08.20, 09:14
Kenjiro @ 2019.08.20 08:09  Post: 1214864
Chińczycy nie spojrzą już na ARM, gdyż sparzyli się przy ostatniej 'okazji'. RISC-V jest dla nich znacznie lepszą alternatywą i chociaż kosztuje opracowanie własnych układów, to zyskują pełną niezależność od fochów dzieci na rządowych stołkach.

Chińczycy mieli już nie spojrzeć na androida ;) Zawsze mnie śmieszy kiedy ktoś broni taki kraj jak Chiny, to nie jest kraina miłych skośnookich 'frendów' z aliexpres, tyko tylko totalitarna potęga militarna i gospodarcza i to z tą gorszą odmianą totalitaryzmu ludzie w obozach i te sprawy ;), chociaż co nas obchodzi kilkadziesąt tysięcy mordowanych chińczyków i tak jest ich dużo ;) to był sarkazm jak by co.
mjwhiteZobacz profil
Poziom ostrzeżenia: 0%
mjwhite2019.08.20, 09:31
-5#5
Caroozo @ 2019.08.20 08:12  Post: 1214865
Zobaczcie jak ARM się rozpasło przez te lata, kombinują jak wejść na rynek serwerów :). W mojej opinii jeśli firma/instytucja ma do wyboru ugruntowaną architekturę x86 która - mimo wszystko - jest dużo wydajniejsza od ARM, to woli na nią postawić. Oczywiście serwery na ARM znajdą swoje miejsce na rynku. Premiera Epyc 2 pozamiatała i tutaj trudno będzie się już 'wgryźć', bo to są naprawdę duże pieniądze i nie ma czasu na 'kombinowanie'. Mimo wszystko rozwój jest dobry dla wszystkich.


Tak właśnie zrobilo amd, przecież 5 lat temu sami zapowiadali rychłe przejście na arm w serwerach.
https://pclab.pl/zdjecia/artykuly/vega/2014/maj/amd_rm_2.jpg
Prawda jest taka że na rynku jest miejsce na różnorodne rozwiązania, każde z nich znajdzie swoje miejsce, nie ma jednego uniwersalnego najlepszego we wszystkim.

PS. Do 128 rdzeni w mesh, a ludzie biadolili że teraz to już tylko chiplety…. ;-)
CaroozoZobacz profil
Poziom ostrzeżenia: 0%
Caroozo2019.08.20, 09:48
mjwhite @ 2019.08.20 09:31  Post: 1214877

Tak właśnie zrobilo amd, przecież 5 lat temu sami zapowiadali rychłe przejście na arm w serwerach.
https://pclab.pl/zdjecia/artykuly/vega/2014/maj/amd_rm_2.jpg
Prawda jest taka że na rynku jest miejsce na różnorodne rozwiązania, każde z nich znajdzie swoje miejsce, nie ma jednego uniwersalnego najlepszego we wszystkim.

PS. Do 128 rdzeni w mesh, a ludzie biadolili że teraz to już tylko chiplety…. ;-)

5 lat temu to opracowywali nową architekturę, zaś ARM w mniejszym lub większym stopniu również używają do dzisiaj, zresztą jest wyraźnie napisane że x86+ARM miały działać ze sobą. Intel w tym czasie był królem serwerów, slajd był dla inwestorów/prasy więc próbowali wgryźć się tam gdzie mogli. Na dzień dzisiejszy mają produkt deklasujący Intela w KAŻDYM zastosowaniu, to i ARM zeszło na dalszy plan.

W newsie chodzi jednak o coś innego - ARM opracowuje własny projekt HW który chce licencjonować firmom trzecim. Oby nie było tak jak w przypadku Snapów i Windowsa - niby działa ale... Tak jakoś cienko ;-).
AmitozaZobacz profil
Poziom ostrzeżenia: 0%
Amitoza2019.08.20, 09:59
mjwhite @ 2019.08.20 09:31  Post: 1214877
Caroozo @ 2019.08.20 08:12  Post: 1214865
Zobaczcie jak ARM się rozpasło przez te lata, kombinują jak wejść na rynek serwerów :). W mojej opinii jeśli firma/instytucja ma do wyboru ugruntowaną architekturę x86 która - mimo wszystko - jest dużo wydajniejsza od ARM, to woli na nią postawić. Oczywiście serwery na ARM znajdą swoje miejsce na rynku. Premiera Epyc 2 pozamiatała i tutaj trudno będzie się już 'wgryźć', bo to są naprawdę duże pieniądze i nie ma czasu na 'kombinowanie'. Mimo wszystko rozwój jest dobry dla wszystkich.


Tak właśnie zrobilo amd, przecież 5 lat temu sami zapowiadali rychłe przejście na arm w serwerach.
https://pclab.pl/zdjecia/artykuly/vega/2014/maj/amd_rm_2.jpg
Prawda jest taka że na rynku jest miejsce na różnorodne rozwiązania, każde z nich znajdzie swoje miejsce, nie ma jednego uniwersalnego najlepszego we wszystkim.

PS. Do 128 rdzeni w mesh, a ludzie biadolili że teraz to już tylko chiplety…. ;-)

No, w teorii do 128 rdzeni - kiedyś. Na ten moment 64rdzenie w 7nm wyszły im ponad 400mm2. Poza tym mesh jakoś specjalnie szybszy nie jest... miewa nawet wyższe opóźnienia.
mbe2019.08.20, 10:09
mjwhite @ 2019.08.20 09:31  Post: 1214877
Caroozo @ 2019.08.20 08:12  Post: 1214865
Zobaczcie jak ARM się rozpasło przez te lata, kombinują jak wejść na rynek serwerów :). W mojej opinii jeśli firma/instytucja ma do wyboru ugruntowaną architekturę x86 która - mimo wszystko - jest dużo wydajniejsza od ARM, to woli na nią postawić. Oczywiście serwery na ARM znajdą swoje miejsce na rynku. Premiera Epyc 2 pozamiatała i tutaj trudno będzie się już 'wgryźć', bo to są naprawdę duże pieniądze i nie ma czasu na 'kombinowanie'. Mimo wszystko rozwój jest dobry dla wszystkich.


Tak właśnie zrobilo amd, przecież 5 lat temu sami zapowiadali rychłe przejście na arm w serwerach.
https://pclab.pl/zdjecia/artykuly/vega/2014/maj/amd_rm_2.jpg
Prawda jest taka że na rynku jest miejsce na różnorodne rozwiązania, każde z nich znajdzie swoje miejsce, nie ma jednego uniwersalnego najlepszego we wszystkim.

PS. Do 128 rdzeni w mesh, a ludzie biadolili że teraz to już tylko chiplety…. ;-)

Ale Ty głoopi jesteś. Nie zapowiadałem przejścia na ARM tylko ujednolicenie podstawówki dla X86 i ARM. Dotyczyło to nie tylko serwerów (a dokładnie mikroserwerów) ale wszystkich produktów AMD.
TelvasZobacz profil
Poziom ostrzeżenia: 0%
Telvas2019.08.20, 11:09
'Końcami sieci'.... Błagam, dajcie to do tłumaczenia komuś, kto umie w komputery, elektronikę, telekomunikację...
'Endpoint' (bo tak zapewne było w oryginale) to po polsku 'urządzenie końcowe'.
Markiz88Zobacz profil
Poziom ostrzeżenia: 0%
Markiz882019.08.20, 14:31
mbe @ 2019.08.20 10:09  Post: 1214885

Ale Ty głoopi jesteś. Nie zapowiadałem przejścia na ARM tylko ujednolicenie podstawówki dla X86 i ARM. Dotyczyło to nie tylko serwerów (a dokładnie mikroserwerów) ale wszystkich produktów AMD.

W czym problem przecież amd wykorzystuje swoje rdzenie x86 i rdzenie arm razem. Ujednolicili podstawkę dla wszystkim ;). Problem jest tylko dostęp do tych rdzeni ARM, bo pełnią konkretną funkcje.
https://en.wikipedia.org/wiki/Zen_(microarchitecture)

Encryption occurs on a hardware AES engine and keys are managed by the onboard 'Security' Processor (ARM Cortex-A5) at boot time to encrypt each page, allowing any DDR4 memory (including non-volatile varieties) to be encrypted

Zaloguj się, by móc komentować
1