artykuły

AMD opisuje hUMA, czyli jak spełnić wymagania architektury HSA

Zunifikowana pamięć dla CPU i GPU

50
30 kwietnia 2013, 13:43 Mateusz Brzostek

W ostatnich dniach AMD opisało hUMA – heterogenous Uniform Memory Access, technikę zapewniającą nadchodzącym APU tej firmy zgodność z architekturą HSA. Co to jest, o co chodzi i dlaczego skrót nie zaczyna się wielką literą?

Spis treści

Początki: UMA

Jak wielokrotnie donosiliśmy, Fundacja HSA przygotowuje standard (albo zbiór standardów), który określa, jakie cechy musi mieć mikroprocesor, żeby był zgodny z architekturą HSA. Jedną z tych cech zapewniających kompatybilność z całą pulą przyszłego oprogramowania HSA jest zunifikowany dostęp do pamięci. To oznacza, że wszystkie uniwersalne maszyny obliczeniowe w mikroprocesorze, czy to CPU, czy GPU, czy coś innego (np. FPGA), operują na jednej, wspólnej puli. Wspólna przestrzeń adresowa to nic nadzwyczajnego: w ten sposób już dawno temu operowały systemy wieloprocesorowe. Na przykład w systemie z kilkoma procesorami Pentium (tymi pierwszymi) wszystkie CPU były podłączone do wspólnego kontrolera pamięci w mostku północnym i korzystały z jednej puli pamięci. Zawartość RAM-u była widziana przez wszystkie CPU, a zawartość pamięci podręcznej pierwszego poziomu, L1, była uzgadniana między procesorami przez magistralę FSB. Taki system reprezentował architekturę UMA (Uniform Memory Access).

Może lepiej NUMA?

W miarę rozwoju procesorów i oprogramowania wielowątkowego okazało się, że jeden kontroler pamięci i uzgadnianie zawartości pamięci podręcznej przez FSB to kiepskie rozwiązania, opóźniające dalszy rozwój. Można dodawać procesory do systemu, ale skoro kontroler i magistrala FSB nie przyspieszają, to komunikacja staje się coraz trudniejsza i niweluje zyski z dodawania mocy obliczeniowej. Okazało się, że lepiej, aby każdy procesor miał własny zintegrowany kontroler pamięci, który będzie udostępniał innym procesorom przez jakieś szybkie łącze punkt-punkt, na przykład HyperTransport albo QPI.

Taki system dzieli pamięć na oddzielne pule przypisane do każdego procesora; procesor ma najszybszy i najwygodniejszy dostęp do tej jej części, którą obsługuje jego własny kontroler. Obszary pamięci podłączone do innych procesorów są znacznie wolniejsze i działają z większym opóźnieniem, bo komunikacja zachodzi za pośrednictwem łączy HT albo QPI. Z takim rozróżnieniem między lokalną a odległą pulą pamięci pracowały systemy wieloprocesorowe z pierwszymi Opteronami; taka architektura nazywa się NUMA (Non-Uniform Memory Access). Również CPU i GPU w jednym systemie tworzyły architekturę NUMA: pamięć GPU jest dostępna dla procesora i na odwrót, ale wszelkie działania na nielokalnej pamięci są skomplikowane i powolne, bo wymagają transferów przez magistralę AGP albo łącze PCI Express.

Strona:
polpolakZobacz profil
Poziom ostrzeżenia: 0%
polpolak2013.04.30, 14:05
-7#1
Kolejne slajdy od AMD.
MagnezZobacz profil
Poziom ostrzeżenia: 0%
Magnez2013.04.30, 14:10
-10#2
'im większa odległość, na jaką się przesuwa dane, tym więcej się traci na pokonanie oporności kabli i pojemności grupy kabli.' Kable to macie w ziemi..

Co do artykułu to wiąże z HSA spore nadzieje. Mam nadzieję, że ten standard szybko się rozpowszechni
Pan DropsZobacz profil
Poziom ostrzeżenia: 0%
Pan Drops2013.04.30, 14:15
14#3
Nie wiem jak wy, ale chcialbym w koncu przeczytac artykul w ktorym procki AMD wypadna dobrze. Ale zderzenie z rzeczywistoscia jest w tym przypadku jak zderzenie ze sciana.

Bo umówmy sie, puszczaja tylko nam slajdy i probuja zrobic wode z mozgu kolorkami i wybranymi, podrasowanymi wykresami, zamiast w koncu zrobic dobre procki.
AnwenZobacz profil
Poziom ostrzeżenia: 0%
Anwen2013.04.30, 14:23
-3#4
@up
No fajnie by było, ale z drugiej strony w rozwoju sprzętowym dobijamy powoli do ściany, a w oprogramowaniu jeszcze sporo można zrobić i chyba na tym polu AMD widzi swoje szanse.
SunTzuZobacz profil
Poziom ostrzeżenia: 0%
SunTzu2013.04.30, 14:24
-1#5
Pan Drops @ 2013.04.30 14:15  Post: 653391
Nie wiem jak wy, ale chcialbym w koncu przeczytac artykul w ktorym procki AMD wypadna dobrze. Ale zderzenie z rzeczywistoscia jest w tym przypadku jak zderzenie ze sciana.

Bo umówmy sie, puszczaja tylko nam slajdy i probuja zrobic wode z mozgu kolorkami i wybranymi, podrasowanymi wykresami, zamiast w koncu zrobic dobre procki.

Brazosy na tle Atomów wypadały bardzo dobrze. Llano też wypadał dobrze na tle konkurencji. Więc masz dwie architektury, które można na tle konkurencji określić mianem przynajmniej dobrym.
Trinity też jest dobre na tle konkurencji w desktopie, ale średnio opłacalne. W mobilnym segmencie nie jest już tak dobre.

Wydaje się, że AMD znowu ma szanse pokazać coś dobrego w najbliższym czasie.
raf3dZobacz profil
Poziom ostrzeżenia: 0%
raf3d2013.04.30, 14:26
18#6
SunTzu @ 2013.04.30 14:24  Post: 653394
Pan Drops @ 2013.04.30 14:15  Post: 653391
Nie wiem jak wy, ale chcialbym w koncu przeczytac artykul w ktorym procki AMD wypadna dobrze. Ale zderzenie z rzeczywistoscia jest w tym przypadku jak zderzenie ze sciana.

Bo umówmy sie, puszczaja tylko nam slajdy i probuja zrobic wode z mozgu kolorkami i wybranymi, podrasowanymi wykresami, zamiast w koncu zrobic dobre procki.

Brazosy na tle Atomów wypadały bardzo dobrze. Llano też wypadał dobrze na tle konkurencji. Więc masz dwie architektury, które można na tle konkurencji określić mianem przynajmniej dobrym.
Trinity też jest dobre na tle konkurencji w desktopie, ale średnio opłacalne. W mobilnym segmencie nie jest już tak dobre.

Wydaje się, że AMD znowu ma szanse pokazać coś dobrego w najbliższym czasie.

Brazos na tle Atoma dobrze wygląda, ale w tych samych laptopach co Atom nie występuje. Za to występuje w 15calowych gdzie konkuruje z Celeronami i Pentiumami, ale przegrywa.
SunTzuZobacz profil
Poziom ostrzeżenia: 0%
SunTzu2013.04.30, 14:27
@up
jak to nie? Chyba nie powiesz mi, że nie było 10,11, 12 calowych laptopów z brazosami. MSI Wind też nie istniał?
raf3dZobacz profil
Poziom ostrzeżenia: 0%
raf3d2013.04.30, 14:28
13#8
SunTzu @ 2013.04.30 14:27  Post: 653396
@up
jak to nie? Chyba nie powiesz mi, że nie było 10,11, calowych laptopów z brazosami. MSI Wind też nie istaniał?

Zwykle w tej wielkości laptopach Brazos występuje jedynie w wersji 1 Ghz
paulusssZobacz profil
Poziom ostrzeżenia: 0%
paulusss2013.04.30, 14:30
-14#9
Kolejna bzdura o APU, dopuki w komuterach stacionarnych bedzie wolna pamiec DDR3 nie biedzie nigdy wydajniejsza od przecietnego GPU na PCIE. W dodatku wspolna pamiec oznacza kolejkowanie poleceń.
*Konto usunięte*2013.04.30, 14:33
-9#10
raf3d @ 2013.04.30 14:26  Post: 653395
SunTzu @ 2013.04.30 14:24  Post: 653394
(...)

Brazosy na tle Atomów wypadały bardzo dobrze. Llano też wypadał dobrze na tle konkurencji. Więc masz dwie architektury, które można na tle konkurencji określić mianem przynajmniej dobrym.
Trinity też jest dobre na tle konkurencji w desktopie, ale średnio opłacalne. W mobilnym segmencie nie jest już tak dobre.

Wydaje się, że AMD znowu ma szanse pokazać coś dobrego w najbliższym czasie.

Brazos na tle Atoma dobrze wygląda, ale w tych samych laptopach co Atom nie występuje. Za to występuje w 15calowych gdzie konkuruje z Celeronami i Pentiumami, ale przegrywa.

Tyle ze jako APU byl to duzo lepszy wybor niz pentiumy i celerony z ich zacnymi iGP.
Zaloguj się, by móc komentować
1