AMD Fusion – pierwsze układy w naszych rękach

Można by się kłócić, czy to dobra taktyka kontaktowania się z klientami. Między innymi z powodu braku konkretnych informacji narosło wiele plotek, na przykład na temat procesorów Barcelona. Wielu rozczarowało się ich wydajnością, bo plotki mówiły o czym innym. Ale taktyki marketingowe nie są naszą specjalnością i nie nam je oceniać. Wiemy za to, kiedy dostajemy w ręce dobry, a kiedy kiepski sprzęt.

Właśnie dlatego jako jedna z kilkunastu redakcji na świecie zostaliśmy zaproszeni do siedziby AMD w Austin w Teksasie, gdzie zaoferowano nam możliwość przetestowania inżynieryjnej platformy AMD z układem Fusion. Niestety, wyniki testów wydajności są jeszcze zastrzeżone i choć chcielibyśmy, nie możemy ich teraz ujawnić. Przygotowaliśmy jednak sporo informacji o nowej generacji krzemowych układów AMD.

Co to jest Zacate?

Nazwa Fusion krąży w świecie półprzewodników już od dawna – pierwszy raz użyliśmy jej cztery lata temu. Przewidywania co do daty wprowadzenia nie sprawdziły się, jak to często bywa, ale idea scalenia funkcjonalności procesora i układu graficznego w jednym jądrze krzemowym właśnie została wcielona w życie.

Fusion oznacza właśnie tę ideę – nie konkretną architekturę procesora, GPU, konkretne układy czy sposób ich połączenia. Z fuzji CPU i GPU powstał układ nazwany przez AMD APU – 'Accelerated Processing Unit'. Pierwsze APU są przeznaczone do wykorzystania w netbookach, ultraprzenośnych notebookach i małych komputerach w obudowach ITX lub all-in-one. Segment cenowy, w którym mają się znaleźć systemy z APU, również należy do najniższych – chodzi o przedział od 800 do 1500 zł.

Połączenie procesora i układu graficznego, choć pierwszy raz zapowiadane przez AMD, jest realizowane prawie równolegle przez Intela. Dlaczego prawie? Bo obie firmy mają różne podejście do tego samego zagadnienia. W zeszłym roku Intel zintegrował już układ graficzny w jednej obudowie z procesorem, a w przyszłym umieści oba te układy na jednym jądrze krzemowym. AMD zaczyna od razu od jednego jądra.

Dwie firmy różnią się także tym, w jakich proporcjach mieszają wydajność CPU i GPU. AMD uważa, że większość użytkowników komputerów stacjonarnych i przenośnych korzysta z aplikacji, w których wydajność GPU jest bardziej istotna. Intel twierdzi coś dokładnie odwrotnego. Cóż – każdy chwali się tym, co ma najlepszego :) Jak jest naprawdę – już wkrótce zweryfikuje rynek.

Wyjaśnijmy przy okazji, co oznaczają inne nazwy robocze związane z Fusion. Słowo brazos w języku hiszpańskim oznacza przedramiona (po angielsku arm – czyżby nawiązanie do architektury ARM?), ale może też nawiązywać do miejscowości w Teksasie, całkiem niedaleko siedziby AMD. Określa platformę – czyli APU, mostek południowy i płytę główną – zbudowaną z APU pierwszej generacji. Dwie następne nazwy to Zacate i Ontario. Pierwszą określa się w Meksyku i Teksasie trawę lub siano, a w świecie półprzewodników – procesor z dwoma rdzeniami x86 i układem graficznym, o TDP ustalonym na 18 W. Druga wzięła się z jednego z narzeczy Indian, oznacza wielkie jezioro i jest częścią wielu nazw geograficznych w Ameryce Północnej. W naszej branży określa procesor taki jak Zacate, ale z o połowę mniejszym TDP.

Rdzeń Bobcat

Architektura rdzenia Bobcat została opracowana specjalnie na potrzeby segmentu rynku, w który celuje AMD. To już nie rdzeń Phenoma albo Athlona zasilany niskim napięciem i wolno taktowany.

Szczegóły architektoniczne zostawimy sobie na kompletną recenzję, ale już dziś możemy powiedzieć o najważniejszych cechach rdzenia Bobcat. W przeciwieństwie do produkowanych dotychczas energooszczędnych procesorów (Intel Atom, ARM) Bobcat może wykonywać instrukcje poza kolejnością (ang. OoO 'out-of-order execution'). Instrukcje, do których dane nie są jeszcze gotowe (na przykład są jeszcze w trakcie transferu z pamięci albo zależą od wyniku wciąż nieukończonej operacji), oczekują w kolejce instrukcji, a jednostki wykonawcze pracują nad instrukcjami, które są gotowe do wykonania. Intel planuje jeszcze przez co najmniej rok pozostać przy architekturze in-order, a pierwsze procesory ARM z techniką OoO (Cortex A9) czekają właśnie na wdrożenie, między innymi w układzie NVIDIA Tegra 2.

Rdzeń Bobcat obsługuje wszystkie najważniejsze rozszerzenia zestawu instrukcji x86: SSE1, SSE2, SSE3, SSSE3, i sprzętowo przyspieszaną wirtualizację. Rzuca się w oczy jedynie brak instrukcji AES przyspieszających szyfrowanie – wszystkie procesory desktopowe nadchodzącej generacji będą już obsługiwały AES.

Rdzenie Bobcat mają dwupoziomową organizację pamięci podręcznej: po 32 kB pamięci L1 danych i L1 kodu oraz 512 kB pamięci L2. Ta z kolei jest połączona z przełącznikiem krzyżowym i kontrolerem pamięci. W jądrach Zacate i Ontario nie ma współdzielonej pamięci podręcznej trzeciego poziomu – dane są synchronizowane między rdzeniami x86 a układem graficznym za pośrednictwem RAM-u.

Drugim ważnym elementem jądra Zacate/Ontario jest grupa 80 jednostek SIMD i jednostka UVD, tworzące układ graficzny. W pierwszych APU jednostki SIMD są takie same jak w najnowszej generacji kart graficznych Radeon. Układ graficzny obsługuje API DirectX 11, a Unified Video Decoder trzeciej generacji dekoduje wszystkie najpopularniejsze formaty wideo. Podobnie jak najnowsze Radeony Zacate/Ontario używa niskonapięciowego interfejsu LVDS do komunikacji z wyświetlaczami. Oznacza to, że bez żadnych dodatkowych układów elektronicznych na płycie głównej można podłączyć APU do matrycy laptopowej lub wyjścia DisplayPort. Zaimplementowano dwa interfejsy LVDS, czyli obsługę dwóch wyświetlaczy naraz. Nie jest to Eyefinity, ale w netbookach i all-in-one niczego więcej nie potrzeba.

Układ graficzny jest połączony z pamięcią i rdzeniami x86 „wysoko wydajnym kontrolerem magistral i pamięci” – niestety, nie ujawniono żadnych szczegółów na ten temat. Jeden z inżynierów AMD powiedział nieoficjalnie, że uważa to rozwiązanie za lepsze od magistrali pierścieniowej w Sandy Bridge – ale nie chciał albo nie mógł powiedzieć, dlaczego tak sądzi. Kontroler pamięci jest jednokanałowy (do dwóch modułów) i oficjalnie obsługuje pamięć DDR-800 i DDR-1066. Choć nie mieliśmy dostępu do programu konfiguracyjnego BIOS-u, udało nam się ustalić, że mnożniki pamięci umożliwiają też działanie z DDR-1333. Dlaczego nie zaimplementowano kontrolera dwukanałowego lub jeszcze szerszego? Powodem są ograniczenia specyficzne dla tego segmentu rynku. Wyprowadzenie z jądra krzemowego jednego kanału pamięci wymaga 144 pól kontaktowych. Procesory Zacate/Ontario mają 413 pól kontaktowych i dodanie dalszych 144 wiązałoby się z koniecznością znacznego powiększenia obudowy i skomplikowania płyty głównej. Do tego dwa kanały pamięci zwiększyłyby zużycie energii. Do dwóch rdzeni Bobcat i 80 jednostek SIMD najwyraźniej wystarcza przepustowość jednego kanału DDR3. Jednokanałowego kontrolera pamięci używają również procesory Atom.

W jądrze Zacate/Ontario zastosowano zaawansowaną technikę ograniczania zużycia energii. Mikroarchitektura rdzeni x86 jest opracowana tak, żeby zminimalizować niepotrzebny przepływ danych wewnątrz rdzenia. Zaimplementowano niskie stany energetyczne C0-C6 rdzeni oraz P0-P6 całego czipa. Części układu znajdujące się w niskich stanach energetycznych są odłączane od zasilania i sygnału zegarowego, żeby zminimalizować straty energii na niepotrzebnych przełączeniach tranzystorów.

Jądro Zacate/Ontario jest produkowane w tajwańskich fabrykach TSMC w procesie technologicznym 40 nm, tak samo jak obecna generacja kart graficznych Radeon. W przyszłości produkcja APU przeniesie się do fabryk GlobalFoundries. Inżynierowie AMD zapewniali nas, że konieczność produkcji APU w TSMC nie wymusiła żadnych ograniczeń projektowych. Jednocześnie obiecali, że następne rewizje APU (nie wiadomo, czy jeszcze TSMC czy dopiero te z GloFo) będą bardziej zaawansowane, jeśli chodzi o technikę produkcji. Możemy się między innymi spodziewać rozwiązania podobnego do Turbo Core z Phenomów II X6 lub Turbo z procesorów Intela.

Platforma Brazos

Platforma Brazos będzie rozwiązaniem dwuczipowym, podobnie jak desktopowa platforma Intela z podstawką LGA1156. Cała funkcjonalność mostka północnego – czyli u AMD już tylko kontroler PCI Express i HyperTransport – stała się zbędna (HyperTransport) lub została przeniesiona do procesora (PCI Express). Możliwe konfiguracje całego systemu komputerowego przedstawiają diagramy:

APU jest połączone z mostkiem południowym Hudson interfejsem UMI, będącym pochodną PCI Express, podobnie jak łącze Alink Express. Funkcjonalność platformy dokładnie opisuje poniższa tabelka:

Gorącym tematem są ostatnio interfejsy SATA 6 Gb/s i USB 3.0. Sześć portów tego pierwszego zostanie zaimplementowanych w mostku Hudson, nie będzie za to bezpośredniej obsługi USB 3.0 – jej dodanie będzie leżało w gestii partnerów AMD i wymagało użycia dodatkowego kontrolera, jak popularny NEC μPD720200. Cała platforma jest bezprecedensowo prosta w produkcji. Zaletą dużej integracji jest możliwość zastosowania prostej płyty drukowanej i nieskomplikowanych układów chłodzenia. Również sam czip APU jest bardzo tani w produkcji: obudowa jest mała, a powierzchnia jądra wynosi tylko 75 mm², czyli o jedną czwartą mniej niż w Radeonie HD5550.

Pierwsze produkty

AMD dokładnie określa, z czym mają rywalizować pierwsze APU. Na początek będą produkowane w dwóch seriach: seria E ma szybsze taktowanie procesora oraz układu graficznego i TDP równe 18 W. Seria C ma wolniejsze taktowanie procesora i układu graficznego, a TDP wynosi 9 W. Przypominamy, że TDP to OCENA, A NIE PRAWDZIWA, ZMIERZONA WIELKOŚĆ i NIE OZNACZA POBORU ENERGII! Seria E ma konkurować z mobilnymi procesorami Pentium serii P6000 i U5000. Seria C będzie przeciwnikiem Celeronów P4000 i U3000 oraz najwyższych modeli procesorów Atom.

Na początek rodzina produktów APU będzie się składała z czterech modeli:

	AMD E-350	AMD E-240	AMD C-50	AMD C-30
proces technologiczny	40 nm TSMC
rdzenie x86	2	1	2	1
taktowanie rdzeni x86	1600 MHz	1500 MHz	1000 MHz	1200 MHz
jednostki SIMD	80
taktowanie GPU	500 MHz		280 MHz
TDP	18 W		9 W

Oczywiście, APU nie będą dostępne jako samodzielne produkty – będzie można je dostać tylko w gotowych laptopach, netbookach, komputerach all-in-one oraz na płytach mini-ITX, takich jak niedawno zapowiadana konstrukcja ASUS-a. Pokazano również ultraprzenośny laptop MSI z układem Zacate:

Platforma inżynieryjna, którą udostępniono nam do testów

Wiemy, że wszyscy czekacie na testy wydajności... Niestety, amerykańscy prawnicy są bezlitośni i nie zostawiliby po nas wiele, gdybyśmy je teraz ujawnili. Bądźcie cierpliwi i pozostańcie z nami – wyniki testów zobaczycie już za kilka dni!

Mateusz Brzostek

Źródło:

Mateusz Brzostek

Tematy: AMD, laptop, GPU, Fusion, CPU