AMD Carrizo – podstawowe informacje
Na temat Carrizo piszemy już nie pierwszy raz. Polecamy w szczególności swoją poprzednią publikację na temat tych APU. Poniżej znajdziecie najważniejsze nowe informacje o tych jednostkach oraz odpowiedzi na często zadawane pytania.
Architektura Excavator została zaprojektowana z myślą o niskoenergetycznych procesorach. Jest bardziej efektywna energetycznie od poprzednich modułowych układów AMD, ale w niskim zakresie częstotliwości taktowania i poboru energii. Inaczej mówiąc, Carrizo nadaje się do procesorów o TDP 35 W i mniejszym; gdyby znacznie przyspieszyć taktowanie, Carrizo pracowałoby poza optymalnym zakresem i nie byłoby tak efektywne energetycznie.
AMD będzie na początek oferować trzy modele do użytku domowego oraz kilka dla klientów biznesowych (różnią się tylko obsługą klienta i aktualizacjami oprogramowania):
Niektóre funkcje są ograniczone do najwyższych modeli Carrizo. Choć wszystkie mają funkcję Dual Graphics, pozwalającą połączyć APU z zewnętrzną kartą graficzną o podobnej wydajności, tylko model z najszybszym GPU (FX-8800P) może współpracować z zewnętrznym GPU w udostępnionym w DX12 i Mantle trybie asymetrycznym, w którym dwa procesory pracują nad jedną klatką obrazu. Najniższy model (A8-8600P) nie zapewnia też obsługi Eyefinity ani TrueAudio (czyli wyświetlacze da się połączyć w jedną przestrzeń roboczą tylko na pulpicie, a nie w grach).
Desktopowe Carrizo?
Nie miałoby większego sensu. Po pierwsze, znacznie przyspieszone Carrizo straciłoby przewagę efektywności energetycznej nad Kaveri. Po drugie, zintegrowany mostek południowy, interfejsy wejścia-wyjścia oraz trzynapięciowe zasilanie wykluczają użycie Carrizo w istniejącej podstawce FM2+, a wprowadzanie nowej podstawki dla lekko ulepszonych procesorów byłoby nieekonomiczne. Za to Carrizo z pewnością pojawi się w małych desktopach SFF (Small Form Factor) z przylutowanym procesorem.
Anatomia Carrizo
Usprawnienia w zarządzaniu energią
Wiele szczegółów konstrukcyjnych poznaliśmy parę miesięcy temu na konferencji ISSCC. Ich obszerny opis znajdziecie w artykule „AMD Carrizo – szczegóły techniczne nowych APU”. Przypomnijmy krótko, jak osiągnięto zapowiadany 40-procentowy wzrost efektywności energetycznej.
Dostosowana litografia
Pierwszym usprawnieniem było wykorzystanie innych reguł projektowych w planowaniu jądra Carrizo. Kiedy się okazało, że eksperymentalne procesy technologiczne 20 nm w fabrykach TSMC i GlobalFoundries nie przynoszą wielkich korzyści ekonomicznych, zaczęto sięgać po różne metody wyciśnięcia dodatkowych korzyści z dobrze znanych procesów klasy 28 nm. W modułach Excavator i całym jądrze Carrizo obwody są ułożone znacznie ciaśniej niż w poprzednich APU. Reguły projektowe zmieniono tak, żeby unikać użycia komponentów zajmujących dużą powierzchnię i zastępować je wersjami małymi i energooszczędnymi, które jednak nie mają tak dobrych charakterystyk prądowych. Dlatego Carrizo ma znacznie więcej tranzystorów od Kaveri na niemal takiej samej powierzchni; dlatego również pracuje oszczędniej, ale jest taktowane wolniej.
Zintegrowany mostek południowy
Zaoszczędzoną powierzchnię jądra przeznaczono między innymi na zintegrowanie mostka południowego. Nie zajmuje on już miejsca na płycie głównej laptopa. Integracja FCH umożliwia też zastosowanie ważnej funkcji oszczędzania energii: stanu energetycznego S0i3, znanego z laptopowych układów Broadwell. S0i3 wygląda dla systemu operacyjnego jak S0 („urządzenie pracuje”) i pobiera tyle prądu co S3 (ok. 0,05 W), bo w rzeczywistości włączone jest tylko niezbędne minimum podsystemów APU, konieczne do podtrzymania komunikacji sieciowej i zawartość RAM-u.
Adaptacyjne taktowanie i zasilanie
Dzięki sieci dodatkowych czujników napięcia i taktowania Carrizo może w bardzo krótkich przedziałach czasu dostosowywać taktowanie. Kiedy nagle wzrasta obciążenie jednostek obliczeniowych, wzrasta też natężenie prądu płynącego przez APU i chwilowo spada napięcie. W tej sytuacji kontroler zasilania spowalnia taktowanie na kilkanaście–kilkadziesiąt cykli zegara. To pozwala przy sortowaniu układów nadać im szybsze taktowanie, bo nie trzeba zostawiać im „zapasu” na wypadek takich krótkich skoków napięcia. AMD szacuje, że technika AVFS (Adaptive Voltage & Frequency Scaling) pozwala oszczędzić około 20% energii w części CPU i około 10% w części GPU.
Zmiany w architekturze
Najlepsze funkcje w procesorach to te, które nie tylko oszczędzają energię, ale i podnoszą wydajność. Jedno jest ściśle związane z drugim, bo wydajniejszy procesor szybciej skończy zadanie i przestanie zużywać energię. W Carrizo zastosowano kilka takich funkcji.
Moduły Excavator
W modułach Excavator oprócz zupełnie nowego rozplanowania obwodów (logicznie bardzo podobny, fizycznie Excavator mało przypomina Steamrollera) podwojono pojemność pamięci podręcznej L1 dla danych.
Dwa razy pojemniejsza L1D, usprawniony układ przewidywania skoków oraz powiększony o połowę bufor przechowujący jego wyniki mają zwiększyć prawdopodobieństwo, że potrzebne dane zostaną znalezione w pamięci L1 albo odpowiednio wcześnie pobrane z wyprzedzeniem. Dzięki temu procesor rzadziej czeka na pobranie z RAM-u i więcej cykli jest wypełnionych użyteczną pracą.
Excavator obsługuje też większy zestaw instrukcji niż Steamroller: dodano obsługę AVX2, instrukcje do manipulowanie bitami oraz tryb SMEP (o którym pisaliśmy przy okazji testu Ivy Bridge: „SMEP – Supervisory Mode Execution Prevention”), obsługiwany w Windows 8, ale praktycznie niewykorzystywany w oprogramowaniu użytkowym.
Ulepszenia w module Excavator względem modułu Steamroller mają pozwalać na wykonywanie od 8% do 15% więcej instrukcji w takiej samej liczbie cykli zegara. Choć współczynnik IPC jest większy, a pobór energii – niższy, te porównania dotyczą tylko wolnego taktowania i niskiego napięcia. Jak wspomnieliśmy, Excavator nie jest przystosowany do osiągania tak dużych częstotliwości taktowania jak Steamroller.
Nowy koder i dekoder wideo
Jedną z ważniejszych nowych funkcji w Carrizo są nowe układy kodowania i dekodowania wideo. UVD szóstej generacji ma niemal cztery razy większą przepustowość niż dekoder z Kaveri. Cztery razy więcej pikseli to akurat tyle, ile potrzeba, żeby sprzętowo przyspieszać wyświetlanie filmów 4K. Czy to oznacza, że bez problemu obejrzymy wideo 4K 60 kl./sek. na YouTube? Niestety – nie, bo Kaveri dekoduje formaty H.264 i H.265/HEVC, a YouTube postawiło na kodek VP9. Tymczasem większość nadchodzących układów SoC będzie mieć właśnie dekodery H.265/HEVC. Nawet jeśli YouTube nie zmieni zdania i będzie uparcie promować własny standard, inni dostawcy strumieniowanego wideo (Netflix, Hulu, Amazon Prime, Skype, strumieniowanie z Xboksa na PC) wykorzystują właśnie te formaty, które przyspiesza nowe UVD.
UVD w odtwarzaniu filmów H.264 nie wykorzystuje już na żadnym etapie mocy obliczeniowej GPU. Dekodowanie i skalowanie odbywa się w całości w UVD, co pozwala odłączyć GPU od prądu i dłużej odtwarzać filmy, zanim będzie trzeba ponownie naładować akumulator.
Układ graficzny w najnowszej architekturze GCN
W Carrizo wykorzystano najnowszą wersję architektury GCN, ze wszystkimi technikami znanymi z Radeonów R9 290X oraz R9 285. Kompresja kolorów pozwala nieco zmniejszyć ruch na magistrali pamięci (mile widziane usprawnienie w układzie, który musi korzystać z pamięci DDR3). Jednostki ACE, zlecające zadania obliczeniowe procesorom strumieniowym, są dostosowane do wymagań specyfikacji HSA. Jak wspominaliśmy w materiale z konferencji ISSCC, Kaveri pozwala programować w HSA, ale dopiero Carrizo ma wszystkie funkcje wymagane do osiągnięcia najwyższej wydajności.
Carrizo obsługuje DirectX 12 (API) i dodatkowe sprzętowe funkcje DirectX na poziomie 12.0.
Ciekawostki krzemowe
Choć Carrizo zostało niemal pod każdym względem przystosowane do wykorzystania w laptopach, i to raczej tych mniejszych, samo jądro krzemowe ma kilka funkcji, które są albo pozostałością po procesie projektowania, kiedy jeszcze nie znano bardzo dobrze docelowego rynku, albo furtką pozostawiającą AMD możliwość wykorzystania Carrizo gdzie indziej.
Po pierwsze, kontroler pamięci obsługuje moduły DDR4, o czym informuje nawet poradnik programowania BIOS-u dla Carrizo. Maksymalne taktowanie to DDR4-2400 i mnożnik ×24 jest ograniczeniem sprzętowym – pamięć DDR4 czy DDR3 podłączoną do Carrizo można przyspieszyć wyłącznie przez podkręcanie zegara bazowego. Wykorzystanie DDR4 z Carrizo nie dałoby spektakularnych korzyści w wydajności GPU właśnie ze względu na ograniczoną częstotliwość taktowania, ale pozwoliłoby oszczędzić trochę energii. Być może laptopy z Carrizo i DDR4 pojawią się, jeśli ceny DDR4 będą już porównywalne z cenami DDR3. A być może ta funkcja pozostanie na zawsze niewykorzystana, tak jak kontroler GDDR5 wbudowany w Kaveri...
Po drugie, Carrizo obsługuje pamięć ECC (z korekcją błędów) i ma 16-liniowy kontroler PCI Express (a w laptopach dostępnych jest tylko osiem linii). To pozwoli w przyszłości wykorzystać Carrizo jako procesor serwerowy, podobny do Xeonów D Intela.
Carrizo-L
Niedługo na rynek ma trafić też Carrizo-L, układ APU o podobnej nazwie roboczej, ale mniejszy, bardziej energooszczędny i z rdzeniami x86 z rodziny Puma. Oba podobnie nazwane APU będą pinowo kompatybilne, co oznacza, że producenci będą mogli oferować ten sam laptop z tą samą płytą główną w wersji z procesorem Carrizo albo Carrizo-L. Ślady egzemplarzy inżynieryjnych pojawiają się „w internetach” od kilku miesięcy, ale jak dotąd nie wiemy, kiedy Carrizo-L miałoby trafić na rynek.