Beema zamiast Kabini; Mullins zamiast Temash
Beema i Mullins to nazwy robocze dwóch wariantów tego samego APU. Beema zawiera wydajniejsze, szybciej taktowane modele, które mają zastąpić Kabini w laptopach i (prawdopodobnie) desktopowej platformie AM1. Mullins to modele bardziej energooszczędne, mające zająć miejsce Temash... i kilka nowych miejsc. Dlaczego nowych? Bo te APU mają być znacznie efektywniejsze energetycznie od swoich poprzedników. Efektywność energetyczna, czyli maksymalna wydajność przy minimalnym profilu energetycznym, była na celowniku projektantów. Jak za chwilę pokażemy, z punktu widzenia mikroarchitektury i ogólnej wydajności Beema i Mullins nie są znaczącym skokiem w stosunku do Kabini.
W maszynie, w której każdy miliwat czerpany z akumulatora i wypromieniowywany z obudowy w postaci ciepła jest starannie policzony, nie można zmarnować zbyt wiele dżuli. W Kabini i Temash sporo dało się ulepszyć dzięki połączeniu dopracowanej techniki produkcji i nowych mechanizmów oszczędzania energii.
Powyższa tabela obiecuje wydajność APU Mullins co najmniej zbliżoną do osiągów APU Temash, zakwalifikowanego do wyższego TDP. Jak to zrobiono? Zaraz wyjaśnimy. Tymczasem spójrzmy na listę modeli:
Mullins to trzy modele pod częściowo nową marką: do znanych symboli dodano słowo Micro, co oznacza układy tabletowe. Dwa czterordzeniowe układy mają TDP 4,5 W, SDP 2,8 W i obsługują tak samo szybką pamięć; różnią się taktowaniem rdzeni CPU i GPU. Najsłabszy jest dwurdzeniowy, ma mniej pamięci podręcznej i wolniejsze taktowanie, ale wciąż pełne GPU. Wszystkie modele Mullins obsługują Windowsowy tryb Connected Standby.
Beema obejmuje cztery modele: trzy czterordzeniowe o TDP 15 W i jeden dwurdzeniowy o TDP 10 W.
ARM w APU
Jedyną zmianą, jeśli chodzi o architekturę SoC, jest dodanie PSP – Platform Security Processor, podsystemu złożonego z rdzenia ARM Cortex A5, małego bloku pamięci konfiguracyjnej i kilku wyspecjalizowanych obwodów do szybkiego szyfrowania i kompresji. PSP zapewnia obsługę ARM TrustZone, techniki pozwalającej za pośrednictwem mechanizmów wirtualizacyjnych odizolować od siebie „zaufane” i „niezaufane” programy.
Korzyść z tego rozwiązania trudno ocenić: choć TrustZone jest standardem obsługiwanym bardzo powszechnie, a implementacja AMD jest zgodna ze specyfikacją organizacji Global Platform (należą do niej największe tuzy świata półprzewodników i sieciowego bezpieczeństwa), trudno wskazać konkretną atrakcyjną usługę, która absolutnie wymagałaby wbudowanego „bezpiecznika”. Jedną z łatwo widocznych korzyści może być to, że urządzenia z tą funkcją są podobno chętniej akceptowane przez pracodawców, którzy chcą pozwolić pracownikom na używanie w pracy własnych komputerów, ale nie chcą wypuścić z rąk kontroli nad poufnymi danymi. Tę technikę można też zastosować do zabezpieczenia mobilnych płatności albo kontroli treści (tak, DRM!).
Najbliższym odpowiednikiem w układach Intela jest technika TXT, obsługiwana jedynie przez procesory serwerowe. Intel znów tworzy tu oddzielne stronnictwo, bo w TrustZone są wyposażone wszystkie nowoczesne procesory ARM, które przecież są podstawą przytłaczającej większości smartfonów i tabletów.
Co się dziś dzieje?
Właśnie upchnięcie nieco lepszej wydajności w mniejszych wymaganiach energetycznych ma pozwolić nowym APU powalczyć o tak zwane design wins. Ten angielski termin oznacza w uproszczeniu każdy unikatowy model urządzenia z danym podzespołem w środku. Na małą popularność dotychczasowych APU miała wpływ (wśród innych czynników) mała liczba design wins – wybór tabletów z Kabini jest bardzo mały, a dobór podzespołów w laptopach często jest nonsensowny.
AMD nie może sobie pozwolić na to, żeby podobnie było z Beema/Mullins. Wystarczy kilka naprawdę nieźle zaprojektowanych urządzeń, na przykład coś na miarę Project Discovery, żeby nowe APU ugryzły większy niż dotąd kawałek mobilnego tortu.
O Beema i Mullins usłyszeliśmy pierwszy raz na APU13 kilka miesięcy temu; dlaczego właśnie dziś podajemy te informacje? Od jakiegoś czasu nowe APU są już dostarczane do producentów przenośnych komputerów. Teraz wszystko jest w ich rękach – na razie nazwy modeli nowych APU wymknęły się tylko Dellowi, i to w związku z laptopem Inspiron 15 (2,5 kg, ekran o przekątnej 15,6 cala, napęd optyczny... czy ktoś przyznaje nagrodę za najbardziej niedorzeczną konfigurację?). Na bardziej atrakcyjne zapowiedzi nie powinniśmy czekać dłużej niż do Computexu, do początków czerwca.
AKTUALIZACJA: Komputery z Beema zapowiedziało także Lenovo. Chodzi o laptopy FLEX 2, w których można obrócić ekran o 300° i ukryć klawiaturę za ekranem dotykowym, oraz lekkie laptopy B50, G50, Z40 i Z50.
Jak oszczędzić prąd, nie zmieniając architektury i procesu produkcyjnego?
Puma+? To taki szybszy Jaguar...
Jak się okazuje, najważniejsze komponenty SoC Beema są takie same jak w Kabini. Rdzeni CPU nie zmieniono pod względem mikroarchitektury; jedyne różnice w wydajności pochodzą z różnic w taktowaniu. Nie zmieniły się też wewnętrzne magistrale, jednostki GCN ani inne komponenty GPU, włączając wyjścia obrazu (maks. DisplayPort 1.2, rozdzielczość 4K przy 30 Hz), kodery i dekodery wideo.
Skoro już przy tym jesteśmy, to PSP z dodatkowym rdzeniem Cortex A5 właściwie też nie jest nowym elementem: wszystko wskazuje na to, że został wbudowany, nawet jeśli nie wykorzystany, już w Kabini.
Jądro Beema jest bliźniaczo podobne do Kabini, choć widać, że przeszło małe zmiany tu i ówdzie i zostało trochę odchudzone z pustych obszarów. Nie znamy dokładnej powierzchni jądra ani liczby tranzystorów, ale zdjęcie jądra każe sądzić, że nie zmieniły się o więcej niż kilka procent. Mały lifting krzemu zbiegł się zapewne z przenosinami na inny proces produkcyjny: wprawdzie AMD tego oficjalnie nie potwierdza, jądra Beema pochodzą zapewne z fabryk GlobalFoundries. Mobilne Kabini było produkowane w TSMC na Tajwanie, a desktopowe Kabini do podstawki AM1 – w GlobalFoundries w Niemczech. Projektowanie łatwo przenośnych jąder jak na razie opłaca się AMD. Przewaga procesu produkcyjnego GlobalFoundries nad technologią TSMC jest jedną z cech nowych APU dających im przewagę energetyczną nad Kabini.
STAPM – oportunistyczne turbo
Pierwszym z dwóch najważniejszych mechanizmów oszczędzania energii w Beema/Mullins jest nowoczesny, oportunistyczny tryb turbo nazwany (przez inżynierów, nie dział marketingu) STAPM, czyli Skin Temperature Aware Power Management.
Mechanizm polega na wykorzystaniu bezwładności cieplnej urządzenia, w którym jest APU. Przez pewien krótki czas (od kilku do 20 minut) SoC może pracować tak szybko, że przekracza typowy poziom wydzielania ciepła. Ale to nic, bo dopóki temperatura obudowy nie wzrośnie do niekomfortowego poziomu, a SoC pracuje poniżej maksymalnej dopuszczalnej temperatury (ok. 100°C), wszystko jest w porządku. Ponieważ większość zadań wykonywanych na tablecie czy małym laptopie wymaga intensywnych obliczeń tylko w krótkich przedziałach czasu, jest duża szansa, że takie zadanie da się dzięki przyspieszeniu taktowania ukończyć szybko, zanim układ chłodzenia zdąży się nagrzać. Potem użytkownik patrzy na ekran, APU przechodzi w stan energooszczędny, a układ chłodzenia powoli rozprasza ciepło i wraca do początkowej temperatury.
Powinno to brzmieć znajomo – technika ta jest bardzo podobna do używanej w procesorach desktopowych Intela od czasu Sandy Bridge (i w Atomach od czasów Moorestown z 2010 r.). Tu została nieco zmodyfikowana, tak by uwzględniała temperaturę obudowy urządzenia – w końcu tablet nie powinien parzyć w palce.
Turbo w Beema/Mullins działa już na poziomie całego SoC, podobnie jak w dużych APU Richland i Kaveri. Budżet energetyczny w danej chwili niewykorzystywany przez GPU może zostać oddany do dyspozycji CPU, to samo dotyczy innych części SoC.
Każdy wat policzony
Drugi mechanizm zapewniający jednoczesne oszczędzanie energii i zwiększanie wydajności działa na poziomie całej platformy, włączając układy scalone nienależące do SoC. Oczywiście, APU nie może kontrolować innych układów, ale może się postarać dane zadanie wykonać tak, aby w sumie całe urządzenie przejadło jak najmniejszą ilość energii.
Jego działanie opiera się na dość skomplikowanym modelowaniu i powinno być dostosowane do danego modelu urządzenia. Kontroler taktowania i zasilania w APU monitoruje na bieżąco, jak bardzo zapracowane są podsystemy APU i inne komponenty maszyny. Próbuje zgadnąć, czy któryś z nich nie jest wąskim gardłem, a jeśli to możliwe – przyspieszyć go. Zauważono, że wiele zadań można wykonać oszczędniej, jeśli procesor zostanie przyspieszony i wykona zadanie wcześniej, tak aby całe APU wraz z peryferiami (kontrolerem RAM itp.) mogło przejść w stan spoczynku. Oczywiście, niektóre zadania nie dają się zakończyć szybciej dzięki przyspieszeniu CPU, przykładem może być oglądanie filmu czy wideorozmowa. Kontroler zasilania umie rozpoznać takie przypadki i zachować się tak, żeby maksymalnie wydłużyć czas działania na zasilaniu akumulatorowym.
Koncepcja race-to-idle jest znana nie od dziś – wykorzystuje się ją od lat w projektowaniu procesorów desktopowych i przenośnych. Zaawansowane turbo to praktycznie konieczność w najmniejszych urządzeniach, takich jak tablety czy konwertowalne laptopy.
Dalsze ulepszenia w drodze
Inżynierowie AMD położyli bardzo duży nacisk na unowocześnienie swoich APU pod względem energooszczędności i jak zapewniają, tak pozostanie w przyszłości. Podali listę technik, które są jeszcze w fazie prototypów, ale zostaną użyte w następnych generacjach APU. Wśród nich jest zintegrowany regulator napięcia, taki jak w procesorach Haswell. Od dawna było wiadomo, że AMD (podobnie jak IBM i Intel) pracuje nad ISVR, ale teraz możemy być pewni, że wbudowany zasilacz impulsowy zostanie wykorzystany w praktyce, zapewne już niedługo.
Powtórka z Richlanda?
Krok do przodu w dziedzinie energooszczędności nie wymagał w tym przypadku budowania nowego sprzętu: wszystkie wymagane czujniki temperatury, liczniki przerwań i wbudowane mikrokontrolery były już w APU Kabini, tyle że nie zostały tam wykorzystane. Podobnie było z APU Richland: osiągi tego samego kawałka krzemu poprawiono znacznie dzięki samemu dopracowaniu algorytmów zarządzających energią, bez zmian sprzętowych. To może być sygnał, że AMD po prostu nie nadąża z inżynierią: przecież gdyby dało się to zrobić na czas debiutu Kabini, z pewnością by to zrobiono. W międzyczasie zmienił się też proces technologiczny z 28-nanometrowego TSMC na 28-nanometrowy GlobalFoundries, co nie jest bez znaczenia, ale i tak mamy nadzieję, że potencjał następnej generacji APU zostanie lepiej wykorzystany już na początku, a nie dopiero po „odświeżeniu” platformy.