artykuły

AMD Carrizo - nowe informacje z konferencji ISSCC 2015

AMD Carrizo – szczegóły techniczne nowych APU

44
24 lutego 2015, 12:55 Mateusz Brzostek

Ulepszone zarządzanie energią i zmiany w mikroarchitekturze

Więcej czujników, większy zakres Turbo

W pogoni za oszczędnością energii jednym z najważniejszych mechanizmów jest częsta i radykalna regulacja prędkości taktowania i napięcia zasilającego. W Carrizo zastosowano technikę AVFS, pozwalającą układom osiągać szybsze taktowanie bez konieczności zwiększania napięcia.

AVFS to skrót od Adaptive Voltage and Frequency Scaling. Oznacza, że procesor ma możliwość bardzo szybkiej zmiany taktowania w niewielkim zakresie, kiedy zostanie wykryty spadek napięcia. W układzie bez AVFS trzeba podczas sortowania zostawić pewien zapas napięcia: ustawia się je na wartość większą od wymaganej do poprawnego działania przy zadanej częstotliwości, żeby w razie spadku napięcia wywołanego nagłym skokiem obciążenia procesor mógł kontynuować pracę. Układ z AVFS cały czas monitoruje napięcie i w razie spadku spowalnia na chwilę taktowanie. To z kolei powoduje zmniejszenie obciążenia i pozwala szybciej ustabilizować napięcie na zadanym poziomie i wrócić do pożądanego taktowania. Taki mechanizm szybko dąży do równowagi i pozwala zrezygnować z marnującego energię „zapasu” napięcia – albo zwiększyć średnią częstotliwość taktowania układu.

Ciągłe monitorowanie napięcia i kontrola taktowania wymagają dokładnej obserwacji pracy całego układu. W każdy moduł Excavator wbudowano 10 czujników połączonych z kontrolerem zasilania, które pomagają w dokładnym sterowaniu. Regulacja taktowania AVFS reaguje w czasie poniżej 1 ns, czyli w procesorze taktowanym z częstotliwością 2 GHz w czasie mniej niż dwóch cykli zegara. Dokładna obserwacja zasilania, taktowania i temperatury jest częściowo odpowiedzialna za wysoką sprawność energetyczną ostatnich układów Intela i każdy producent półprzewodników musi ją stosować, by możliwy był dalszy postęp w tej dziedzinie.

Zaawansowany system czujników i programowalny kontroler taktowania i zasilania teoretycznie pozwalają dokładniej sortować procesory. Można by przydzielić każdemu krzemowemu jądru optymalne dla niego napięcie zasilania i taktowanie – AMD nie komentuje jednak tych możliwości. Każdy producent zazdrośnie strzeże informacji o uzysku i sortowaniu układów, dlatego, jeśli rzeczywiście zarządzanie zasilaniem i taktowaniem zostanie użyte w ten sposób, pewnie nie poznamy szczegółów.

Choć nie powiedziano tego oficjalnie, można się spodziewać, że Carrizo będzie radykalniej niż Kaveri zwalniać w spoczynku i przyspieszać pod obciążeniem. Wśród egzemplarzy inżynieryjnych Carrizo znaleziono model o bazowym taktowaniu na poziomie 1,8 GHz przyspieszający maksymalnie do 3,2 GHz. 

Stan energetyczny S0i3

Dzięki zintegrowaniu mostka południowego w APU inżynierowie AMD zaimplementowali też stan energetyczny S0i3, znany nam z procesorów Haswell. Przypomnijmy, że to szczególny przypadek stanu energetycznego S0, w którym teoretycznie wszystkie podzespoły pracują.

S0i3 wygląda dla systemu operacyjnego i pozostałego oprogramowania jak zwykły S0, ale pobiera tyle prądu co S3. Większość elementów APU jest zupełnie odłączona od zasilania; pracują tylko mostek południowy i kontroler zasilania. Powrót z S0i3 do stanu zwykłej aktywności trwa maksymalnie 500 ms, czyli nieco dłużej niż w układach Broadwell-Y, ale wciąż dość szybko, aby był niedostrzegalny dla użytkownika. S0i3 umożliwia też wykorzystanie funkcji connected standby w Windows 8. 

Zmiany w module Excavator

Choć konferencja ISSCC skupia się na zagadnieniach produkcji układów scalonych, a nie na projektowaniu obwodów logicznych, nie da się tego rozdzielić. Zoptymalizowanie modułu Excavator pod kątem pracy przy wolniejszym taktowaniu pociągnęło za sobą pewne zmiany w budowie rdzeni x86. Według AMD moduł Excavator wykonuje średnio ok. 5% więcej instrukcji w cyklu zegara niż moduł Steamroller. Częściowo jest to zasługą zwiększonej i usprawnionej pamięci podręcznej L1 dla danych; to implikuje inne ulepszenia w rdzeniach x86, które jednak nie zostały opisane. 

Wbudowany układ graficzny – nowa wersja GCN oraz HSA 1.0

Wbudowany w Carrizo układ graficzny ma wiele wspólnego z tym w Kaveri. Ma 512 procesorów strumieniowych (8 jednostek GCN po 64 SP) i jest zbudowany z najnowszej, najbardziej zaawansowanej wersji architektury GCN. GPU w Carrizo ma dwie funkcje zasadnicze dla swobodnego i wydajnego programowania w HSA. Po pierwsze, umie znacznie częściej i szybciej przełączać się między wątkami, co pozwala kilku programom lub wątkom korzystać jednocześnie z mocy obliczeniowej GPU. Po drugie, udostępnia mechanizmy Quality of Service, pozwalające nadać istotnym wątkom pierwszeństwo i je wyegzekwować. To ważne szczególnie w przypadku GPU, które mają ogromną przepustowość obliczeniową, ale w których czas oczekiwania na rezultat obliczeń jest długi. Dzięki tym usprawnieniom Carrizo jest pierwszym APU w pełni spełniającym wymagania finalnej specyfikacji HSA 1.0 (choć Kaveri pozwala programować w HSA i uruchamiać odpowiednie programy, brakuje mu sprawności w realizowaniu wielu zadań HSA jednocześnie).

Wbudowany w GPU układ sprzętowego kodowania i dekodowania wideo w Carrizo umie używać kodeka H.265, a jego ogólna przepustowość jest niemal cztery razy większa niż w Kaveri – została dostosowana do obsługi wideo 4K.

GPU w Carrizo korzysta również z zaawansowanej kompresji tekstur, po raz pierwszy zastosowanej w Radeonie R9 285. Ma to zmniejszyć zapotrzebowanie na wydajność podsystemu pamięci i jest niezbędne do dalszego zwiększania wydajności GPU podłączonego do dwukanałowego kontrolera DDR3. Nie wspomniano nic o ewentualnym użyciu innego kontrolera pamięci (np. DDR4).

2