artykuły

AMD A10-4600M – mobilne Trinity kontra Core i3 oraz Core i5

Bulldozer – część druga

329
15 maja 2012, 06:00 Tomasz Niechaj, Mateusz Brzostek

Radeon w procesorze

Układ graficzny też przeszedł metamorfozę podobną do tej, która odróżniła desktopowe karty Radeon HD 5000 od serii HD 6000. Najważniejsza zmiana zaszła na najniższym poziomie: w jednostkach obliczeniowych. Nie są one pogrupowane na zasadzie: cztery proste i jedna do operacji specjalnych, teraz są to grupy czterech uniwersalnych. To architektura VLIW4, znana z Radeonów HD 6970. Między cztery identyczne jednostki łatwiej rozdzielić pracę i więcej cykli zegara przypada na obliczenia zamiast na oczekiwanie na dane lub instrukcje. Dzięki tej optymalizacji i szybszemu taktowaniu wydajność powinna znacznie wzrosnąć. Porównajmy parametry podobnych układów graficznych stosowanych w laptopach:

 


HD 7660G
(Trinity)
HD 6620G
(Llano)
HD 7670M GeForce 610M
GeForce GT630M
Nazwa robocza GPU Devastator BeaverCreek Whistler Pro
GF119 GF108
Jednostki cieniujące 384
VLIW4
400 480 48 96
ROP 8 8 8 4 4
Jednostki teksturujące
24 20 24 8 16
Bazowe taktowanie 497 MHz
444 MHz 600 MHz 900 MHz 672 MHz
Taktowanie Turbo 686 MHz
- - - -
Moc obliczeniowa 527 gigaflopów 355 gigaflopów 576 gigaflopów 173 gigaflopy 258 gigaflopów
Zegar pamięci nd. nd. 900 MHz 900 MHz 800 MHz
Szyna pamięci 2 × 64 b (wspólna z CPU) 2 × 64 b (wspólna z CPU) 128 b 64 b 128 b
Rodzaj pamięci DDR3 DDR3 GDDR5 GDDR3 GDDR3
Przepustowość pamięci ~ 25,6 GB/s ~ 21,3 GB/s ~ 57,6 GB/s ~ 14,4 GB/s
~ 25,6 GB/s
Dekoder wideo UVD3
VCE
UVD3 UVD3 PureVideo HD PureVideo HD

 

Analizując poniższą tabelę, musicie pamiętać, że większość wartości jest nieporównywalna. Na przykład różna liczba jednostek cieniujących i teksturujących wynika z zupełnie innej architektury układów.

Ten układ graficzny nie ma bezpośredniego odpowiednika wśród kart desktopowych, i nic dziwnego: APU stworzono właśnie po to, żeby zastąpiły najniższe modele osobnych kart graficznych. Oprócz przebudowanej architektury rzuca się w oczy kilka zmian: obsługa szybszej pamięci operacyjnej, dynamiczne taktowanie (tryb Turbo w GPU) oraz jednostka kompresji wideo.

Video Compression Engine – szybkie kodowanie wideo

Wprowadzona przez Intela w procesorach Sandy Bridge technika QuickSync robi furorę – przynajmniej wśród tych, którzy przedkładają szybkość kodowania nad jakość obrazu. Kodowanie wideo jest jednym z najpopularniejszych intensywnych obliczeniowo zadań, więc nic dziwnego, że zaczyna się dodawać sprzętowe przyspieszacze. W Trinity zastosowano jednostkę VCE (Video Compression Engine – „silnik kompresji wideo”), znaną już z Radeonów serii HD 7000.

VCE jest w założeniu bardzo podobna do QuickSync, ale różni się implementacją: jest przydatna we wszystkich produktach AMD. W kartach desktopowych o bardzo dużej wydajności, takich jak Radeon HD 7970, funkcje kodowania wspomaganego przez VCE i jednostki obliczeniowe są dostępne jednocześnie. W GPU o mniejszej wydajności VCE może pracować sama, co i tak zapewnia kodowanie szybsze niż „w czasie rzeczywistym” (czyli koduje się film krócej, niż ogląda). Zaangażowanie rdzeni x86 podczas kodowania jest utrzymane na minimalnym poziomie: materiał wideo jest dekodowany sprzętowo przez UVD, kodowany sprzętowo przez VCE i tylko kontrola nad procesem obciąża rdzenie procesora. Jak już powiedzieliśmy, zwiększanie wydajności to też oszczędność energii: wyspecjalizowany układ taki jak VCE przejada na kompresję wideo znacznie mniej energii niż rdzenie x86 albo GPU. Podczas konwersji wideo można też zaprząc jednostki obliczeniowe GPU do pracy nad dodatkową obróbką, na przykład usuwaniem drgań obrazu czy przeskalowaniem do wyższej rozdzielczości. Więcej o tych możliwościach piszemy na stronie o oprogramowaniu.

3