artykuły

AMD Trinity APU – co wiemy o następcy Llano?

Nowa generacja APU

57
4 lutego 2012, 15:42 Mateusz Brzostek

Trinity pod lupą

Dzięki wtykom portalu SemiAccurate.com możemy obejrzeć zdjęcie jądra Trinity – największej i najwydajniejszej wersji. Mają być też dwie inne: można się domyślać, że druga będzie mieć jeden moduł Piledriver zamiast dwóch, a trzecia – również mniej rozbudowane GPU.

 

Jądro jest niewiele większe od Llano, co w połączeniu z bardziej dojrzałym, 32-nanometrowym procesem produkcyjnym SOI (a wiemy, że na początku firma GlobalFoundries miała z nim problemy) powinno dać niezły uzysk i mniejszy koszt produkcji. Rzuca się w oczy, że dodaną powierzchnię zajmuje rozbudowany układ graficzny (o nazwie roboczej London), a dwa moduły Piledriver i 4 MB pamięci podręcznej L2 zajmują mniej więcej tyle samo miejsca co cztery rdzenie „K10.5” i ich L2.

 

Koniecznie kliknij, aby powiększyć!

 

Po dokładnym przyjrzeniu się można z tego zdjęcia wyczytać więcej informacji. Po pierwsze, w części zajmowanej przez GPU widać sześć (w Llano – pięć) jednostek SIMD. W architekturze Northern Islands każdy silnik SIMD składa się z 16 procesorów strumieniowych, a każdy z nich – z 4 jednostek wykonawczych. To daje 384 jednostki wykonawcze – mniej niż w Llano, które miało ich 400. Mimo to dzięki wydajniejszej architekturze VLIW4 można się spodziewać wydajności wyższej, niż zapewnia Llano, podobnie jak Radeon HD 6970 był wydajniejszy od HD 5870. Szkoda, że nie zastosowano architektury GCN, znanej z Radeonów HD 7900, ale ma to swoje dobre strony: przede wszystkim są już dojrzałe sterowniki do Northern Islands. A oto dane techniczne Trinity:

 


Trinity HD 6550D
(Llano)
HD 6570 HD 6670 HD 5670
Nazwa robocza GPU London Sumo Turks Pro GDDR5 Turks XT Cedar XT
Jednostki cieniujące 384
VLIW4
400 480 480 400
ROP ? 8 8 8 8
Jednostki teksturujące
24 20 24 24 20
Zegar rdzenia ok. 700 MHz 600 MHz 650 MHz 800 MHz 775 MHz
Moc obliczeniowa ok. 540 gigaflopów 480 gigaflopów 624 gigaflopy 768 gigaflopów 620 gigaflopów
Zegar pamięci nd. nd. do 1000 MHz 1000 MHz 1000 MHz
Szyna pamięci 128 b (wspólna z CPU) 2 × 64 b (wspólna z CPU) 128 b 128 b 128 b
Rodzaj pamięci DDR3 DDR3 GDDR5 GDDR5 GDDR5
Przepustowość pamięci 21,3–34,1 GB/s 21,3–29,8 GB/s ~ 59,6 GB/s ~ 59,6 GB/s
~ 59,6 GB/s
Dekoder wideo UVD3
VCE
UVD3 UVD3 UVD2.2 UVD2.2

 

Jeśli chodzi o czystą moc obliczeniową, to London jest po prostu jedną czwartą Radeona HD 6970. Ulepszony kontroler pamięci w Trinity ma współpracować z modułami DDR-2133, co zwiększy maksymalną przepustowość pamięci i powinno zapewnić układowi graficznemu ciągłe zajęcie.

Choć silniki SIMD nie są wiele większe niż w Llano, to całe GPU zajmuje sporo większą powierzchnię. Wykorzystano ją między innymi na dodanie VCE (ang. Video Compression Engine) – jednostki kompresji wideo. Nie znamy jeszcze szczegółów, ale może chodzić o funkcję podobną do QuickSync, sprzętowego kodera wideo wbudowanego w procesory Sandy Bridge. Innym dodatkiem jest SAMU (ang. Secure Asset Management Unit), czyli układ wspomagający szyfrowanie obrazu w trakcie wykorzystywania HDCP. Wyspecjalizowany sprzęt zawsze jest bardziej wydajny od uniwersalnego, więc skoro rdzenie procesora nie będą musiały szyfrować HDCP, to należy się spodziewać dłuższego działania na akumulatorze na przykład w trakcie odtwarzania filmu Blu-ray.

To nie wszystko, co widać na zdjęciu rdzenia. W dolnej części układu, w segmencie wyjść obrazu i PCI Express, można wyróżnić potrójny generator sygnału zegarowego do wyjść obrazu, co znaczy, że Trinity będzie obsługiwać do trzech monitorów jednocześnie. Moc układu graficznego raczej nie pozwoli grać w wymagające gry w konfiguracji Eyefinity złożonej z trzech dużych monitorów, ale z pewnością taka funkcja przyda się w zastosowaniach profesjonalnych. Podobnie jak w Llano łącza PCI Express i DDI (cyfrowych wyjść obrazu) mogą być niemal dowolnie konfigurowane. Wykorzystanie wszystkich trzech wyjść obrazu zabierze osiem linii PCI Express, czyli do dyspozycji będzie albo konfiguracja PCI Express ×16 + PCI Express ×4 + dwa monitory, albo PCI Express ×8 + PCI Express ×4 + trzy monitory.

Nie wiadomo jeszcze, czy kontroler PCI Express wbudowany w Trinity jest zgodny z trzecią wersją tego interfejsu. Z jednej strony nie jest to paląca potrzeba, z drugiej zaś AMD zawsze starało się być w awangardzie, jeśli chodzi o wprowadzanie nowinek technicznych. Nie wiadomo też, czy zmieniono jakoś sposób komunikacji między GPU a mostkiem północnym i pamięcią. W Llano układ graficzny miał jedno łącze bezpośrednio do kontrolera pamięci, przez które mógł się dostać do pamięci wydzielonej dla GPU, i drugie, do mostka północnego i kolejki przerwań, które zapewniało mu dostęp do przestrzeni adresowej procesora. Jeśli rozwiązanie się sprawdziło, to nie ma potrzeby go zmieniać, ale być może AMD zdecyduje się na jakiś krok w kierunku zunifikowania przestrzeni adresowej procesora i GPU (o tym piszemy na następnej stronie).

Trinity będzie pakowane w obudowę FM2, która ma o jedną nóżkę mniej od procesorów do podstawki FM1. Mechanicznie nowe APU będą kompatybilne z podstawką FM1. Nie potwierdzono oficjalnie kompatybilności elektrycznej, ale zdrowy rozsądek i brak przeciwwskazań technicznych pozwalają być niemal pewnym, że nowe APU będą działać w starszych płytach. Ponieważ układy Trinity będą korzystać z ulepszonego systemu sterowania zasilaniem, może być konieczna aktualizacja BIOS-u i być może na starszych płytach nie będą dostępne wszystkie funkcje oszczędzania energii.

2