aktualności

PowerVR Series6XT GX6650, czyli 192 rdzenie czystej mocy. Blisko 0,5 TFLOPS w GPU dla tabletów i nie tylko

18
6 marca 2014, 17:12 Piotr Gontarczyk

Imagination Technologies ponownie napina muskuły oficjalnie zapowiadając nowy procesor grafiki należący do serii PowerVR Series6XT. Dla brytyjskiej firmy, jednego z liderów rynku GPU, a jedynego z Europy, powiększenie oferty jest konieczne, gdyż zainteresowanie firm projektujących układy SoC oraz procesory x86 (Intel) nową generacją układów "Rogue" jest coraz większe. Coraz większe są też oczekiwania, a te skupiają się przede wszystkim na większej wydajności i coraz lepszej sprawności energetycznej.

Układy grafiki "Rogue" to paleta wielu konstrukcji, przeznaczonych dla różnych zastosowań. Ich konstrukcje mogą składać się z nawet ośmiu lub zaledwie pół klastra USC (Unified Shading Cluster). Duża skalowalność architektury "Rogue" sprawia, że może być ona dostosowywana do potrzeb producentów sprzętu elektroniki użytkowej, od najtańszych do najdroższych smartfonów, poprzez tablety, przenośne konsole do gier, a także telewizory oraz domowe systemy rozrywki multimedialnej.

Najnowszy procesor grafiki PowerVR Series6XT to PowerVR GX6650, składający się z sześciu klastrów USC, co daje łącznie aż 192 rdzenie przetwarzania. Obecnie jest to najszybszy przedstawiciel szóstej generacji układów grafiki PowerVR. Każdy z klastrów USC składa się z szeregu potoków ALU, które pobierają dane i wydają gotowe wyniki. Potoki te są zorganizowane równolegle, a w każdym USC jest ich 16. Układ ten podyktowany jest tym, że grafika trójwymiarowa korzysta przede wszystkim na przetwarzaniu równoległym, gdzie wiele powiązanych ze sobą obliczeń można wykonywać jednocześnie. Rys Sommefeldt z Imagination Technologies zwraca uwagę na to, że często zdarza się, że wykonywanie obliczeń równolegle dla powiązanych pikseli jest po prostu konieczne lub wręcz wymuszane przez kod aplikacji lub gry.

Wracając do samego układu GX6650 trzeba zauważyć też, że jego projektanci zapewnili mu bardzo dużą uniwersalność w kwestii wyboru precyzji w obliczeniach związanych z grafiką, dzięki czemu cała konstrukcja ma być najlepiej przystosowana także do najbardziej energooszczędnych urządzeń przenośnych. Szczegóły tej zalety wyjaśnia dla nas tym razem Alexandru Voica, zajmujący się w Imagination Technologies m.in. relacjami z mediami. Voica mówi, że "GX6650 zawiera energooszczędny, wysokowydajny tryb FP16, który może zapewniać nawet dwukrotnie większą wydajność niż tryb precyzji FP32, przy zachowaniu ograniczonego budżetu energetycznego." Dodaje też, że w GX6650 "ulepszono działanie trybu precyzji FP16 ze względu na to, że FP32 nie zawsze jest najlepszym wyborem, jeśli chodzi o uzyskanie optymalnego stosunku wydajności do poboru energii". Rys Sommefeldt wskazuje, że działając w trybie FP32, a więc na 192 rdzeniach przetwarzania, GX6650 daje wydajność 384 FLOP-ów na cykl zegarowy, a w trybie FP16, gdzie działają łącznie aż 384 rdzenie ALU, wydajność sięga 786 FLOP-ów na cykl. To wszystko oznacza, że przy częstotliwości pracy GPU wynoszącej 600 MHz, GX6650 oferuje moc obliczeniową aż 230,4 GFLOPS w trybie FP32. Aż 460,8 GFLOPS osiąga w trybie FP16. Tym samym najnowszy procesor grafiki PowerVR, przeznaczony dla urządzeń mobilnych mocno zbliżył się do mocy obliczeniowej niemal 0,5 TFLOPS.

Alexandru Voica zwraca też uwagę na to, że kolejną naprawdę ważną zaletą konstrukcji GX6650 jest jego ogromna wydajność w przetwarzaniu pikseli. Nowy GPU może przetwarzać aż 12 pikseli w pojedynczym cyklu zegara, co stanowić ma aż trzykrotnie większą wartość, w porównaniu do procesorów grafiki konkurencji. Voica dodaje, że wydajność przetwarzania pikseli bywa czasami uznawana za mniej istotną, w porównaniu do czystej mocy obliczeniowej, liczonej w GFLOPS-ach, ale okazuje się bardzo istotna zwłaszcza tam, gdzie GPU ma do czynienia z wyświetlaniem obrazu o wysokiej rozdzielczości. Jako że GX6650 przeznaczony ma być dla wysokowydajnych tabletów z najwyższego segmentu, a także m.in. dla telewizorów z ekranami Ultra HD 4K, to duża jego przepustowość pikseli zaczyna odgrywać bardzo ważną rolę. Staje się ona wręcz najbardziej istotna, jeśli chodzi o gry cechujące się skomplikowaną, nowoczesną grafiką trójwymiarową, ale także o nowoczesne interfejsy użytkownika, które zawsze muszą zachowywać płynność wszelkich animacji i szybko reagować na kolejne działania. Wysoka wydajność przetwarzania pikseli to wciąż nie wszystkie zalety nowego procesora grafiki PowerVR. Jak twierdzą przedstawiciele Imagination Technologies, model GX6650 zapewnia nawet o połowę lepszą wydajność wypełniania teksturami, w porównaniu do wszystkich, bezpośrednich konkurentów.

Nowy układ grafiki, jak zapewnia Alexandru Voica, to rzekomo także lider w kwestii sprawności energetycznej, wychodzący daleko przed szeregi konkurencji. Zastosowano w nim wszystkie kluczowe rozwiązania Imagination Technologies, w kwestii oszczędzania energii, a wśród nich są m.in. PVR3C oraz PowerGearing G6XT.

PVR3C jest pakietem trzech formatów kompresji, w skład którego wchodzą:

  • PVRTC i ASTC - kompresja tekstur
  • PVRIC - kompresja bufora ramki
  • PVRGC - kompresja geometrii

Ekipa PowerVR chwali się, że wszystkie te rozwiązania konkurencja dopiero wdraża, jako koncepcje, podczas gdy w przypadku ich procesorów grafiki zastosowano drugą już generację systemu kompresji PVR3C, który ulepszono m.in. o lepsze algorytmy dla zastosowań mobilnych (gry, przeglądanie internetu, interfejsy użytkownika). PVRIC to rozwiązanie, które najlepiej wykorzystywane ma być przede wszystkim w przypadku tych urządzeń, które działają z ekranami o wysokich rozdzielczościach. Chodzi przede wszystkim o najbardziej zaawansowane tablety i telewizory z ekranami Full HD oraz Ultra HD 4K. Podstawowy  element architektury, zapewniający duże oszczędności, to jednak mechanizm renderowania grafiki, z którego PowerVR słynie od samego początku. Mowa o TBDR (Tile-Based Deffered Rendering), a więc forma renderowania siatki 3D kolejnych klatek w formie kafelków. Dla każdego z nich dokonywane są wyliczenia mające wykazać, które obiekty na trójwymiarowej scenie będą ostatecznie widoczne dla użytkownika. Te niewidoczne są automatycznie pomijane na dalszym etapie przetwarzania, co pozwala czasem znacząco obniżyć obciążenie GPU, uzyskując tym samym większą płynność animacji oraz mniejsze zapotrzebowanie na energię. Odiążany w ten sposób jest bowiem nie tylko sam GPU, ale także podsystem pamięci RAM.

PowerVR PowerGearing G6XT to natomiast szereg mechanizmów zarządzania energią, które razem mają odpowiadać za utrzymanie optymalnej wydajności, przy zachowaniu maksymalnie ogranicznego poboru energii elektrycznej, a także poziomu wytwarzanego przez GPU ciepła. PowerGearing w wydaniu dla GX6650 pozwala automatycznie kontrolować wszystkie zasoby jednostki, a więc dynamicznie lub na żądanie włączać i wyłączać każdy z 6 klastrów USC, a także innych bloków przetwarzania.

PowerVR GX6650 zapewnia obsługę wszystkich popularnych interfejsów programowania aplikacji, a więc OpenGL ES 3.0, OpenCL 1.2 EP, OpenCL, OpenGL 3.x, Direct3D 11 Level 9_3 i 10_0 oraz Renderscript. Z procesorów grafiki PowerVR korzysta wiele różnych firm, takich jak np. Apple, MediaTek czy Allwinner. Niewykluczone jest więc to, że GX6650 pojawi się m.in. w następnej generacji tabletu Apple iPad.

Źródło: Własne
DevilScreamZobacz profil
Poziom ostrzeżenia: 0%
DevilScream2014.03.06, 17:20
26#1
Pierwsze co mam w głowie po przeczytaniu tytułu:

tutaj info dla tych, którym wątek umknął :)
SNC2014.03.06, 17:32
Na papierze mocniejsze od tegrak1, ciekawe kiedy premiera i ile W bedzie pobierac
WibowitZobacz profil
Poziom ostrzeżenia: 0%
Wibowit2014.03.06, 18:07
Na grafice jest 8 clusters a w produktach max 6 klastrów. Czyżby były plany co do stworzenia czegoś jeszcze większego opartego na Rogue?
Stefan999Zobacz profil
Poziom ostrzeżenia: 0%
Stefan9992014.03.06, 18:28
Dobra skalowalność to w układach mobilnych podstawa, o czym niektórzy konkurenci zapominają.
motiffZobacz profil
Poziom ostrzeżenia: 0%
motiff2014.03.06, 18:29
-5#5
Prawdopodobnie nie powali wydajnością, ale przynajmniej energia będzie w ryzach.
viris33Zobacz profil
Poziom ostrzeżenia: 0%
viris332014.03.06, 20:13
Jaką to bedzie miało wydajność porównując do mobilnej GPU w laptopach lub w desktopie ?
skoti48Zobacz profil
Poziom ostrzeżenia: 0%
skoti482014.03.06, 20:29
SNC @ 2014.03.06 17:32  Post: 730101
Na papierze mocniejsze od tegrak1, ciekawe kiedy premiera i ile W bedzie pobierac

W FP32 raczej dużo gorszy. W FP16 trochę szybszy (k1 ma taka sama wydajność co w FP32 czyli 360 gflops). Ale to wystarczy bo gry mobilne używają zazwyczaj 16bitowej precyzji obliczeń.
SNC2014.03.06, 20:32
skoti48 @ 2014.03.06 20:29  Post: 730143
SNC @ 2014.03.06 17:32  Post: 730101
Na papierze mocniejsze od tegrak1, ciekawe kiedy premiera i ile W bedzie pobierac

W FP32 raczej dużo gorszy. W FP16 trochę szybszy (k1 ma taka sama wydajność co w FP32 czyli 360 gflops). Ale to wystarczy bo gry mobilne używają zazwyczaj 16bitowej precyzji obliczeń.

Bardziej mialem na mysli przepasc 12 vs 4 ropy
anemusZobacz profil
Poziom ostrzeżenia: 0%
anemus2014.03.06, 20:40
-4#9
viris33 @ 2014.03.06 20:13  Post: 730138
Jaką to bedzie miało wydajność porównując do mobilnej GPU w laptopach lub w desktopie ?

Żadną.
*Konto usunięte*2014.03.06, 20:52
SNC @ 2014.03.06 20:32  Post: 730144
skoti48 @ 2014.03.06 20:29  Post: 730143
(...)

W FP32 raczej dużo gorszy. W FP16 trochę szybszy (k1 ma taka sama wydajność co w FP32 czyli 360 gflops). Ale to wystarczy bo gry mobilne używają zazwyczaj 16bitowej precyzji obliczeń.

Bardziej mialem na mysli przepasc 12 vs 4 ropy

I to może mieć duże znaczenie, bo na smartfonach/tabletach są coraz wyższe rozdzielczości.

skoti48 @ 2014.03.06 20:29  Post: 730143
SNC @ 2014.03.06 17:32  Post: 730101
Na papierze mocniejsze od tegrak1, ciekawe kiedy premiera i ile W bedzie pobierac

W FP32 raczej dużo gorszy. W FP16 trochę szybszy (k1 ma taka sama wydajność co w FP32 czyli 360 gflops). Ale to wystarczy bo gry mobilne używają zazwyczaj 16bitowej precyzji obliczeń.


Czemu?

PS
Tak się zastanawiałem, ale czy aby te układy nie będą mocniejsze od Kabini? Jakby nie patrzeć Brazos zaoferował moc niedostępną dla ARM-a przez długi czas... Kabini już dostanie zadyszki, a wygląda na to, że konkurencja rozwija się szybciej.
Zaloguj się, by móc komentować
1