artykuły

W 80 rdzeni dookoła przyszłości

95
18 lutego 2007, 20:22 Ryszard Sobkowski

Wydajność i moc

Przejdźmy wreszcie do tego, co jest najistotniejsze w całym przedsięwzięciu – do osiągów układu i ponoszonych na ich rzecz kosztów w postaci poboru mocy i związanych z nim problemów.

Układ może pracować przy bardzo szerokim zakresie napięć zasilających. Oczywiście im wyższe napięcie, tym wyższa jest także osiągana częstotliwość pracy, a co za tym idzie, wydajność.

Wykres osiągów

Tak wyglądały wczesne charakterystyki układu. Jak widać, aby osiągnąć wydajność jednego teraflopsa, procesor musi pracować z zegarem 3,13 GHz i napięciem zasilającym niespełna 1 V. Pobiera wówczas moc 98 W. Osiągnięcie wydajności 1,28 Tflops wymaga zegara 4 GHz i napięcia zasilającego 1,2 V – pobór mocy w takim trybie pracy wynosi 230 W. Ale to są osiągi z pierwszych testów. Obecnie Polaris ma nieco lepszą charakterystykę (tym razem wersja dla uczulonych na wykresy! ;-).

Tabela osiągów

Tym niemniej osiągnięcie wydajności 1,81 Tflops pociąga za sobą pobór mocy wynoszący 265 W. Strach się bać!

Chociaż Polaris nie jest układem użytkowym, od początku jego projektowania przewidziano szereg mechanizmów umożliwiających oszczędzanie energii.

Power saving

Każde z jąderek (PE) może być wprowadzone w stan oczekiwania, przy którym jest gotowe do natychmiastowego podjęcia pracy (dane pozostają zachowane w pamięci), albo stan uśpienia z wyłączonymi pamięciami. Z kolei wewnątrz PE wyznaczono aż 21 obszarów, które mogą być wprowadzane w stan uśpienia. Wszystko to sprawia, że gdy nie jest niezbędna pełna wydajność, pobór mocy znacznie spada.

Sekret szybkiego zegara

Chip układu Polaris ma spore rozmiary i generator zegara umieszczony na jednej z krótszych krawędzi. Rodzi to możliwość powstawania dużych różnic w czasie docierania sygnału zegara do różnych obszarów chipu, co stanowi poważny czynnik ograniczający możliwość przyspieszania zegara. Dzięki przemyślanej organizacji dystrybucji sygnału zegarowego w Polaris, jego opóźnienia nie są drastycznie duże, ale...

Opóźnienia zegara

... w niektórych rejonach chipu osiągają nawet 250 ps (pikosekund). Przypomnijmy, że w układzie Pentium 4 "Prescott" maksymalne opóźnienie zegara nie przekraczało 50 ps. A tymczasem Polaris, mimo tak dużych opóźnień sygnału, może pracować z zegarem o częstotliwości bliskiej 6 GHz. Jak to możliwe?

Wyjaśnienie zagadki zawarte jest w opisie schematu blokowego routera, w którym znajdujemy Mesochronous Interface MSINT – interfejs mezochroniczny. Okazuje się, że wszystkie jednostki PE i komunikacja pomiędzy nimi są wprawdzie taktowane tym samym zegarem, ale w sposób niewrażliwy na przesuniecie fazowe, dzięki czemu ewentualne opóźnienie zegara może wynosić nawet więcej niż połowę długości jego okresu. Tę cechę Polaris warto zapamiętać – przyda się przy rozważaniach na temat praktycznych zastosowań tego układu.

4