artykuły

Wyciskanie soków z Sandy Bridge – fakty i mity na temat podkręcania procesora oraz specjalnie przeznaczonej do niego pamięci

Rozwiewamy wątpliwości

72
12 lutego 2011, 14:19 Mateusz Brzostek

Prędkość pamięci a wydajność

W wielkim teście pamięci DDR3 sprawdzaliśmy, jak cały podsystem pamięci wpływa na wydajność. W trzech platformach, które badaliśmy, trzy parametry miały istotny wpływ na ogólną wydajność komputera: taktowanie pamięci, opóźnienia pamięci i taktowanie części uncore procesora. Słowem uncore w przypadku platform: AM3, LGA1366, LGA1156, była określana część procesora zawierająca między innymi kontroler RAM-u i pamięć podręczną trzeciego poziomu.

W procesorach Sandy Bridge termin uncore nie ma już zastosowania. Pamięć podręczna trzeciego poziomu jest połączona z rdzeniami procesora, kontrolerem pamięci i zintegrowanym układem graficznym przez magistralę pierścieniową. Zarówno magistrala, jak i sama pamięć L3 działają z takim samym taktowaniem jak rdzenie procesora.

Tu należy się kilka słów wyjaśnienia: co w wypadku, gdy jeden z rdzeni działa szybciej, bo wszedł w stan Turbo? Otóż wszystkie wielordzeniowe procesory Intela mają w rzeczywistości tylko jeden mnożnik rdzeni, który wraz z zegarem bazowym służy do otrzymania sygnału taktującego. Ten mnożnik zawsze odpowiada taktowaniu najszybszego rdzenia. Jeśli na przykład liczymy próbkę SuperPi przypisaną do jednego wątku na procesorze i5-2400, to mnożnik wynosi ×34 (100 × 34 = 3400 – maksymalne taktowanie Turbo jednego rdzenia). W tym samym czasie trzy pozostałe rdzenie nie są obciążone, ale też nie działają z częstotliwością 3,4 mld cykli na sekundę. Nieobciążone rdzenie są przez system operacyjny przełączane w niski stan energetyczny: C1, C1E, C3 lub C6. W zależności od stanu rdzenie wykonują instrukcje HLT (halt) lub MWAIT, a wtedy większość jednostek wykonawczych jest nieaktywna. Dodatkowo sygnał zegarowy i napięcie zasilające są odcinane od poszczególnych części rdzenia, lub nawet od całego rdzenia, a zawartość pamięci L1 i L2 jest przenoszona do L3. Ponieważ magistrala pierścieniowa i pamięć L3 muszą obsłużyć najszybszy rdzeń, też działają z najwyższą częstotliwością. Jest to zasadnicza różnica w stosunku do poprzedniej generacji procesorów Core. Pamięć L3 w Core i5-750 działa z prędkością 2,13 GHz, a w Core i5-2400 – nawet do 3,40 GHz, czyli o ponad połowę szybciej!

Ponieważ pamięć L3 działa z częstotliwością rdzeni, nie ma już dodatkowego, trzeciego taktowania, wpływającego na wydajność. Istotne są już tylko parametry zegara rdzeni i pamięci. Przy podkręcaniu jest więc o jedną zmienną mniej.

Podobnie jak w wielkim teście DDR3 zaczęliśmy od sprawdzenia, jak duże są różnice w wydajności między bardzo szybkim a bardzo wolnym podsystemem pamięci. Szybkim ustawieniem było DDR3-2133 (najwyższy działający mnożnik) i opóźnienia 9-11-9-27, dostępne dla większości tak szybkich zestawów. Wolnym ustawieniem było DDR3-1333 (największa oficjalnie obsługiwana częstotliwość) i takie same opóźnienia.

Dla dociekliwych przedstawiamy wyniki pomiaru przepustowości pamięci z programów Sandra i AIDA64 (dawniej Everest). Jako testy syntetyczne, nie mają one wpływu na naszą ocenę i służą tylko do diagnozowania potencjalnych problemów.

Sandra 2011 17.25
(Kliknij na nazwę testu w tabelce, aby otworzyć wykres)
przepustowość int przepustowość float opóźnienie
AIDA64
(Kliknij na nazwę testu w tabelce, aby otworzyć wykres)
odczyt zapis
kopiowanie opóźnienie

Nie zauważyliśmy żadnych anomalii: przepustowość rośnie, a opóźnienie w dostępie maleje. Różnice między wynikami uzyskanymi w poszczególnych programach biorą się z różnych sposobów mierzenia przepustowości.

3DMark11 – Performance
(Kliknij na nazwę testu w tabelce, aby otworzyć wykres)
wynik ogólny wynik GPU
wynik Physics wynik Combined

Resztę wyników i komentarz do nich przedstawiamy na następnych stronach.

9