Jeśli ktoś śledził uważnie PCLab.pl trzy miesiące temu, to zapewne nie jest zaskoczony, a jeżeli nie śledził, to ma doskonałą okazję wrócić do naszego pierwszego spojrzenia na procesory Gulftown. Artykuł został wcześniej usunięty na prośbę Intela, a teraz będzie jak znalazł, bo wielu zawartych w nim informacji nie będziemy musieli powtarzać. A zatem, jeśli nie wiesz jeszcze, co to jest Gulftown, marsz do lektury!
Leniwym, którzy jeszcze nie kliknęli na odnośnik, przypomnimy parę faktów. Procesor należy do rodziny Westmere, czyli układów zbudowanych w mikroarchitekturze Nehalem, ale wykonanych w bardziej zaawansowanym procesie technologicznym 32 nm. Procesory Westmere stanowią Tick w intelowskiej strategii Tick-Tock, zakładającej wprowadzanie co dwa lata nowej mikroarchitektury, a w latach pomiędzy – nowego procesu technologicznego. I tak po procesorach Core i7-900 i Core i7-800 przyszedł czas na Core i5-600 i Core i3, pierwsze układy Westmere, a dziś – na Core i7-980X, pierwszy sześciordzeniowiec dla zwykłych (ale bogatych) konsumentów.
Podobnie jak poprzedni Tick (procesory Penryn, czyli Core 2 Duo 45 nm) Westmere to nie tylko zmiana wielkości tranzystora. Wprowadzono kilka usprawnień w architekturze procesora, między innymi nowe zestawy instrukcji: AES-NI, wspomagające szyfrowanie, oraz SSE4.2, multimedialne.
Jądro Gulftown
Zgodnie z ideą modularności, w myśl której Intel może zaprojektować procesor z dowolną kombinacją rdzeni, kontrolerów pamięci, układów graficznych i bloków pamięci podręcznej, Gulftown bardzo przypomina jądro Bloomfield. Do jądra z czterema rdzeniami, trzykanałowym kontrolerem pamięci i kontrolerem QPI dołożono dwa rdzenie:
Pozostawiono bez zmian stosunek pojemności pamięci podręcznej do liczby rdzeni: w sumie nowy procesor ma 12 MB pamięci podręcznej trzeciego poziomu, współdzielonej między wszystkie rdzenie.
Pod względem taktowania, mnożników i działania trybu Turbo nowy procesor jest prawie identyczny z Core i7-975 Extreme Edition:
Procesor
Do naszej redakcji dotarł egzemplarz inżynieryjny:
Z zewnątrz procesor nie różni się od starszych Core i7.
W pudełku znajdziecie procesor, schładzacz wraz z instrukcją jego montażu w kilku językach, w tym po polsku i angielsku, oraz tubkę pasty termoprzewodzącej. Porcja pasty wystarcza na jedną instalację procesora. Schładzacz jest nową konstrukcją – Intel jeszcze nie sprecyzował, czy od tej pory będą go miały wszystkie procesory Extreme Edition czy tylko i7-980X.
Schładzacz ma układ wieżowy, z czterema ciepłowodami w kształcie litery U przenoszącymi ciepło z miedzianej podstawy do aluminiowych blaszek. Propagowany przez tyle lat sposób mocowania na plastikowe kołeczki z zatrzaskami został zastąpiony plastikowym backplate'em i czterema śrubami. Taki system jest o wiele pewniejszy i bardziej trwały – kołeczki rozlatywały się po dłuższym okresie częstego odpinania i zapinania. Mimo to wciąż nie zapewnia takiej sztywności i siły docisku jak schładzacze Thermalrighta, Noctuy czy Prolimatecha z wyższej półki.
Podstawa jest cienka i przylega do ciepłowodów tylko od spodu, podobnie jak w popularnym kiedyś modelu Tuniq Tower. Ciepłowody zostały przylutowane i do podstawy, i do blaszek.
Do schładzacza dołączono na stałe wentylator PWM firmy Nidec o mocy 9,6 W i zakresie prędkości od 800 do 2100 obr./min. Podczas normalnego użytkowania wentylator nie przyspiesza do więcej niż 1200 obr./min i pozostaje bardzo cichy. Powyżej tej wartości staje się wyraźnie słyszalny.
Częścią wentylatora jest umieszczony w łatwo dostępnym miejscu na szczycie schładzacza przełącznik prędkości obrotowej. W obu pozycjach prędkością steruje płyta główna, ale w pozycji Q minimum to około 800 obr./min., a w pozycji P – około 1200 obr./min.
Zestaw testowy
Mimo że egzemplarze inżynieryjne Gulftownów są w obiegu już od kilku miesięcy, to do wielu płyt głównych wciąż nie ma nowych wersji BIOS-u obsługujących wszystkie funkcje oszczędzania energii, a przy tym działających poprawnie i stabilnie. Z tego powodu do testów wydajności i poboru energii wykorzystaliśmy płytę Intela DX58SO Smackover. To powinno przy okazji rozwiać wszelkie wątpliwości co do obsługi nowych procesorów przez stare płyty; jak widać, nawet jednej z pierwszych konstrukcji z podstawką LGA1366 wystarczyła aktualizacja BIOS-u.
Model | Dostarczył | |
---|---|---|
Schładzacz procesora: | Prolimatech Megahalems + wentylator Noctua NF-P12 | www.prolimatech.com |
Płyta główna LGA1366: | Intel DX58SO Smackover | www.intel.pl |
RAM: | GoodRAM PRO DDR3-2000 | www.goodram.com |
Karta graficzna: | ATI Radeon HD 5870 | www.hisdigital.com |
Dysk twardy: | OCZ Agility SSD 120 GB | www.ocztechnology.com |
Zasilacz: | Enermax REVOLUTION85+ 850 W | www.enermax.pl |
Monitor: | Acer P241w (24 cale, 1920×1200) | www.acer.pl |
Stali Czytelnicy zapewne pamiętają, że niedawno zmieniliśmy zestaw testowy i sporą część metodyki. Na dalszych stronach, przed pokazaniem wyników z danego testu, postaramy się ogólnie wyjaśnić sposób jego przeprowadzenia.
Testy syntetyczne – Sandra
W nowym zestawie testów pozostał program SiSoftware Sandra, ale używamy teraz najnowszej wersji 16.26, która wśród licznych usprawnień ma obsługę nowych zestawów instrukcji AES i SSE4.2. Optymalizacje AES i SSE4.2 były włączone podczas testów, co miało wpływ na wyniki procesorów Core i5-661 oraz Core i7-980X.
Wszystkie obliczenia w Sandrze są przeprowadzane wielowątkowo, więc nikogo chyba nie dziwi miażdżąca przewaga 980X nad najbliższym rywalem, i7-975.
Następnie sprawdziliśmy wydajność podsystemu pamięci.
Gdy po raz pierwszy zetknęliśmy się z Gulftownem, zwróciliśmy uwagę na niższą niż w Bloomfieldach przepustowość pamięci. Ogromna różnica na niekorzyść Gulftowna znacznie zmalała w finalnym produkcie (albo raczej: w dopracowanym BIOS-ie), ale pozostaje zauważalna. Jest to prawdopodobnie konsekwencja zmiany stosunku taktowania uncore do taktowania pamięci. W Bloomfieldach uncore musiał działać co najmniej z dwukrotną częstotliwością działania pamięci; w innych procesorach z rodziny Nehalem i Westmere ten stosunek wynosi 2:3. Uncore może zatem działać wolniej i rzadziej ogranicza taktowanie pamięci. Żeby to osiągnąć, najprawdopodobniej trzeba było wprowadzić rodzaj dodatkowego bufora lub kolejki w kontrolerze pamięci, co trochę zwiększyło opóźnienie i obniżyło przepustowość. Tak czy inaczej, 21 GB/s to wciąż wystarczająco dużo w większości zastosowań.
OMP-Test 64-bitowy
Program oblicza wielowątkowo rozwinięcie szesnastkowe liczby π metodą Baileya-Borweina-Plouffego, korzystając z funkcji OpenMP. Jest dostępny do pobrania tutaj. Wymaga zainstalowanych pakietów Microsoft .NET Framework 2.0 oraz Visual C++ Redistributable.
Następne zwycięstwo 980X. 12 wątków wykonało te same obliczenia w czasie o jedną trzecią krótszym niż osiem wątków w Core i7-975.
Arena + Cyclone xTreme II
Czas na nowoczesny silnik szachowy działający pod kontrolą interfejsu Arena. Sposób testowania już opisywaliśmy.
Proszę się rozejść, tu nie ma niczego nowego... Skalowanie po dodaniu 50% wątków wynosi ponad 42% – doskonały wynik, jak na oprogramowanie, które niczego nie renderuje :)
Microsoft Excel 2010 – symulacja Monte Carlo
Teraz najnowsza wersja pakietu biurowego Microsoftu i symulacja Monte Carlo. Po załadowaniu pliku z danymi wydajemy polecenie wygenerowania losowych parametrów i przeliczenia wszystkich funkcji. Excel potrafi wykorzystać do tego nawet 16 wątków.
Skalowanie nie jest tak dobre jak w testach syntetycznych, ale widać zauważalny zysk z dwóch dodatkowych rdzeni.
TrueCrypt
Popularny program do szyfrowania plików, partycji, a nawet całych dysków. Należy do otwartego oprogramowania. Korzystamy z wbudowanego testu wydajności z opcją kodowania próbki 500 MB trzema algorytmami po kolei.
Konkurencja, a raczej młodsi bracia, daleko w tyle. Znów przykład prawie doskonałego skalowania: 50% więcej wątków wykonawczych, 48% dodatkowej wydajności.
x264
Test kodowania pozostał bez zmian: konwertujemy ponad 2-gigabajtowy plik wideo na format H.264.
Konkurencja, a raczej młodsi bracia, daleko w tyle. Znów przykład prawie doskonałego skalowania: 50% więcej wątków wykonawczych, 48% dodatkowej wydajności.
Cinebench R11.5
Program testowy oparty na silniku programu do animacji komputerowej CINEMA 4D. Nowa wersja Cinebencha umie obdzielić pracą nawet 64 wątki. Obraz jest w niej podzielony na wiele mniejszych części, przyspieszono też rozpoczynanie nowych wątków i kończenie tych, które już wszystko wykonały.
Mamy do czynienia z „siłowym” rozwiązaniem. W teście jednowątkowym Gulftown jest tak samo szybki jak Bloomfield o takim samym taktowaniu, ale w wielowątkowym uzyskuje prawie 50-procentową przewagę – znów doskonałe skalowanie.
POV-Ray 64-bitowy
Następny darmowy renderer, tym razem nie tylko benchmark, ale i w pełni funkcjonalny program, który można wykorzystać w profesjonalnych produkcjach.
Zysk z dwóch dodatkowych rdzeni wynosi jakieś 35–40%. Skalowanie nie oszałamia, ale i tak jest dobre.
7-Zip
Popularny darmowy program do archiwizacji plików. W swoim teście mierzymy czas kompresji w czterech różnych scenariuszach: dwa różne rodzaje danych (dużo małych plików lub jeden duży) i dwa rodzaje kompresji (LZMA lub ZIP). W kompresji ZIP program wykorzystuje do 16 wątków, w kompresji LZMA – maksymalnie dwa.
Niezależnie od metody kompresji i pliku wejściowego Core i7-980X jest najszybszy. Największą przewagę widać w wielowątkowej kompresji wielu małych plików metodą ZIP.
Adobe Photoshop CS4
Rozbudowany program do edycji grafiki rastrowej. Test wydajności polega na zmierzeniu czasu, w jakim komputer ukończy 15 zadanych operacji na obrazie źródłowym. Używamy zestawu operacji przygotowanego przez ekspertów z portalu Driverheaven.
Wbrew pozorom najszybszy okazuje się Core i7-975. Najprawdopodobniej różnica wynika z szybszego dostępu do pamięci w Bloomfieldach.
Adobe AfterEffects CS4
AfterEffects jest programem do edycji i montażu wideo. W teście mierzymy czas wyrenderowania klipu składającego się z 25 różnych zdań.
I znów i7-980X na czele. AfterEffects może więcej zadań niż Photoshop rozdzielić między dużą liczbę wątków, co znacznie ułatwia pracę użytkownikom procesorów wielordzeniowych.
3DMark06
Choć już leciwy, 3DMark06 wciąż dobrze odzwierciedla działanie niektórych gier i jest bardzo wrażliwy na moc procesora.
Odkąd sterowniki do kart graficznych są wielowątkowe, dwa dodatkowe rdzenie w Gulftownie poprawiają zarówno wynik w teście CPU, jak i we wszystkich czterech testach graficznych. Dzięki temu Core i7-980X jest w tym benchmarku najszybszym procesorem w zestawieniu.
3DMark Vantage
Końcowy wynik w Vantage w mniejszym stopniu zależy od mocy procesora, ale testy CPU w tym benchmarku symulują rzeczywiste zastosowania: sztuczną inteligencję przeciwników i obliczenia fizyczne.
Wyniki testu GPU nie wykazują niczego niezwykłego. Z obsługą karty HD 5870 Gulftown radzi sobie tak samo jak Core i7-975. Oczywiście niespodzianka czeka w teście CPU: łatwe do zrównoleglenia obliczenia fizyki i sztucznej inteligencji są w Gulftownie wykonywane o połowę szybciej niż w Bloomfieldzie.
Gry
Przeprowadziliśmy oczywiście testy w grach. Opisywaliśmy już sposób testowania, więc teraz skupmy się na wynikach:
Niestety, w grach nie jest już tak różowo. W żadnej i7-980X nie jest znacząco szybszy od tak samo taktowanego i7-975, co znaczy, że dodatkowe cztery wątki praktycznie nie robią różnicy. Jak pokazuje przykład symulacji efektów cząsteczkowych w silniku Source, pewne części kodu gry da się doskonale zrównoleglić. W prawdziwych grach jest ich jednak tak mało, że najczęściej wystarczy procesor o więcej niż dwóch rdzeniach, żeby uzyskać wszystkie korzyści z wielowątkowości w grze.
Podkręcanie
Czym byłby test procesora bez podkręcania, szczególnie jeśli mamy do czynienia z nowym procesem technologicznym? Większość z nas pamięta pojawienie się 45-nanometrowych procesorów Core 2 Duo, które w porównaniu ze starszymi modelami wykonanymi w technologii 65 nm podkręcały się po prostu rewelacyjnie. Na rynku od ponad dwóch miesięcy są też inne procesory wykonane w procesie technologicznym 32 nm: cała rodzina Clarkdale, czyli dwurdzeniowe Core i3 i Core i5. Musimy tu wspomnieć o tym, na co trzeba zwrócić największą uwagę przy podkręcaniu: o napięciu. Dla procesorów Bloomfield (Core i7-900) oraz Lynnfield (Core i7-800, Core i5-700) Intel podaje maksymalne dopuszczalne napięcie rdzenia równe 1,55 V, a maksymalne napięcie VTT (czyli części uncore) – 1,35 V. Niższe procesy technologiczne z reguły wymagają coraz niższych napięć i coraz niższe tolerują, co potwierdza dokumentacja procesora i7-980X. Maksymalne napięcie rdzenia określono w niej na 1,4 V i taką samą wartość podano dla VTT. Może to oznaczać, że część uncore procesora będzie teraz lepiej znosić wyższe napięcia, mimo niższego procesu technologicznego. Mimo to zalecamy ostrożność i nieprzekraczanie pułapu 1,4 V, przynajmniej dopóki nie zbierzemy więcej danych na temat możliwych szkód w strukturze tych procesorów powstałych pod wpływem wysokiego napięcia.
Przypomnijmy, że procesor Core i3-530 udało nam się podkręcić do niespełna 4,5 GHz; testowany przez nas trzy miesiące temu egzemplarz inżynieryjny Gulftowna dał się przyspieszyć do 4,2 GHz. Opisywany dziś układ dał się przyspieszyć do 4257 MHz:
W trakcie prób podkręcania procesor był chłodzony dołączonym do niego nowym układem. Inaczej niż w przypadku takich procesorów, jak Core 2 Quad Q6600 albo Core i7-920, ilość wydzielanego ciepła nie powinna być problemem przy podkręcaniu z użyciem chłodzenia powietrzem lub wodą. Czynnikiem ograniczającym będzie zastosowane napięcie oraz jakość danego układu.
Niestety, płyta Intela DX58SO działała bardzo niestabilnie i nieprzewidywalnie po przetaktowaniu do podobnych wartości, dlatego testy podkręcania przeprowadziliśmy na płycie ASUS P6T7 WS Supercomputer. W związku z tym wyników przedstawionych na następnej stronie nie należy porównywać.
Podkręcanie – testy wydajności
Podkręcony i7-980X zyskuje od 10 do 30% wydajności – a w rzeczywistości jeszcze więcej, bo płyta P6T7 WS Supercomputer jest przy takich samych zegarach nieco wolniejsza od płyt bez mostka NF200.
Pobór energii
Poprzednio testowany Gulftown zaskoczył nas niskim poborem energii. Sprawdziliśmy, czy przed oficjalnym wprowadzeniem coś jeszcze się zmieniło:
Bezsprzecznie pierwszy w rankingu wydajności, Core i7-980X na szczęście nie jest pierwszy pod względem prądożerności. Pod obciążeniem procesor pobiera mniej energii od Core i7-975 i zapewne od wielu sztuk niższych modeli Core i7-900. Oczywiście Gulftown pozostaje jednym z najbardziej prądożernych procesorów w zestawieniu, ale czego się spodziewać po sześciordzeniowcu?
Podsumowanie
W ramach ciekawostki przypomnijmy podsumowanie recenzji procesora Core 2 Quad QX9770, opublikowanej ponad dwa lata temu:
„Core 2 Extreme QX9770 to procesor wprowadzony trochę na siłę. I tak Intel nie ma obecnie rywala na polu wydajności, a jego procesor Core 2 Extreme QX9650 jest jak dotąd niepokonany. Po co zatem kolejny, jeszcze szybszy model? (...) Odpowiedź jest dość prosta: chęć odwrócenia uwagi od Phenoma, który pojawił się dokładnie tego samego dnia (...)”.
Wiedząc, że wielkimi krokami nadchodzą sześciordzeniowe procesory AMD o nazwie roboczej Thuban, trudno przegapić pewne podobieństwa do sytuacji sprzed dwóch lat :)
Chyba najważniejszą rzeczą, jakiej nauczyły nas obie recenzje nowych sześciordzeniowców Intela, jest opłakany stan przemysłu oprogramowania. Nawet nasza metodyka, w której zwracamy uwagę na wielowątkowość programów, nie zawsze zapewnia różnice między dwu- a sześciordzeniowcem. Oczywiście, najwięcej jest procesorów dwurdzeniowych, a sześciordzeniowce jeszcze długo (a może nigdy?) nie będą powszechne, ale to nie powinien być powód do stania w miejscu. Na rynku konsumenckim już od wielu lat są dostępne tylko procesory 64-bitowe i większość to układy o więcej niż jednym rdzeniu. Oprogramowanie jednowątkowe i 32-bitowe powinno wyginąć razem z niesprzedawanym już sprzętem. Ponad rok temu pisaliśmy w recenzji pierwszych Core i7, że na pewno przyspieszą upowszechnienie się wielowątkowego oprogramowania, tymczasem wciąż niewiele się zmieniło.
W takiej sytuacji procesory Gulftown mogą nie trafić na podatny grunt. Co prawda Intel ma zamiar sprzedawać i7-980X po cenie Core i7-975, co na pewno ułatwi wybór niezdecydowanym, ale i tak rynek takich procesorów pozostanie mały. Gulftowny na początku trafią do rąk entuzjastów ekstremalnego podkręcania, którzy nigdy nie uruchomią ich z domyślnym taktowaniem. Pewna liczba w postaci tańszych, serwerowych sześciordzeniowców z zablokowanym mnożnikiem trafi zapewne do mniej ekstremalnych entuzjastów.
Ale dość o sytuacji na rynku i układach, o których poza ich użytkownikami mało kto już pamięta. Napisaliśmy trzy miesiące temu, że Gulftown to „shock and awe” – i to wrażenie nie opuszcza nas. Po prostu nie ma nic wydajniejszego, nic o lepszym stosunku wydajności do zużycia energii, nic o większym potencjale w biciu rekordów świata w podkręcaniu, i to w dniu wprowadzenia. A cena? Cóż, w domach wszyscy mamy tańsze procesory :)
Do testów dostarczył: Intel
Cena w dniu publikacji (z VAT): ok. 3600 zł