Platforma P55/LGA1156
Podstawowe informacje o nowej platformie przedstawiliśmy już w „rzucie oka” na płyty główne z podstawką LGA1156. Porównajmy budowę systemu komputerowego opartego na platformach: LGA775, LGA1156 i LGA1366:
Na diagramie przedstawiono blokowy schemat systemu LGA775. Centralnym punktem jest MCH (ang. Memory Controller Hub), czyli mostek północny P45. Procesor i mostek północny są połączone magistralą FSB (ang. Front Side Bus). Mostek zarządza wszystkimi zasobami komputera. To w nim znajduje się kontroler pamięci i kontroler złączy PCI Express – dane płynące do procesora i z procesora zawsze najpierw trafiają do mostka północnego. Układ MCH łączy się z mostkiem południowym przez łącze DMI (ang. Direct Media Interface), będące wyspecjalizowaną odmianą PCI Express. Mostek południowy kontroluje wszystkie urządzenia niewymagające ogromnej przepustowości między nimi a procesorem i pamięcią – kontrolery dysków, USB, sieci lokalnych itp.
Pojawienie się procesorów Core i7 przeznaczonych do podstawki LGA1366 przyniosło zmianę budowy całego systemu:
Kontroler pamięci, którego funkcje do tej pory spełniał układ MCH, przeniesiono do wnętrza procesora. Niepotrzebna dłużej magistrala FSB została zastąpiona łączem QPI (ang. QuickPath Interconnect), którego głównym zadaniem jest zapewnienie komunikacji między procesorami w systemach wieloprocesorowych i między procesorem a urządzeniami wejścia-wyjścia. Miejsce MCH zajął nowy układ IOH (ang. I/O Hub) – uboższy od MCH o kontroler pamięci, za to z łączem QPI. Podobnie jak w LGA775 IOH zawiera kontroler PCI Express i komunikuje się z mostkiem południowym przez łącze DMI.
Platforma LGA1156 to kolejny krok w kierunku uproszczenia płyty głównej i przeniesienia najbardziej krytycznych funkcji bliżej procesora:
Kontroler pamięci znajduje się w procesorze, podobnie jak w LGA1366. Kontroler PCI Express i DMI również został przeniesiony do wnętrza procesora. W systemie nie ma już magistrali QPI – nie jest już potrzebna. Część kontrolera PCI Express odpowiada za połączenie DMI z układem PCH (ang. Platform Controller Hub), który funkcjonalnie nie różni się zbytnio od mostków południowych w platformach LGA775 i LGA1366. Zmieniła się liczba poszczególnych złączy, ale zestaw funkcji pozostaje ten sam.
Przeniesienie kontrolera PCI Express do procesora zmienia nieco segmentację rynku płyt głównych i procesorów. Do tej pory płyty były podzielone funkcjonalnie według liczby złączy PCI Express. Chipsety Intel X38 i X48, przeznaczone na najwyższy segment rynku, miały po 32 pasy PCI Express, co umożliwiało konfigurację 2× PCI Express ×16, przydatną szczególnie w systemach z dwoma kartami graficznymi połączonymi w technice CrossFire. Chipsety P35 i P45 miały po 16 pasów PCI Express, co umożliwiało podłączenie jednej karty graficznej w trybie PCI Express ×16 lub dwóch kart, z których każda była połączona z mostkiem północnym przez PCI Express ×8 (co ustępowało wydajnością konfiguracji 2× PCI Express ×16). Zatem możliwości podłączenia wielu kart graficznych lub innych urządzeń, takich jak kontrolery RAID, zależały tylko od płyty głównej. Użytkownik, kupując płytę, decydował się na jakiś segment rynku, a do wybranego modelu mógł dokupić dowolny procesor – zarówno najtańszy dwurdzeniowy, ze zmniejszoną ilością pamięci podręcznej, jak i najpotężniejszy czterordzeniowiec.
Platformy LGA1366 i LGA1156 zmieniają tę sytuację. Kontroler PCI Express jest teraz powiązany z procesorem, a pośrednio – także z podstawką. Platforma LGA1366 zastępuje segment płyt głównych z chipsetem X38 i X48 – płyty z tą podstawką mają po 32 pasy PCI Express i umożliwiają stosowanie konfiguracji SLI i CrossFire przy pełnej przepustowości złączy PCI Express. Platforma LGA1156 z 16 pasami PCI Express zastępuje funkcjonalnie chipsety P35 i P55 i umożliwia wykorzystanie SLI lub CrossFire tylko w konfiguracji 2× PCI Express ×8. Zauważcie, że wybór procesora jest teraz związany z podsystemem graficznym, a żeby przejść do innej klasy funkcjonalnej, trzeba zmienić nie tylko płytę, ale i procesor.
Pozostałe konsekwencje takiej zmiany w platformie są ze wszech miar pożądane. Pozbycie się z płyt głównych prądożernego i kosztownego łącza QPI powinno zmniejszyć pobór mocy. Podobnie wyeliminowanie mostka północnego jako oddzielnego układu nie tylko obniży pobór mocy, ale i uprości budowę płyt głównych (miejmy nadzieję, że również obniży ich ceny).
Rdzeń Lynnfield
Pierwsze procesory LGA1156 są oparte na nowym rdzeniu o nazwie kodowej Lynnfield. Lynnfield jest przedstawicielem znanej nam już prawie od roku mikroarchitektury Nehalem. Dokładny opis tej mikroarchitektury przedstawiliśmy w dniu pojawienia się procesorów Core i7 Bloomfield w dwóch artykułach: Intel Core i7 – czas na modernizację? oraz Podkręcanie Core i7 – poradnik. Są one niezbędne do dobrego zrozumienia budowy procesorów Lynnfield.
Sam rdzeń Lynnfield niewiele się różni od Bloomfielda. Sposób wykonywania instrukcji pozostał bez zmian, co więcej, oba rdzenie są prawie identycznie zbudowane, jeśli chodzi o strukturę krzemową. Wśród materiałów na temat Lynnfieldów udostępnionych przez Intela znalazło się opisane zdjęcie rdzenia:
Wyróżniono podstawowe bloki funkcjonalne: wszystkie cztery rdzenie, pamięć podręczną L3, kontroler pamięci, kolejkę rozkazów i kontroler PCI Express. Ten schemat nie jest jednak zbyt dokładny i nie zawiera precyzyjnych informacji, dlatego pozwoliliśmy sobie przygotować własny:
Porównanie ze zdjęciem rdzenia Bloomfield jest już znacznie bardziej pouczające. Oba rdzenie są w tej samej skali; na ilustrację nanieśliśmy ich przybliżone wymiary. Porównanie dwóch rdzeni pokazuje wyraźnie, że jądro Lynnfield ma większą powierzchnię niż Bloomfield. O 12% większa powierzchnia oznacza, że koszt wyprodukowania jednego Lynnfielda jest o ponad 12% większy niż w przypadku jednego Bloomfielda. Dlaczego ponad? Bo im większy układ krzemowy, tym mniejszy uzysk ze względu na odpad na brzegach wafla i tym większa strata w wypadku wystąpienia defektu w jego strukturze krystalicznej. Najwyraźniej Intel jest bardzo pewny swojego procesu produkcyjnego, skoro decyduje się sprzedawać układy większe niż Bloomfield w niższej cenie.
Na ilustracji widać, że za powiększeniem układu stoi przede wszystkim umieszczenie w nim kontrolera PCI Express (a przynajmniej części oznaczonej tak na zdjęciu udostępnionym przez Intela). Struktury widoczne po prawej stronie czterech rdzeni mają powierzchnię około 43,9 mm2 – prawie 15% całego rdzenia i o ponad połowę więcej, niż ma jeden rdzeń z pamięcią podręczną L1 i L2 (28,1 mm2). Dla porównania: powierzchnia układu X58 wynosi około 92,6 mm2, czyli ponad dwa razy tyle. Co prawda X58 oprócz kontrolera PCI Express ma też dwa łącza QPI i jest wykonany w innym procesie technologicznym (65 nm), ale nie ulega wątpliwości, że dzięki obcięciu powierzchni kontrolera o połowę i przeniesieniu jej do procesora poprawi się pobór energii i zmniejszy koszt całej platformy.
Zintegrowany kontroler pamięci
Jednym z głównych założeń przyjętych przez inżynierów pracujących nad mikroarchitekturą Nehalem była jej modularność. Intel chciał przygotować sobie podstawowe bloki funkcjonalne, które następnie mógłby produkować i sprzedawać w różnych konfiguracjach bez konieczności przeprojektowywania całego układu krzemowego.
Lynnfield jest pierwszym znakiem, że w jakimś stopniu założenie zostało zrealizowane: do znanego z Bloomfielda bloku czterech rdzeni dodano blok kontrolera PCI Express, a usunięto blok kontrolera QPI. Jednak na pokazanym rok temu schemacie widać blok oznaczony IMC – zintegrowany kontroler pamięci. Wszystkie procesory LGA1156 mają dwukanałowy kontroler pamięci, w odróżnieniu od procesorów LGA1366, które mają kontroler trzykanałowy. Mimo to na zdjęciu rdzenia wyraźnie widać, że budowa kontrolera pamięci jest w Lynnfieldach prawie identyczna jak w Bloomfieldach:
Oznacza to, że Lynnfield też mógłby mieć trzykanałowy kontroler pamięci – ale w podstawce i na płytach głównych odpowiednie wyprowadzenia ze struktury krzemowej nie są podłączone. Wyprowadzenie dwóch kanałów pamięci na płytę główną zajmuje 288 z 1156 pól kontaktowych w podstawce; dodanie 144 znacznie zwiększyłoby koszt procesora i podstawki, niewspółmiernie do możliwej do uzyskania w ten sposób wydajności. Dziwi jedynie, czemu Intel nie zdecydował się zaprojektować bloku dwukanałowego kontrolera pamięci i zaoszczędzić nieco na powierzchni rdzenia i liczbie tranzystorów.
Tryb TURBO
Przypomnijmy krótko, że w laptopowych wersjach procesorów Penryn, a potem w procesorach Core i7 serii i7-900 zastosowano specjalny tryb działania technologii EIST. Mowa o technice TURBO – przyspieszaniu rdzeni procesora wraz z rosnącym zapotrzebowaniem na wydajność, o ile pozwalają na to warunki termiczne i elektryczne. W Nehalemach specjalna jednostka PCU (ang. Power Control Unit – jednostka kontroli mocy) wewnątrz procesora monitoruje temperatury w różnych miejscach struktury krzemowej, napięcie i natężenie prądu zasilającego procesor oraz nadchodzące przerwania. Algorytm na podstawie natężenia prądu szacuje ilość wydzielanego przez procesor ciepła. Jeśli przerwania nadchodzą często lub system operacyjny wyda polecenie ustawienia rdzenia w stan najwyższej wydajności, a jednocześnie natężenie utrzymuje się poniżej zadanego limitu – PCU czasowo zwiększa taktowanie poszczególnych rdzeni. W procesorach Bloomfield funkcja TURBO mogła przyspieszyć dwa, trzy lub cztery rdzenie o jeden stopień mnożnika, a jeden rdzeń – o dwa stopnie. Warunkiem przyspieszenia jednego rdzenia o dwa stopnie było przejście co najmniej jednego rdzenia w stan energetyczny C6 (najniższe taktowanie, odłączone zasilanie). Na większości płyt głównych mnożnik TURBO +2 nie działał w typowych sytuacjach – tylko po wyłączeniu wszystkich rdzeni oprócz jednego w BIOS-ie płyty głównej.
W Lynnfieldzie działanie PCU zostało znacznie usprawnione – zarówno pod względem usypiania niewykorzystywanych części procesora, jak i działania trybu TURBO. Kiedy warunki termiczne i energetyczne są spełnione, nowe procesory mogą przyspieszyć jeden rdzeń aż o pięć stopni mnożnika, dwa – o cztery stopnie, trzy lub cztery – o dwa stopnie. Do przyspieszenia jednego rdzenia również jest konieczne przejście innego rdzenia w stan uśpienia. Co dziwne, w większości przetestowanych przez nas płyt głównych możliwość przejścia procesora w stan energetyczny C6 była domyślnie wyłączona. Intel udostępnia prostą aplikację do sprawdzenia działania TURBO – jest to widżet do paska Sidebar w Windows Vista lub Windows 7. Nam bardziej przypadła do gustu może brzydsza, ale na pewno bardziej funkcjonalna aplikacja TMonitor autorstwa Francka Dellatre'a, twórcy słynnego CPU-Z.
Core i7-870, Core i7-860, Core i5-750
Dziś zostały wprowadzone trzy procesory: dwa należą do serii Core i7, a jeden będzie sprzedawany pod nową nazwą handlową Core i5. Jedyny przedstawiciel serii Core i5 jest w porównaniu z Core i7 pozbawiony technologii Hyper-Threading - czyli jest procesorem czterowątkowym. Takie posunięcie wydaje się podyktowane wyłącznie chęcią zróżnicowania gamy produktów, bo struktury odpowiedzialne za działanie HT są zbyt głęboko związane z samym rdzeniem procesora, żeby opłacało się je wyłączyć, tak jak defektywne bloki pamięci podręcznej w procesorach Core 2 Duo. Oprócz HT Core i5 jest uboższy o jeden mnożnik TURBO dla jednego rdzenia - maksymalne przyspieszenie wynosi 4×133 MHz = 533 MHz. Wszystkie procesory Core i7-800 i Core i5 mają zablokowany mnożnik uncore - taktowanie pamięci podręcznej L3 i zintegrowanego kontrolera pamięci można zmieniać tylko w Core i7 serii i7-900. W tabelce porównaliśmy podstawowe parametry trzech nowych układów, starszego Core i7-920 oraz Phenoma II X4 955 BE:
Core i7-870 | Core i7-860 | Core i5-750 | Core i7-920 | Phenom II X4 955 BE | |
---|---|---|---|---|---|
proces technologiczny | 45 nm HKMG | 45 nm SOI | |||
rdzeń | Lynnfield | Lynnfield-4T | Bloomfield | Deneb | |
całkowita pamięć podręczna L2 | 4×256 kB | 4×512 kB | |||
wspólna pamięć podręczna L3 | 8192 kB | 6144 kB | |||
rdzenie/wątki | 4/8 | 4/4 | 4/8 | 4/4 | |
taktowanie | 2,93 GHz | 2,8 GHz | 2,67 GHz | 2,67 GHz | 3,2 GHz |
taktowanie uncore | 2,4 GHz | 2,13 GHz | 2,13 GHz | 2,0 GHz | |
dostępne mnożniki uncore | ×18 | x16 | ×10 - ×30 | ×5 - ×31,5 | |
dostępne mnożniki pamięci | ×6, ×8, ×10, ×12 | ×6, ×8, ×10 | ×6 - ×16 | nd. | |
maksymalne taktowanie 1 rdzenia | 3,60 GHz | 3,46 GHz | 3,20 GHz | 2,67 GHz | 3,2 GHz |
dostępne mnożniki TURBO | 5/4/2/2 | 4/4/2/2 | 2/1/1/1 | nd. | |
częstotliwość zegara referencyjnego | 133 MHz | 200 MHz | |||
VID (zakres) | 0,800-1,375 V | 0,875-1,425 V | |||
TDP | 95 W | 130 W | 95 W | ||
cena | 2030 zł | 1100 zł | 720 zł | 1030 zł | 700 zł |
Procesory LGA1156 pokazaliśmy już w ,,rzucie oka" na płyty z chipsetem P55 - jednak zamiast przedstawionego tam egzemplarza inżynieryjnego dostaliśmy do testów sklepowe wersje nowych procesorów:
Zestaw testowy
Zestaw testowy powinien być Wam znany z poprzednich recenzji, ale krótko przypomnimy, że wszystkie testy przeprowadzamy pod kontrolą 64-bitowej wersji systemu Windows Vista Ultimate z Service Packiem 1. Procesory Lynnfield były testowane na płycie Intel DP55KG (nazwa robocza Kingsberg), o której więcej można przeczytać w artykule o płytach głównych P55.
Model | Dostarczył | |
---|---|---|
Schładzacz procesora: | Pentagram FREEZONE HP-90 AlCu Alpaya P 7016 + wentylator PWM Arctic Cooling | www.pentagram.eu |
Płyta główna: | ASUS M4A79T Deluxe | www.asus.pl |
Płyta główna: | Foxconn BlackOps | www.foxconn.com |
Płyta główna: | ASUS P6T Deluxe | www.asus.pl |
Płyta główna: | Intel DP55KG Kingsberg | www.asus.pl |
Pamięć RAM: | OCZ Platinum OCZ3P1600EB4GK 2x 2 GB @ 1333 MHz 7-7-7-20 1T | redakcyjna |
Pamięć RAM: | Corsair Dominator GT 1866 3x 2 GB @ 1333 MHz 7-7-7-20 1T | www.asus.pl |
Karta graficzna: | NVIDIA GeForce GTX 280 | www.nvidia.pl |
Dysk twardy: | Seagate Barracuda 7200.11 320 GB | www.seagate.com |
Zasilacz: | Enermax REVOLUTION85+ 850 W | www.enermax.pl |
Monitor: | Acer P241w (24 cale, 1920×1200) | www.acer.pl |
Zmieniliśmy także zasilacz w platformie testowej: zamiast modelu Thermaltake 1000 W używamy teraz sprawniejszego (zwłaszcza przy niskim poborze mocy) Enermaksa REVOLUTION85+ 850 W.
Testy syntetyczne – Sandra
Na początek sprawdziliśmy, jak wydajność teoretyczną Lynnfieldów oceni Sandra XII:
Nowe Core i7 trafiają na samą górę stawki. W arytmetyce stałoprzecinkowej oba wygrywają z Core i7-920, w czym wyraźnie pomaga im wyższe o jeden mnożnik TURBO taktowanie. W testach syntetycznych kiepsko wypada czterowątkowy Core i5-750 – w testach multimediów wyprzedzają go Q9650 i oba Phenomy II X4.
Zmierzyliśmy następnie wydajność podsystemu pamięci procesorów:
Dwukanałowy kontroler pamięci w Lynnfieldach daje dużo mniejszą przepustowość niż trzykanałowy kontroler w Bloomfieldach, ale i tak ponad dwukrotnie wyprzedza procesory Intela poprzedniej generacji. Za to opóźnienie w dostępie do pamięci jest nieco lepsze niż w procesorach LGA1366, i to mimo niższego taktowania pamięci podręcznej L3 i kontrolera pamięci.
Testy syntetyczne – 3DMarki
Następnym testem jak zwykle był 3DMark06.
W teście procesora ośmiowątkowe Lynnfieldy wygrywają o włos z Core i7-920. Czterowątkowy Core i5-750 zostaje w tyle, wyprzedzony przez oba Phenomy II X4 i Core 2 Quad Q9650.
Sprawdziliśmy też wydajność 3DMarkiem Vantage.
Symulacja fizyki i sztucznej inteligencji w Vantage chętnie korzysta z dodatkowych wątków – wszystkie procesory z Hyper-Threadingiem wyraźnie wyprzedzają te, które są go pozbawione. Core i5-750 jest nieco szybszy od Core 2 Quad Q9650, ale sporo mu brakuje do wydajności Core i7.
Testy rzeczywiste – obliczenia, renderowanie, ray-tracing
OMP-Test jest nowym programem w naszej procedurze testowej. Program jest w swojej naturze podobny do słynnego SuperPI, ale jest dużo lepiej przystosowany do testowania nowoczesnych procesorów. Zadaniem programu jest obliczyć 16 tys. cyfr rozwinięcia szesnastkowego (nie dziesiętnego!) liczby ?. Zastosowano algorytm Baileya–Borweina–Plouffe'a (więcej w angielskiej Wikipedii), w skrócie zwany metodą BBP. W porównaniu z innymi algorytmami, w tym z metodą Gaussa-Legendre'a użytą w SuperPI, jest bardzo wolny, a zatem nieprzydatny do obliczania wszystkich cyfr po kolei. Można za to za jego pomocą bardzo szybko otrzymać zadaną cyfrę rozwinięcia szesnastkowego ? bez obliczania poprzednich cyfr. Dzięki temu program może podzielić pracę na dowolną liczbę wątków (w obecnej kompilacji – od 1 do 16) i nie wymaga dużej pojemności pamięci operacyjnej, jak inne algorytmy. OMP-Test można pobrać tutaj – zachęcamy do przetestowania swoich domowych komputerów i porównania wyników z naszymi. Jego obsługa jest prosta, ale należy pamiętać o zainstalowaniu bibliotek Visual C++ 2008 Redistributable Package (x86).
OMP-Test zawiera bardzo dużo instrukcji warunkowych, co powoduje, że skaluje się niemal liniowo z liczbą rdzeni, również logicznych. Powinien dobrze reprezentować te obliczenia matematyczne, których na razie nie mogą przejąć procesory graficzne.
Zgodnie z założeniami program skaluje się prawie liniowo wraz z liczbą wątków. Czterowątkowy i5-750 jest szybszy od Phenoma 965 o około 16%.
Następnie sprawdziliśmy sprawność procesorów w renderowaniu sceny testowej w Cinebenchu R10.
I znów nowe Core i7 wyprzedzają i7-920 dzięki wyższemu taktowaniu, a i5-750 jest najszybszym „czterowątkowcem” w zestawieniu – ale wyraźnie widać, że tylko cztero-, a nie ośmiowątkowcem.
Kolejnym testem było śledzenie promieni w POV-Rayu x64.
Jak się spodziewaliśmy, i7-800 wyprzedziły inne czterordzeniowce w zestawieniu, za to wydajność i5-750 okazała się o kilka procent mniejsza niż Q9650.
Testy rzeczywiste – kodowanie filmów i dźwięku
Następnie sprawdziliśmy, jak procesory radzą sobie z kodowaniem filmów.
O ile w pierwszym przejściu, w którym podział zadania na wątki niewiele daje, i5-750 trzymał się w czołówce, to w drugim brak HT wyraźnie go spowalnia – jego wydajność jest podobna do Phenomów 955 i 965.
Drugim nowym testem w naszej procedurze jest kodowanie dźwięku kodekiem OGG Vorbis. Używamy programu oggenc2 opartego na otwartym kodzie fundacji Xiph.org w kompilacji Lancera – jednego z niewielu kodeków dźwięku, które umieją działać dwuwątkowo. Kodujemy utwór Corona Radiata zespołu Nine Inch Nails (dostępny za darmo na stronie zespołu).
Najszybciej kodują Lynnfieldy – i7-920 i czterordzeniowce AMD zostają nieco w tyle.
Trzeci nowy test również polega na konwertowaniu dźwięku, tym razem z nieskompresowanego pliku WAV na format AC3, używany między innymi na płytach DVD. Kodujemy zapętlony pięciokrotnie utwór Matrix Reloaded Suite, pochodzący ze ścieżki dźwiękowej do filmu Matrix Reaktywacja. Program WAV to AC3 Encoder również jest jednym z niewielu, które są zdolne podzielić zadanie na wątki.
Wyniki wyraźnie dzielą się na trzy grupy: ośmiowątkowe Core i7, nieco wolniejsze czterordzeniowe Core i5 i Phenomy II X4 oraz samotny trzyrdzeniowy Phenom II X3 720 BE. Różnica między trzema a ośmioma wątkami jest przeszło dwukrotna.
Testy rzeczywiste – obróbka grafiki i filmów
Kolejnym testem był znany już Wam zestaw 15 operacji wykonywanych w Photoshopie na 38-megapikselowym obrazie.
Adobe blisko współpracuje z inżynierami i programistami Intela, czego skutki widać w doskonałym zoptymalizowaniu programów do działania na procesorach Intela. Ponieważ tylko niektóre operacje są wykonywane wielowątkowo, Core i5-750 dzięki wyższemu taktowaniu w trybie TURBO wyprzedza o włos Core i7-920. Oba Core i7-800 są jeszcze o kilkanaście sekund szybsze.
Innym nowym testem był następny produkt firmy Adobe: przeznaczony do obróbki filmów After Effects CS4.
Inaczej niż w Photoshopie, tutaj większość operacji może być wykonywana wielowątkowo. Daje to znaczną przewagę procesorom ośmiowątkowym, choć i czterowątkowemu Core i5 bliżej do wydajności Core i7 niż Phenomów II X4.
Testy rzeczywiste – kompresja plików
Następnie zmierzyliśmy czas kompresji plików programem 7-Zip do formatu ZIP.
Zaskakuje niska wydajność Core i5 w kompresowaniu dużego pliku, bliższa trzyrdzeniowemu Phenomowi II niż reszcie czterordzeniowców. W pakowaniu małych plików Core i5 wyprzedza i7-920 i Q9650, ale ulega Phenomom II X4 955 BE i 965 BE. Najszybsze są oba Core i7-800.
Następny test właśnie dołączony do procedury to kompresja 7-Zipem do formatu 7z z wykorzystaniem algorytmu LZMA.
Duży plik jest kompresowany przez Core i7 i Core i5 w prawie takim samym czasie. Phenomy II X4 wykonują to zadanie o około 1/5 dłużej. W pakowaniu małych plików zwyciężają Core i7, z Phenomem 965 tuż za nimi, za to Core i5-750 zajmuje to tyle samo czasu co Phenomowi II X3 720 BE.
Gry
Oczywiście nie zaniechaliśmy testów w grach, wręcz przeciwnie – rozbudowaliśmy procedurę o trzy testy, z których dwa to gry znane z dużych wymagań co do mocy procesora: Empire: Total War oraz Anno 1404. Trzeci test jest bardziej syntetyczny, ale też bardziej miarodajny niż symulacje w 3DMarku. Jest to benchmark efektów cząsteczkowych w silniku Source firmy Valve, z którego korzystają między innymi: Team Fortress 2, Half-Life 2: Episode 2, Left 4 Dead i nadchodzący Left 4 Dead 2.
W grach FPP i w World in Conflict wyraźnie wygrywają Core i7 i Core i5 – wyjątkiem jest dziwne potknięcie Core i7-920 w Left 4 Dead, prawdopodobnie skutek błędu w sterownikach lub BIOS-ie. Inaczej jest w Anno 1404 i Empire: Total War – tutaj pierwsze miejsca zajmują Phenomy II X4, po nich są Core i7-800, potem Core i5 i Phenom II X3.
Podkręcanie
Pod względem podkręcania platforma P55/LGA1156 jest bardzo podobna do X58/LGA1366. Większość informacji w naszym poradniku podkręcania Core i7 pozostaje aktualna. Różnice wynikają z uproszczenia platformy P55 względem X58. Po pierwsze, nie ma łącza QPI – jeden mnożnik mamy z głowy. Po drugie, ze względu na obniżone taktowanie części uncore dużo mniej prawdopodobne jest, że kontroler pamięci i pamięć podręczna L3 będą nas ograniczać w podkręcaniu. Do tego pamięć można podkręcać dużo swobodniej niż na płytach X58 – nie trzeba już utrzymywać taktowania pamięci do taktowania uncore w stosunku 1:2. Pamięć może teraz działać z częstotliwością równą 2/3 taktowania uncore (mowa o taktowaniu DDR, nie realnym). Niestety, żadna z płyt P55, które trafiły do redakcji, nie umożliwiała zmiany mnożnika uncore, choć niektóre zmieniały go automatycznie po przekroczeniu pewnego poziomu BCLK i mnożnika pamięci. Należy się spodziewać, że takie możliwości pojawią się w nowych wersjach BIOS-ów.
Wszystkie trzy procesory podkręcaliśmy przy użyciu chłodzenia powietrznego, przy górnej granicy bezpiecznego napięcia równej 1,425 V. Core i7-870 udało się przyspieszyć do 3960 MHz (180×22) przy napięciu 1,387 V. Core i5-750 osiągnął częstotliwość 4020 MHz przy BCLK równym 201 MHz, mnożniku ×20 i napięciu 1,384 V. Największą podatność na podkręcanie wykazał Core i7-860, który po podniesieniu napięcia do 1,392 V mógł stabilnie działać z taktowaniem 4106 MHz (195,6×21). Podczas prób podkręcania wyłączona była technologia TURBO i możliwość przechodzenia rdzeni w stany energetyczne C5 i C6.
Wyższe napięcia dały efekt podobny jak w procesorach Bloomfield: zwiększone wydzielanie ciepła powodowało utratę stabilności zamiast dalszego skalowania się częstotliwości. Podobnie jak w przypadku LGA1366 ograniczeniem w podkręcaniu może dość szybko stać się układ chłodzenia. Duży rdzeń Lynnfieldów musi być chłodzony do temperatury jak najbliższej otoczeniu – choć nie wydziela dużo więcej ciepła niż inne czterordzeniowce, to musi być ono cały czas odprowadzane z całej powierzchni IHS-a.
Przeprowadziliśmy testy wydajności podkręconych procesorów w grach i 3DMarkach.
Po podkręceniu procesory zyskały do 40% wydajności (test efektów cząsteczkowych silnika Source). Bez wątpienia wyniki mogłyby być jeszcze lepsze, gdyby płyty główne umożliwiały zmianę mnożnika uncore.
Pobór mocy
Do testu poboru mocy dołączyliśmy jeszcze jeden pomiar: na komputerze jest odtwarzany film w rozdzielczości Full HD (1920×1080) w kodowaniu x264. Korzystamy z odtwarzacza VLC, w którym nie jest wykorzystywane sprzętowe przyspieszanie odtwarzania filmów przez procesor graficzny.
Te trzy wykresy mogą być dla wielu największą (pozytywną) niespodzianką testu. Podczas gdy platforma LGA1366 z procesorem Core i7-920 była w dotychczasowych testach najbardziej prądożerna, to nowe Core i7 i Core i5 pobierają zaskakująco mało mocy. Mimo że rozmiar rdzenia i liczba tranzystorów zwiększyły się, a zakres napięć pozostał bez zmian, ogromną poprawę przyniosło pozbycie się z płyty głównej łącza QPI, zmniejszenie taktowania części uncore procesora oraz bardziej dynamiczne obniżanie stanów energetycznych nieużywanych rdzeni. Prawdopodobnie pobór mocy przy niskim obciążeniu mógłby być jeszcze niższy, gdyby scheduler systemu operacyjnego nie pobudzał co chwilę uśpionych rdzeni i nie przełączał ich w wysokie napięcia i taktowania. Poprawa tego zachowania w Windows 7 ma być jednym z głównych owoców współpracy Intela z Microsoftem w ostatnich miesiącach. Wszystkie trzy Lynnfieldy ustawiały sobie napięcie 0,875 V w stanie spoczynku. Pod obciążeniem i7-870 i i7-860 wymagały 1,175 V, a nasz egzemplarz i5-750 ustawiał sobie 1,24 V.
Zmierzyliśmy też temperaturę działania najnowszych procesorów Intela.
Pomiar temperatury niczym nie zaskakuje: wyniki Lynnfieldów są podobne do pozostałych czterordzeniowców, a różnica między najgorętszym a najzimniejszym procesorem wynosi jedynie 4 stopnie. Dość powiedzieć, że nowe Core i7 i Core i5 nie wymagają wyjątkowych układów chłodzenia – innych niż te, które do tej pory można było z powodzeniem stosować do czterordzeniowców.
Sascha Krohn, były pracownik firm Cellshock i Foxconn i znany komentator w dziedzinie najnowszych technologii komputerowych, powiedział parę miesięcy temu (znając wydajność procesorów Lynnfield): „Jeśli czekałeś na Lynnfielda, to niepotrzebnie – mogłeś mieć to samo rok wcześniej”. Z jednej strony nie sposób nie przyznać mu racji: wydajność, jaką zapewniają Core i7-800 i Core i5-750, nie jest wyjątkowa w porównaniu z procesorami serii Core i7-900. Technologicznie Lynnfieldy mogą się wydać uboższe – nie mają łącza QPI ani trzykanałowego kontrolera pamięci. Ale z drugiej strony, jeśli spojrzymy nie tylko na czystą wydajność, to zobaczymy, że tak naprawdę nie mogliśmy mieć Lynnfielda rok temu. Przez ten czas Intel wykonał nie tyle krok naprzód, co raczej w stronę użytkowników. Zamiast produktu serwerowego pospiesznie przystosowanego do rynku high-endowych komputerów osobistych otrzymujemy dzisiaj platformę dopracowaną technologicznie i skrojoną specjalnie do naszych potrzeb. Zmniejszony pobór energii, tańsze płyty główne, dwukanałowe zestawy pamięci, a przy tym lepsze wykorzystanie potencjału rdzeni dzięki nowemu TURBO – to wszystko bardziej przekonuje do kupienia platformy niż kilka klatek na sekundę więcej w jednej z setek gier czy kilka sekund zyskanych na kodowaniu godzinnego filmu. Nie wypada zrobić nic innego, jak przypomnieć swoje słowa z recenzji pierwszych Phenomów II: nie można się nie cieszyć z pojawienia się takiego produktu. Nawet jeśli dla kogoś nie jest on atrakcyjny, to spowoduje spadek cen innych procesorów. Czterordzeniowce trafią do większej liczby komputerów, co z pewnością dobrze wpłynie na rozwój oprogramowania. Czyli jeśli zdecydujesz się na kupno Lynnfielda – ciesz się, bo kupujesz świetny procesor. Jeśli się nie zdecydujesz – też się ciesz, bo coś innego stanieje.
Do testów dostarczył: Intel
Cena w dniu publikacji (z VAT): około 2030 zł
Do testów dostarczył: Intel
Cena w dniu publikacji (z VAT): około 1100 zł
Po burzliwej dyskusji w redakcji i po zaktualizowaniu cen w polskich sklepach internetowych postanowiliśmy wyróżnić procesor Core i5-750 rekomendacją PCLab.pl za bezkonkurencyjną wydajność w swoim przedziale cenowym:
Do testów dostarczył: Intel
Cena w dniu publikacji (z VAT): około 720 zł