Powrót do problemów
Zanim zajmiemy się walorami użytkowymi czterojądrowego procesora, warto przez chwilę przyjrzeć się jego konstrukcji. Jeśli spojrzymy pod blaszaną pokrywkę, noszącą dumną nazwę Integrated Heat Spreader - Zintegrowany Rozpraszacz Ciepła, znajdziemy pod nią dwa osobne chipy, znane nam już jako Conroe, czyli Core 2 Duo. Uściślając dojdziemy do wniosku, że są to dwa układy Core 2 Duo E6700 - mają po 4 MB pamięci cache drugiego poziomu i pracują z tym samym, co E6700, zegarem o częstotliwości 2,66 GHz.
Dwa procesory na wspólnej płytce podłoża to wśród konstrukcji Intela nic nowego - podobną budowę mają dostępne wciąż na rynku procesory Pentium D "Presler". Ale proste połączenie dwóch układów w konfigurację SMP (Symmetrical MultiProcessing), nawet jeśli zrealizowane jest w obrębie wspólnego podłoża i obudowy, pociąga za sobą dość drastyczne konsekwencje. Przede wszystkim zastosowane w konstrukcji Kentsfielda rozwiązanie przywołało na powrót problem, który został radykalnie rozwiązany w Core 2 Duo - problem zachowania spójności zawartości pamięci cache.
Wyjaśnijmy może, na czym problem polega (fachowcy mogą pominąć ten akapit). Wyobraźmy sobie, że jeden z procesorów przejmuje wykonywany wątek po drugim, dla którego system operacyjny znalazł inne zadanie. Dane, na których procesor pracował, znajdują się w jego systemie pamięci cache - drugi procesor, podejmujący kontynuację zadania, odwoła się do tych danych poprzez ich adresy w pamięci RAM. A tam dane jeszcze nie zostały przepisane z cache L2 procesora, który je ostatnio obrabiał i katastrofa gotowa - procesor kontynuowałby pracę na zupełnie nieaktualnych danych. Dlatego procesory przystosowane do działania w konfiguracjach wieloprocesorowych mają zaimplementowany protokół nadzoru spójności cache (cache coherency), zapobiegający takim sytuacjom, jak opisana powyżej. W przypadku odwołania do adresu, którego aktualna zawartość może znajdować się w cache innego procesora, zawierający ją wiersz cache jest przesyłany do procesora wykonującego odwołanie.
Nietrudno zauważyć, że uzgadnianie zawartości pamięci cache i wymiana danych pomiędzy nimi stanowi zauważalne obciążenie dla systemu, angażując część przepływności szyny FSB. Nie koniec na tym, dochodzi jeszcze strata czasu podczas oczekiwania przez procesor na uzgodnienie zawartości cache. Istne pandemonium! A Intel, który w bardzo zręczny sposób pozbył się tego problemu, stosując w układzie Conroe wspólną dla obydwu jąder pamięć cache L2, nagle do niego wrócił w makroarchitekturze Kentsfielda. Ale faktyczna dwuprocesorowość Kentsfielda to nie tylko problem spójności cache.
Nie ma platformy!
Jak już powiedzieliśmy wcześniej, Core 2 Extreme "Kentsfield" to w rzeczywistości dwa procesory w konfiguracji SMP. Konstrukcja takiego procesora nie stanowiła problemu, gorzej natomiast z możliwościami użytkowania go. Przez lata dywersyfikacji platformy profesjonalnej i platformy PC Intel doprowadził do sytuacji, w której standardem stało się, że chipsety płyt głównych przeznaczone do PC nie obsługują konfiguracji wieloprocesorowych. Można tu śmiało mówić o skaleczeniu własną bronią - nie da się zbudować płyty na chipsecie Intel 975X, zdolnej do obsługi dwóch procesorów. Jak to się nie da? Przecież były już płyty główne na chipsetach Intela, obsługujące procesory Pentium D Presler, będące takimi samymi SMP! Nawet jeszcze bardziej - w wersji Extreme Edition każdy z nich był widziany jako dwa, dzięki HyperThreadingowi. A jednak - są pewne problemy. Do testów otrzymaliśmy kolejną wersję płyty Intel D975XBX Bad Axe, ostrzegającą jawnie, że jest konstrukcją beta, przeznaczoną jedynie do eksperymentów.
Fakt, że używana w testach płyta główna była wersją beta, sam w sobie nie wpłynął na wyniki, natomiast wyraźnie wpłynął na nasze samopoczucie. BIOS płyty nie miał jeszcze zaimplementowanej funkcji sterowania prędkością obrotową wentylatora chłodzącego procesor. A my mogliśmy jedynie cierpieć, niekoniecznie w milczeniu, bo czasem trzeba przekrzyczeć wiatrak. Naprawdę nie miałem pojęcia, jak bardzo może hałasować wentylator standardowego boxowego zestawu Intela, jeśli pracuje na rzeczywiście maksymalnych obrotach... Wszystko wskazuje na to, że nowy Core 2 Extreme nie będzie dysponował bardzo szeroką gamą płyt głównych - do jego obsługi zostaną przystosowane tylko nieliczne modele płyt na chipsetach Intel 975X. Na płyty z układem P965 raczej nie należy liczyć. Dlaczego? Poczwórne jądro "dla mas" pojawi się w II połowie przyszłego roku, w postaci procesora Intel Core 2 Quad. Ale ten procesor będzie pracował z szyną FSB taktowaną częstotliwością 1333 MHz, a chipsetem dla niego będzie układ obecnie znany pod kodową nazwą Bearlake-X, współpracujący z pamięciami DDR3. Będzie to więc coś zupełnie innego. Na razie Kentsfield pozostanie egzotyczną ekstrawagancją, z ograniczonymi możliwościami wyboru platformy roboczej.
Platforma testowa
Procesor Core 2 Quad QX6700 przetestowaliśmy w komputerze o następującej konfiguracji:
Komponenty zestawu testowego | ||
Typ komponentu | Model | Dostarczy? |
Wentylator | Intel box | www.intel.com |
P?yta g??wna | Intel D975XBX | www.intel.com |
Pami?? | 1 GB DDR2 1066 Corsair | redakcyjna |
Karta graficzna | ATI Radeon X1800 XT + Accelero X2 | www.ati.com |
Dysk twardy | Seagate Barracuda 7200.8 400 GB | www.seagate.com |
Nap?d optyczny | LG GSA-4040B (DVD±RW) | redakcyjny |
Monitor | LG Flatron 915FT Plus (19") | redakcyjny |
Zasilacz | Yesico SilentCool SC560-AS12CF | www.4max.pl |
Pierwsze wrażenia
Identyfikacja procesora przez program CPU-Z jest zaskakująco poprawna, znacznie gorzej radzą z nią sobie inne, szczególnie starsze programy.
Science Mark 2.0 puszcza wodze fantazji, przedstawiając Kentsfielda jako... 4 cztery procesory Intel Core 2 Quad, w dodatku informując o czterech wątkach logicznych na fizyczny procesor, jednak dziwna identyfikacja nie przeszkadza mu w korzystaniu podczas testów ze wszystkich czterech jąder układu.
Nic dziwnego - procedury wykorzystywane w tym benchmarku zostały żywcem przeniesione z programów symulacji zjawisk fizycznych, pisanych tak, by mogły wykorzystywać większą liczbę dostępnych procesorów.
Jaka jeszcze aplikacja może nam pokazać cztery rdzenie w działaniu? W sposób bardzo wizualny zrobi to Cinebench.
Każde z jąder pracuje nad renderingiem części sceny, zaś Menedżer zadań pokazuje, że wszystkie cztery pracowały z całym zaangażowaniem.
Dość radosnych zabaw, pora przejść do prawdziwych testów.
Sandra "po nowemu"
SiSoftware Sandra to "żelazny punkt" w programach testów procesorów. Wyniki "benchmarków" zawartych w tym pakiecie prezentowane są prawie przez wszystkich, chociaż tak naprawdę to nikt do końca nie wie, cóż te programy właściwie mierzą. Ale uwaga! Nastąpiła pozytywna zmiana i Sandra zaczyna nabierać benchmarkowej wartości. W najnowszej wersji SiSoft Sandra można już bez wysiłku zrozumieć wyniki, przynajmniej niektórych testów.
Identyfikacja procesora pozostawia nieco do życzenia - układów o nazwie Intel Core 2 Quad nie ma jeszcze na rynku i nie zobaczymy ich wcześniej niż za kilka miesięcy. Ale częstotliwości i inne parametry są identyfikowane poprawnie.
W teście wydajności procesora Sandra pokazuje, że Intel Core 2 Extreme QX6700 ma prawie 2,5-krotnie większą wydajność w operacjach arytmetyczno-logicznych (całkowitoliczbowych) i blisko dwukrotną przewagę nad Athlonem 64 FX-62. Niestety, szczegółów tego testu wciąż nie znamy.
Również test "Processor Multi-Media" nie jest jeszcze wystarczająco objaśniony, jednak jego wyniki zdecydowanie łatwiej zrozumieć - eksponują one przede wszystkim przewagę 128-bitowych operacji SSE wykonywanych w jednym cyklu, czyli jeden z elementów wydajnościowej przewagi Conroe nad resztą świata. W tym przypadku - dodatkowo pomnożoną przez dwa!
Test szybkości komunikacji z pamięcią jest przejrzysty, a jego wyniki można również obejrzeć w postaci zsyntetyzowanej.
Warto zauważyć, że jednym z procesorów referencyjnych jest Intel Core 2 Quad X8600, z zegarem 2,4 GHz. Nic o takim procesorze nie wiemy... może coś przeoczyliśmy? Może warto skierować pytanie do Intela, bo według posiadanych przez nas informacji układy Intel Core 2 Quad zobaczymy dopiero w II połowie przyszłego roku?
Wartości opóźnień w dostępie do pamięci, jakie pokazuje Sandra, wyglądają dość wiarygodnie. Szkoda tylko, że nie pokrywają się z tymi, jakich dostarcza membench zawarty w programie ScienceMark 2.0.
Noo... chyba się trochę zapędziłem - to nie jest recenzja programu SiSoft Sandra, tylko procesora o kryptonimie Kentsfield. Przepraszam! W każdym razie od nowej, lepszej Sandry nie dowiedzieliśmy się wiele...
3DMark w dwóch wcieleniach
Wyniki, jakie testowany sprzęt osiąga w benchmarkach z rodziny 3DMark, niekoniecznie korespondują bezpośrednio z osiągami w grach. Ale, patrząc na to w skali masowej, możemy śmiało uznać, że to, co pokazuje najnowszy 3DMark znajdzie przełożenie na wydajność w grach, które wejdą na rynek w przyszłym roku. Skoro mamy być "przyszłościowi", to na początek 3DMark06.
Wyższy od rywali wynik, osiągnięty przez czterordzeniowy procesor nie jest zaskoczeniem - 3DMark06 jest napisany wielowątkowo i może wykorzystywać konfiguracje wielordzeniowe. Jednak skalę możliwości pokazuje dopiero ocena wydajności CPU.
Tutaj czterojądrowy Core 2 Extreme pokazuje miażdżącą przewagę nad konkurencją, nawet z tej samej stajni Core 2. Czyli - do przyszłych gier się przyda. A jak z obecnymi? Odpowiedź powinien przynieść "zeszłoroczny" 3DMark05. Dlaczego cudzysłów? Bo Futuremark publikuje swoje benchmarki wcześniej - 3DMark05 został opublikowany w drugiej połowie 2004 roku. Znów dygresja! Wróćmy do testów.
Czy kogoś zaskakuje, że czterordzeniowy Core 2 Extreme QX6700 ulega w tym teście dwurdzeniowemu Core 2 E6700? Nieznacznie, bo nieznacznie, w granicach błędu pomiaru, ale...
...ocena wydajności procesora czterordzeniowego jest już gorsza o około dziesięciu procent od uzyskanej przez dwujądrowy, a to przecież bardzo dużo, na 10% różnicy wyniku potrzebujemy o około 20% szybszego zegara procesora, a to kosztuje! Anomalia wyników rzeczywiście zauważalna, ale jej wyjaśnienie odłóżmy na później, teraz tylko zasygnalizujemy, że wiąże się ona z czymś, co było uważane za "cudowną broń" Intela. 3DMarki mówią, że w przyszłych grach będzie rewelacyjnie, a w obecnych całkiem dobrze. Popatrzmy więc, jak nowy sztandarowy procesor Intela sprawdza się w dzisiejszych i wczorajszych grach.
No to gramy!
Na dzień dobry - Doom 3, gra już dość stara, ale... nawet moje dziecko wychowało się na jej kolejnych wersjach! Gra znana jest z jednowątkowej struktury silnika, więc nie obiecujemy sobie wielu korzyści z czterech jąder procesora.
I rzeczywiście, różnica pomiędzy osiągami Core 2 Extreme QX6700 i E6700 jest niewielka, można byłoby ją nawet uznać za mieszczącą się w błędzie pomiaru. Ważne jednak to, że nie jest większa, jak zapowiadał 3DMark05.
Counter-Strike z sympatią odnosi się do czterordzeniowego procesora, a choć nie daje mu przewagi nad X6800, to przynajmniej ilustruje wyższość nad tak samo taktowanym E6700. Skąd ta wyższość? W tej grze, pomyślanej jako przede wszystkim sieciowa, sporą rolę gra obsługa protokołu TCP/IP. A to pracochłonne zajęcie, nawet gdy nic się nie dzieje. Zajęcie akurat dla rdzeni niezaangażowanych przez silnik gry i system.
Quake 4 to jedna z nielicznych "starszych" gier, której silnik wyposażono w optymalizację pozwalającą na wykorzystywanie architektury wieloprocesorowej. Jak widać z wyników, gra korzysta z tej optymalizacji, ale efekt nie jest oszołamiający - zaledwie około 20% przewagi nad dwurdzeniowym E6700. Zaledwie?
Serious Sam II daje wyraźne fory czterojądrowemu procesorowi, pozwalając mu na osiągnięcie przewagi nad taktowanym jednak dużo szybciej X6800.
Ale już w Far Cry sytuacja "wraca do normy" - przewaga czterordzeniowca maleje, czemu nie można się dziwić - nowy silnik CryTek ma zadebiutować najwcześniej z końcem roku.
Również w Half-Life 2 nie widać wyraźnej przewagi procesora z czterema rdzeniami nad wyposażonym jedynie w dwa jądra. Czy wobec tego jest jakikolwiek sens inwestowania w czterordzeniowy procesor? No właśnie... jeśli bierzemy pod uwagę obecną ofertę rynku gier, to nie miałoby to szczególnego sensu. Jednak warto pamiętać o pewnym drobiazgu - gry nie są pisane wyłącznie na PC, nawet wręcz przeciwnie, podstawowym z punktu widzenia ich producentów rynkiem są konsole. A na ten rynek konieczne są silniki gier zdolne do korzystania z wielu jąder procesorów - trzech jąder POWER w Xbox 360 i sześciu SPU w PlayStation 3. "Porty" gier na PC nie pozostaną więc na pewno przy współcześnie stosowanych strukturach silników gier.
Na poważnie - pracujemy
Jeśli chodzi o rozrywkę, to Core 2 Extreme QX6700 sprawdzi się dopiero w niezbyt odległej przyszłości. Jak sprawdzi się we współczesnych zastosowaniach używanych w codziennej pracy? Coś, co wszyscy robią od czasu do czasu, nie przywiązując zwykle specjalnej wagi do procesu - kompresja danych.
Kompletna porażka, nasz czterojądrowy lider okazuje się gorszy od dwurdzeniowego E6700! Nieznacznie gorszy, ale poza zakresem tego, co moglibyśmy uznać za błąd pomiaru. No cóż - WinRAR w dotychczasowych wersjach jest "klinicznym" przykładem programu jednowątkowego. Ale...
... to już zostało nadrobione i najnowszy WinRAR pełnymi garściami czerpie z wieloprocesorowej architektury! Dla tych, którzy nie mogą żyć bez skompresowania kilku gigabajtów - marzenie! ;-) Ale kompresja to nie tylko kompresja plików, ale przede wszystkim kompresja wideo.
Ha! Czterordzeniowy procesor zaoszczędzi nam dwadzieścia procent czasu przy przetwarzaniu filmu na format DivX. A co będzie, jeśli zechcemy użyć konkurencyjnego kodeka XviD?
Wyniki zdecydowanie gorsze: Core 2 Extreme QX6700 niewiele tylko wyprzedza E6700. To nic - następne wersje kodeków XviD będą bardziej wielowątkowe!
A teraz serio!
Na serio - kto może mieć bezpośrednią korzyść z czterojądrowego procesora? Oczywiście profesjonaliści, używający oprogramowania, które "od zawsze" przystosowane jest do wykorzystywania platform wieloprocesorowych, Popatrzmy zresztą... Gdyby Tomek Bagiński pracował nad "Katedrą" na Core 2 Extreme QX6700, mógłby oszczędzić wiele czasu (ten film powstawał bardzooo długo...*).
Znowu popadam w dygresje, a Czytelnicy czekają na wyniki. Dla użytkowników 3D Studio MaX procesor Core 2 Extreme QX6700 jest wręcz wymarzony - skróci czas pracy o około czterdziestu procent!
Na pewno! Przecież potwierdza to test na innym modelu sceny! Fajnie, fajnie, ale nie cieszcie się zbytnio, animatorzy - to są czasy renderingu scen, a nie ich projektowania! No to jeszcze jedna gratka dla animatorów - Cinema 4D, a właściwie oparty na silniku tego programu Cinebench.
I tu także, może jeszcze w bardziej spektakularny sposób widzimy, że co cztery rdzenie to nie dwa. Przewaga Core 2 Extreme QX6700 nad konkurencją jest porażająca!
* również z przyczyn pozatechnicznych.
Czytelnicy zapewne pamiętają "cudowne bronie", jakie miały się znaleźć w nowych procesorach Intela i AMD, nazwane Reverse HyperThreading i Core Multiplexing. Okazuje się, że Core Multiplexing nie tylko istnieje w rzeczywistości, ale jest zaimplementowany w Core 2 Extreme! W BIOS-ie płyty głównej, wśród niezbyt licznych opcji, znajdujemy możliwość włączenia lub wyłączenia funkcji Core Multiplexing. Nie jest to jednak cudowna broń, która miała przynieść oszołamiający skok wydajności. Nie jest to również zapowiadany w swoim czasie pod tą nazwą mechanizm, wymuszający przydzielanie sekwencyjnym wątkom programu kolejnych rdzeni procesora. Co prawda taki mechanizm byłby bardzo korzystny ze względów termicznych, pozwalając na sekwencyjne "stygnięcie" poszczególnych jąder, ale... jeszcze nie teraz. Funkcja Core Multiplexing jest w testowej płycie domyślnie włączona. Cóż się stanie, gdy ją wyłączymy? Wyłączony Core Multiplexing powoduje zablokowanie po jednym z jąder w obu procesorów wchodzących w skład Kentsfielda! Mamy teraz dwa jądra, z których każde ma do dyspozycji 4 MB pamięci cache L2.
Czemu to służy? Możliwość włączania i wyłączania Core Multipleksingu to ukłon w stronę użytkowników wymagających aplikacji napisanych tak, że nie mają możliwości wykorzystania wielordzeniowej architektury. Niech więc mają przynajmniej korzyść w postaci większej, nawet wręcz bardzo dużej pamięci cache L2. Jak wielkie będą te korzyści? Wiele nie należy sobie obiecywać. Do ich oceny posłużmy się najbardziej "opornym" na wielordzeniowe korzyści spośród naszych testowych aplikacji programem WinRAR w wersjach 3.51 i 3.60.
Okazuje się, że na większej pamięci cache L2 starsza, zdecydowanie jednowątkowa wersja zyskuje całkiem sporo, bo o blisko dziewięć procent.
Za to nowy WinRAR, wielowątkowy, traci przeszło czternaście procent korzystając z dwóch jąder z wielkimi cache zamiast czterech, jakie ma do dyspozycji przy włączonym multipleksingu. Ale nie bagatelizujmy - również i inne programy mogą zyskiwać na wyłączeniu funkcji Core Multiplexing i zredukowaniu liczby wykorzystywanych rdzeni do dwóch. Przykładem takiego programu jest 3DMark05. Na czterordzeniowym procesorze uzyskuje wynik nieco gorszy, niż na dwujądrowym, przy czym różnica jest szczególnie wyraźna jeśli chodzi o ocenę wydajności procesora. A to mówi samo za siebie - optymalizacja 3DMark05 do pracy na platformach wieloprocesorowych ogranicza się w praktyce do dwóch procesorów - dwóch rdzeni Core 2 Duo. Więcej - to zbyt wiele!
Pora na wnioski
Czy czterojądrowy procesor wart jest tego, by go kupić, gdy tylko pojawi się na rynku? Dla większości z nas, wymagających użytkowników PC, czy innych komputerów (ukłon w stronę Tych_którzy_siedzą_na_makówkach), na pewno nie! Nie oferuje szczególnych atrakcji graczom, a reszty użytkowników również nie ma nic rewelacyjnego, Z jednym wszakże wyjątkiem - dla profesjonalistów, używających oprogramowania pisanego dla wieloprocesorowych maszyn klasy workstation. jest wręcz ucieleśnieniem marzeń. Zwłaszcza jeśli połączymy go z 64-bitowym systemem operacyjnym, ale to jest temat na zupełnie inną opowieść.
Ale i dla przeciętnego gracza czy nawet jedynie wymagającego użytkownika PC stanie się atrakcyjny. Kiedy? Niedługo, za około roku. Wówczas będzie przedstawiał zupełnie nową wartość, a to za sprawą zarówno ceny, która będzie o wiele niższa od obecnej, jak i za sprawą oprogramowania - obecnie widzimy już wyraźny trend dopasowywania programów do struktur wielordzeniowych.