Czemu służy szybsza szyna?
Większość Czytelników PCLab.pl pamięta zapewne intelowską architekturę NetBurst, wraz ze skokami wydajności, jakich dokonywały procesory Pentium 4 przy kolejnych przyspieszeniach taktowania szyny FSB. Dla tamtej architektury przepływność szyny FSB była podstawowym, czasami wręcz ważniejszym od zegara czynnikiem warunkującym wydajność.
Tę samą konstrukcję szyny FSB, z kosmetycznymi zmianami, Intel przeniósł do procesorów z rodziny Conroe, czyli Core 2 Duo. I słusznie, bo po co wyważać otwarte drzwi? Okazuje się jednak, że racjonalna architektura Conroe jest zdecydowanie mniej wrażliwa na przepływność danych pomiędzy procesorem i pamięcią RAM, podobnie jak to ma miejsce w procesorach z rodziny Athlon 64 X2. Szyna taktowana efektywną częstotliwością 1066 MHz okazała się na tyle efektywna, że można było sobie pozwolić na wprowadzenie na rynek również modeli z rodziny Conroe, pod nazwą Pentium Dual Core, działających z wolniejszą, 800-megahercową szyną. Wynikająca ze zwolnienia taktowania szyny o 25% strata wydajności była wręcz pomijalnie mała.
Oczywiście nasuwa się uzasadnienie dla stosowania szybszej, 1333-megahercowej szyny w przypadku procesorów quad core – czterordzeniowych. W ich przypadku szybsza szyna nie tylko poprawia dostęp do danych, ale także usprawnia obsługę protokołu spójności cache, absorbującego fragment pasma przepływności szyny. Jednak już dwa miesiące temu przeprowadziliśmy serię testów relacji pomiędzy taktowaniem czterordzeniowego procesora Core 2 Extreme QX6800, a jego wydajnością. Nie tylko nie pokazały one miażdżącej przewagi szyny 1333 MHz nad 1066-megahercową, ale osiągane wyniki były nierzadko wręcz identyczne.
Kolejnym potencjalnym uzasadnieniem 1333-megahercowej szyny może być promocja pamięci DDR3 – jak wiadomo, chipsety Intel P35 obsługują ten typ modułów RAM, choć na razie producenci płyt głównych nie kwapią się zbytnio z wprowadzaniem modeli wykorzystujących DDR3. Ale dość fragmentaryczne testy, przeprowadzone przy okazji testów chipsetu P35 Express, jakoś nie potwierdziły na razie przewagi DDR3 nad DDR2. Jaki więc jest cel Intela? Aby się dowiedzieć, trzeba poczytać dalej...
Ofiary testów i ich rodzina
Zacznijmy od prezentacji kompletnej rodziny, jaka w niedługim czasie ma się pojawić na rynku. Oto procesory z 1333-megahercową szyną, jakich możemy się w najbliższym czasie spodziewać:
- Intel Core 2 Duo E6850 – 3,0 GHz, 266 USD,
- Intel Core 2 Duo E6750 – 2,66 GHz, 183 USD,
- Intel Core 2 Duo E6550 – 2,33 GHz, 163 USD,
- Intel Core 2 Duo E6540 – 2,33 GHz, 163 USD.
Wszystkie procesory wyposażone są w czteromegabajtową pamięć cache L2 – nie udało nam się ściślej ustalić, jakie będą różnice pomiędzy tak samo taktowanymi i tyle samo kosztującymi modelami E6550 i E6540. Podawane ceny to oczywiście oficjalne ceny fabryczne, ale ceny rynkowe nie powinny być od nich wiele wyższe, oczywiście pomijając VAT. Na dziś w Polsce Core 2 Duo E6750 kosztuje 700-800 złotych, zaś E6550 jest o około 100 zł tańszy. Popatrzmy na nie – czy są tyle warte?
W odróżnieniu od pięknych procesorów na otwierających artykuł obrazkach, dostarczone do testów egzemplarze charakteryzowały się nieco mniej konwencjonalną, ale bardzo funkcjonalną urodą.
W tym miejscu nasze wielkie brawa dla Intela – nareszcie egzemplarze testowe są znakowane! Nie to, żebyśmy nie byli w stanie określić na podstawie standardowych oznaczeń, co też kryje się tym razem pod pokrywką IHS z napisem Intel Confidential, ale jest to zadanie dość czasochłonne i wymaga użycia nie zawsze dostępnych ściągawek.
CPU-Z nie pokazuje nam żadnych różnic pomiędzy nowymi układami a już znanymi, poza drobiazgiem – steppingiem B w wersji G0, a więc nowym. Okaże się to mieć ogromne znaczenie!
Wracając do egzemplarzy testowych – wyglądają, poza oznakowaniem, całkiem normalnie (trudno, żeby było inaczej), pora więc przejść do testów. Oczywiście we wszystkich testach zwrócimy uwagę przede wszystkim na układy E6700 i E6750, które mają takie samo taktowanie jądra, a różnią się jedynie szybkością szyny FSB.
Platforma testowa
Wszystkie testy przeprowadziliśmy na platformie, którą zbudowaliśmy z wykorzystaniem płyty ASUS P5K Deluxe. Zestaw rozbudowaliśmy o 2 GB pamięci DDR2. Niestety mieliśmy problemy z wypożyczeniem modułów DDR3 1333 - są nadal praktycznie niedostępne w Polsce.
Zestaw testowy
Model | Dostarczył | |
---|---|---|
Procesory: | Intel Core 2 Duo E6750 Intel Core 2 Duo E6550 Intel Core 2 Extreme X6800 | www.intel.pl |
Płyta główna: | ASUS P5K Deluxe | pl.asus.com |
Pamięci RAM: | OCZ PC2 6400 Special Ops Edition 2x512 MB | www.extrememem.pl |
Wentylator: | Arctic Cooling Freezer 7 Pro | www.cooling.pl |
Dyski twarde: | 2 x WD Caviar RE 500 GB | www.wdc.com |
Zasilacz: | Pentagram Silent Force 620 W | www.pentagram.pl |
Monitor: | ASUS MB19SE | pl.asus.com |
Ulubione syntetyki
Chyba nikt, łącznie ze mną, nie lubi benchmarków syntetycznych, głównie ze względu na brak przełożenia pomiędzy ich wynikami, a osiągami w rzeczywistych aplikacjach. Jednak są one wręcz nieocenione w przypadku np. porównań architektur czy rozwiązań konstrukcyjnych – pokazują czarno na białym, co powinno być lepsze, a wyciągnięcie wniosków z wyników jest znacznie łatwiejsze, niż w przypadku testów aplikacyjnych. Przecierpmy więc ...Marki.
Różnicę osiągów E6700 i E6750 w tym teście można byłoby uznać za błąd pomiaru, ale... ten rzekomy błąd jest powtarzalny. Czyżby szybsza szyna miała powodować spadek wydajności? Raczej mało prawdopodobne. Wszystko wskazuje na to, że struktura kodu testu w jakiś tajemniczy sposób dyskryminuje szybszą szynę... Analiza zjawiska przekracza nasze możliwości – „po pierwsze, nie mamy kodu” (źródłowego).
Komunikacja procesora z pamięcią RAM siłą rzeczy musi być szybsza przy wykorzystaniu szybszej szyny. Przewaga E6750 nad E6700 jest tu wyraźna. Warto także zauważyć, że E6550 w tym teście wyraźnie góruje nad pracującym z szybszym zegarem E6600. Czyżby, pomimo wcześniej wyrażanych wątpliwości, szyna 1333 MHz miała sens użytkowy?
Po ogólnym wyniku 3DMark05 właściwie nie można się było spodziewać niczego innego, jak bardzo wyrównanych osiągów. Przyglądając się uważnie dostrzeżemy, że E6700 i E6750 osiągają prawie identyczny rezultat, a E6550 dogania E6600, podobnie jak w poprzednim teście.
Test CPU z tego benchmarku pokazuje ponownie zaskakującą przewagę E6700 nad E6750, tak, jak to miało miejsce w testach PCMark. Chyba rzeczywiście kod tych testów „nie lubi” szybszej szyny... Spróbujemy zasięgnąć opinii firmy Futuremark, która je napisała, ale to, niestety, potrwa.
Tymczasem sprawa korzyści, przynoszonych przez szybszą szynę, pozostaje wciąż otwarta - na razie możemy jedynie stwierdzić, że korzyść odnosi jedynie E6550, który w części testów skutecznie rywalizuje z szybszym przecież E6600. Porównanie jednakowo taktowanych układów E6700 i E6750 bynajmniej nie unaocznia przyspieszenia, jakie powinna przynieść szyna 1333 MHz.
Trochę ciężkiej pracy
Popatrzmy, jak przyspieszona o jedną trzecią szyna FSB sprawdza się w rzeczywistych aplikacjach, szczególnie tych, które bardzo obciążają komputer. Na początek – WinRAR, program, którego szybkość jest bardzo silnie uzależniona od szybkości komunikacji z pamięcią RAM.
Zgodnie z oczekiwaniami, w tym programie szybsza szyna FSB przynosi pozytywny, choć nie olśniewający wynik. Ale trudno się dziwić – przyspiesza ona komunikację z pamięcią jedynie na odcinku procesor-chipset, a przepływność pamięci pozostaje bez zmian.
3ds max 8 nie jest polem do popisu dla przyspieszonej szyny – jednakowo taktowane procesory mają dokładnie jednakowe osiągi, bez względu na szybkość szyny. Skoro renderowana ramka ma rozdzielczość HDTV (1920x1080) i zawiera odpowiednią do tego objętość danych, to trochę dziwny wydaje się fakt braku zależności pomiędzy szybkością szyny a wydajnością. Wyjaśnienie jest jednak proste – złożone operacje renderingu wykonywane są na danych w cache, a ich stosunkowo długi czas trwania sprawia, że przesłania danych pomiędzy RAM a cache występują na tyle rzadko, że szybkość szyny praktycznie nie odgrywa roli.
Podobnie, jak w przypadku 3ds max, również i Cinebench nie ujawnia przewagi E6750 nad E6700, z takich samych przyczyn.
Szachy to nie praca, ale włączyliśmy do naszych testów benchmark szachowy ze względu na to, że struktura jego kodu jest zbliżona do struktur takich aplikacji, jak AI czy systemy eksperckie, a więc całkiem profesjonalnych.
Jednak pomimo tego, że program bardzo intensywnie korzysta z pamięci RAM i jest szczególnie wrażliwy na opóźnienia przesłań, uzyskiwane dzięki szybszej szynie przyspieszenie ma i tutaj charakter śladowy.
Widzimy więc, że podobnie jak w testach syntetycznych, również w aplikacjach przeznaczonych do pracy przyspieszona szyna FSB pokazuje swoje możliwości jedynie w nielicznych przypadkach, a zysk wydajności jest i tak niewielki. Zanim jednak uznamy 1333-megahercową szynę za zbędną ekstrawagancję, zerknijmy jeszcze, co przynosi ona w grach.
Chwila rozrywki
Jaki efekt da nam szybsza szyna w grach? Zacznijmy od Quake 4, gry już dość starej, ale bardzo charakterystycznej, jeśli chodzi o szybkość – z dotychczasowych testów wynika, że na uzyskiwane osiągi wpływa w niej wyraźnie zarówno wydajność procesora, jak i szybkość dostępu do pamięci RAM.
Jak już to było w kilku testach, rejestrujemy i tutaj pewien paradoks – E6700 i E6750 osiągają identyczny rezultat, tymczasem E6550 uzyskuje wyraźne przyspieszenie, dorównując E6600.
Identyczne rezultaty przynosi Far Cry – tu również różnica pomiędzy układami z takim samym zegarem jest znikoma, w granicach błędu pomiaru, tymczasem E6550 znów prawie dorównuje E6600.
Prey z kolei staje się polem porażki E6550 – o ile we wcześniejszych testach dość często procesor ten dorównywał szybciej taktowanemu E6600, to Prey spozycjonował go na miejscu odpowiadającym częstotliwości zegara. Tu szybsza szyna nie na wiele się zdała...
Wszystko wskazuje na to, że korzyść z przyspieszonej szyny FSB jest w grach równie znikoma jak w aplikacjach użytkowych, a w wielu przypadkach wręcz żadna. Poczekajmy na końcowe wnioski... i poznajmy prawdziwe walory nowej rodziny procesorów Intela.
Ukryta rewelacja
We wstępnej prezentacji nowych procesorów Intela wspomnieliśmy o zastosowanej w nich nowej wersji steppingu B, oznaczonej G0. Okazuje się, że nowy stepping ma niebagatelne znaczenie, jeśli chodzi o możliwości częstotliwościowe procesora – tak E6750, jak i E6550 okazują się prawdziwą rewelacją, jeśli chodzi o podkręcanie. Zaczęliśmy od E6750, „z pewną taką nieśmiałością”...
Częstotliwość 3,2 GHz to żadna rewelacja – prawie każdy z procesorów Core 2 Duo jest zdolny do pracy z takimi parametrami.
Częstotliwość 3,6 GHz uzyskaną bez podnoszenia napięcia zasilania jądra można byłoby uznać za pewien sukces, ale wygląda na to, że jest jeszcze pole do popisu...
I rzeczywiście, pole do popisu znalazło się, choć niewielkie – 3,8 GHz przy standardowych parametrach to już chyba dobry wynik. Ale na tym nie koniec – bliższa analiza pokazała, że zahamowanie na 3,8 GHz jest spowodowane nie przez procesor, a przez użytą w testach pamięć. Taka miła cecha chipsetu P35, pokazana w szczegółach przy okazji testów pierwszych płyt z tym układem...
Podobnie podatny na kręcenie wydaje się być wolniejszy i tańszy model – E6550. Ale do prób z podkręcaniem go na pewno nie nadaje się płyta główna z chipsetem P35 – ze względu na ograniczenia, wprowadzane przez pamięć, stabilne maksimum czestotliwości wypadło dość mizernie w porównaniu z E6750.
„Mizernie”, ale mimo wszystko nieźle – pamiętajmy, że jest to w praktyce częstotliwość użytkowa, przy nominalnych parametrach otoczenia. Przy zastosowaniu szybszych pamięci wynik byłby lepszy, ale to chyba nieopłacalne – różnicę cen pamięci lepiej dołożyć do ceny szybszego modelu procesora.
Ciąg dalszy OC – bez sukcesów
Liczyliśmy na to, że zmiana pamięci RAM na Dominatory Corsaira, eliminując ograniczenie wnoszone przez dzielnik częstotliwości taktowania RAM, pozwoli na dalsze przyspieszanie E6750, może nawet do 4 GHz. Początek był dość obiecujący...
Niestety, przy tej częstotliwości taktowania trudno było mówić o stabilności – niektóre programy działały poprawnie, inne – mniej poprawnie. Programik Orthos, chętnie używany w testach stabilności, po sekundzie działania pokazywał błędy wyników obliczeń wykonywanych przez jednostki SSE. I nie dało się tego usunąć nawet przy zmianach napięcia w zakresie 1,40-1,65 V...
Czasami do uzyskania stabilności wystarczy lekkie spowolnienie. Czasami – tak, ale to chyba nie jest „ten czas” – drobna korekta nie wystarczyła... ten sam błąd w tym samym momencie!
Powiew nadziei – pierwsze wrażenie, jakby miało być dobrze. Kilka aplikacji pracuje bez zarzutu, ale bezlitosny Orthos ponownie informuje o błędzie SSE. I ponownie zwiększanie napięcia zasilania jądra, nawet do 1,65 V, nie przynosi poprawy sytuacji.
Zdecydowany opór, jaki testowany procesor stawia dalszemu podkręcaniu, może mieć dwie przyczyny. Pierwszą, z pozoru najprawdopodobniejszą, jest to, że któryś z tranzystorów jednostki SSE „wyszedł” w procesie produkcyjnym gorzej niż inne. Jednak przeczy temu całkowity brak efektów przy podnoszeniu napięcia. Powstaje więc podejrzenie, że ograniczenie wynika z planu dystrybucji sygnału zegara, czyli jest „wbudowane” w procesor... Niekoniecznie celowo – zawsze musi istnieć jakiś element, do którego sygnał zegara dociera najpóźniej. O tym, czy tak jest w istocie, przekonamy się za jakiś czas, gdy do użytkowników trafi większa liczba E6750 i będzie możliwa konfrontacja wyników prób podkręcania i barier wstrzymujących te próby.
Na razie możemy jedynie przyznać się do tego, że powyżej 3,8 GHz nie udało się uzyskać stabilnej pracy testowanego procesora. A może to ja mam dwie lewe ręce? Wielu Czytelników zapewne przychyli się do tej wersji...
Optymistyczne podsumowanie
Przedstawione powyżej wyniki testów sugerują jednoznacznie, że 1333-megahercowa szyna FSB nowych procesorów Intela jest w obecnej chwili niepotrzebna, a jedynie ogranicza możliwość wykorzystania nowych procesorów w odrobinę starszych płytach. Jest w tym sporo racji, ale musimy wziąć pod uwagę, że procesorów nie projektuje się „wstecz” – nowy układ ma raczej wymuszać i przyspieszać rozwój nowej infrastruktury, taka jest przynajmniej rola rodziny E6x50. Szynę pracującą z częstotliwością 1333 MHz będą miały 45-nanometrowe Penryny, a na ich przyjście powinna już istnieć silna infrastruktura dla takiej szyny, powstała w wyniku popularności E6x50, przede wszystkim zaś spopularyzowane i tańsze pamięci DDR3-1333. Strategia prosta i przejrzysta.
Dlaczego układy E6x50 miałyby być atrakcyjniejsze od serii E6x00? Zapytajcie miłośników overclockingu! Przypominam, że kolejne po pierwszych Conroe steppingi procesorów Intel Core 2 Duo podkręcały się zdecydowanie gorzej, niż pierwszy. Właśnie w celu zyskania popularności wśród opiniotwórczej grupy overclockerów i entuzjastów Intel zaserwował w tych układach „wyścigowy” stepping G0.
No i udało się w ten sposób połączyć pożyteczne z przyjemnym – Intel zyskał niezłe narzędzie do intensyfikacji planowanych zmian na rynku, a my – procesor, który prawie czyni cuda!