
Procesor Intel Core 2 Duo (nazwa kodowa: Conroe) niedługo trafi na rynek, a informacje o jego wydajności, jakie zaczęły się od pewnego czasu pojawiać, sprawiają że czekamy z coraz większą niecierpliwością. Zanim jednak poznamy wyniki testów, zobaczmy, co też takiego ma ten procesor w środku - dowiemy się w ten sposób, czego się można po nim spodziewać w praktyce. Zapraszamy do zwiedzania makro- i mikroarchitektury Intel Core 2.
Podwójne, a w przyszłości zwielokrotnione jądro, to rozwiązanie lansowane od pewnego czasu jako środek zwiększania wydajności procesorów - praktycznie jedyny wobec zahamowania przez fizykę możliwości przyspieszania zegarów i wyczerpania możliwości rozwoju mikroarchitektury układów. Wyczerpania? Conroe/Merom/Woodcrest udowadnia, że lansowany za czasów Pentium 4 pogląd o wyczerpaniu możliwości rozwoju był całkowicie błędny.
Podwójność pozorowana
Zostawmy na później mikroarchitekturę i na początek prześledźmy różne koncepcje realizacji podwójnego jądra w dotychczasowych procesorach Intela. Podstawą tych koncepcji jest architektura SMP - Symmetrical MultiProcessing - w której wszystkie procesory mają jednakowy dostęp do pozostałych zasobów komputera. Od tej koncepcji wyszedł Intel w swojej pierwszej konstrukcji dwurdzeniowej.
Podwójne jądro procesorów Smithfield to w rzeczywistości klasyczna konfiguracja SMP, złożona z dwóch niezależnych procesorów na jednym chipie - złośliwi mówią, że to po prostu dwa sąsiadujące ze sobą na waflu Prescotty, wycięte jako jeden kawałek.
SMP na jednym chipie sprawdziło się zadowalająco, ale... im większy jest chip, tym mniejszy procentowy uzysk sprawnych chipów z jednego wafla, więc w następnej konstrukcji "dwurdzeniowej", o kodowej nazwie Presler, Intel zrezygnował z pozorowania podwójnego jądra.
|
|
Presler to dwa całkiem osobne procesory Cedar Mill, umieszczone na wspólnej płytce podłoża. Zarówno w układzie Smithfield jak i w Preslerze dwa procesory, wchodzące w skład konstrukcji, połączone są ze sobą wspólna szyną FSB. Za jej pośrednictwem odbywa się rozwiązywanie podstawowego problemu architektur wieloprocesorowych, jakim jest uzgadnianie spójności cache. O co tu chodzi?
Problem spójności cache
Współczesne procesory wykonują operacje przede wszystkim na danych zawartych w systemie pamięci podręcznych cache. Co prawda w zestawach instrukcji SSE przewidziano możliwość operacji z pominięciem cache, jednak w praktyce są one bardzo rzadko stosowane. Wyobraźmy sobie sytuację, w której jeden z procesorów zmodyfikował dane, na których dalsze operacje ma wykonywać drugi - w jego pamięci cache dane te nie są zmodyfikowane! W układach przewidzianych do stosowania w konfiguracjach wieloprocesorowych stosuje się więc systemy zachowania spójności cache (cache coherency). W sytuacji takiej jak wyżej opisana odwołanie do zmodyfikowanych przez inny procesor danych wymaga przesłania ich z pamięci cache procesora - autora modyfikacji - do pamięci cache procesora podejmującego dalszą obróbkę. W większości procesorów przy uzgadnianiu spójności cache przesyłana jest zawartość całego wiersza - 64 bajty. Transmisja taka blokuje dostęp do szyny FSB, a procesor, który ma dalej obrabiać dane, traci całkiem sporo czasu oczekując na jej zakończenie. W procesorach Intela strata ta jest minimalizowana przez dużą szybkość szyny FSB, jednak mimo to jest znacząca - szesnaście cykli transmisyjnych szyny, potrzebne do przesłania 64 bajtów, to stracone kilkadziesiąt cykli zegara procesora. Jeśli do tego dodamy czas tracony na przesłanie informacji o modyfikacjach i czas potrzebny do nawiązania transmisji, widzimy wyraźnie słabe strony SMP. Praktycznie mierzony czas komunikacji cache L2-cache L2 w architekturach SMP Smithfield i Presler wynosi około 200 nanosekund. Problem spójności dotyczy nie tylko cache L2, ale także pamięci podręcznej pierwszego poziomu dla danych. Pamięć ta jest jednak w intelowskich architekturach niewielka, więc problem spójności występuje relatywnie rzadziej.
SMP również w K8
Architektura K8 od początku projektowana była z myślą o podwójnym rdzeniu. W praktyce jednak K8 z dwoma rdzeniami to dwa osobne procesory, wyposażone we wspólny zestaw interfejsów dostępny za pośrednictwem przełącznika krzyżowego. Ta swoista forma architektury SMP, bo trudno to inaczej określić, ma nad klasyczną SMP zasadniczą przewagę - dzięki komunikacji przez przełącznik krzyżowy transmisja danych przy uzgadnianiu spójności cache odbywa się z szybkością taktowania zegara procesora. Czas trwania tego procesu jest dzięki temu znacznie krótszy niż przy klasycznej architekturze SMP, jednak cała procedura też trochę trwa. Warto zauważyć, że architektura systemu pamięci cache w K8, nazwana exclusive cache, eliminuje problem spójności L1 - uzgodnienie danych obejmuje całość podsystemu, równocześnie L1 i L2. Mierzony praktycznie czas komunikacji L2-L2 w procesorze Athlon 64 to 110 nanosekund. Znacznie krócej, niż w przypadku Pentium D, jednak - podobnie jak przy połączeniu SMP na poziomie szyny FSB transmisja blokowała szynę, tak przy połączeniu na poziomie przełącznika krzyżowego transmisja zajmuje ten przełącznik, odcinając na pewien czas obydwa jądra od możliwości komunikacji z otoczeniem. Jedyną korzyścią jest krótszy czas oczekiwania przez procesor przejmujący dane - tym zresztą tłumaczy się fakt, że procesory Athlon 64 X2 zyskują na podwójnym jądrze więcej wydajności niż układy Pentium D. Ale problem spójności cache można rozwiązać w bardzo prosty sposób...
- AMD A4-3300, A4-3400 kontra Intel Celeron G460, G540 oraz Pentium G630 i G850 – testujemy najtańsze procesory z układem graficznym 129
- AMD A10-4600M – mobilne Trinity kontra Core i3 oraz Core i5 326
- Core i5-3570K – Ivy Bridge łagodniejszy dla portfela 240
- Podkręcanie Ivy Bridge – czy bez IHS-a jest lepiej? 136
- Intel Core i7-3770K – pierwszy 22-nanometrowy procesor desktopowy 213
- AMD E-450 kontra Intel Atom N2800 – co lepsze do mini-PC? 47
- Intel Core i7-3820 – test najtańszego procesora LGA2011 49
- AMD FX-4100, FX-6100 i FX-8120, czyli buldożery z napędem na 2, 3 i 4 fajerki 123
- AMD Trinity APU – co wiemy o następcy Llano? 57
- AMD A8-3850 (Llano APU) – pierwszy układ Fusion do desktopów 226
- AMD FX-8150 – mikroarchitektura Bulldozer i nowa generacja procesorów AMD 608
- Sandy Bridge E – testujemy procesory Core i7-3960X oraz i7-3930K 141
- Intel Core i7-3770K – pierwszy 22-nanometrowy procesor desktopowy 213
- Test procesorów za 300–400 zł 126
- AMD E-450 kontra Intel Atom N2800 – co lepsze do mini-PC? 47
- ASUS OC School, czyli szkoła podkręcania. Część 2. – niedoceniane cechy X58 45
- AMD FX-4100, FX-6100 i FX-8120, czyli buldożery z napędem na 2, 3 i 4 fajerki 123
- Procesor AMD FX podkręcony do 8,4 GHz 155
- AMD A8-3850 (Llano APU) – pierwszy układ Fusion do desktopów 226
- Procesor AMD FX podkręcony do 8,4 GHz 155
- Sandy Bridge E – testujemy procesory Core i7-3960X oraz i7-3930K 141
- Podkręcanie Ivy Bridge – czy bez IHS-a jest lepiej? 136
- AMD APU A6-3650 (Llano) – tańszy model procesora Fusion ze zintegrowanym układem graficznym 96
- OC School – niedoceniane zalety chipsetu Intel X58, materiał wideo 34
- AMD Trinity APU – co wiemy o następcy Llano? 57
- AMD A10-4600M – mobilne Trinity kontra Core i3 oraz Core i5 326
- AMD FX-4100, FX-6100 i FX-8120, czyli buldożery z napędem na 2, 3 i 4 fajerki 123
- "Ivy Bridge" podkręcony do ponad 7 GHz 22
- Procesory AMD "Trinity" nagrodzone. "Najlepszy wybór targów Computex Taipei 2012" 21
- AMD FX-8150 podkręcony do niemal 9 GHz 30
- Czterordzeniowy "Ivy Bridge" bez procesora grafiki 12
- Nowe "Efiksy" trafią do produkcji w trzecim kwartale 42
- Lista nowych mobilnych chipsetów Intela ujawniona 5
- Ceny dwurdzeniowych mobilnych procesorów "Ivy Bridge" ujawnione 13
- AMD "Trinity" dla komputerów stacjonarnych pojawią się w sierpniu. Mobilne już niebawem 18
- Pierwsze procesory "Ivy Bridge" już w sprzedaży 22
- Nowy firmware do aparatu Fujifilm FinePix XP150
- Olympus VR-340 - aparat kompaktowy dla oszczędnych
- Sharp zaprezentował 13,5-calowy ekran QFHD
- Odtwarzacze Blu-ray BDP5500 i BDP7700 marki Philips
- Gorenje ma niższe przychody, ale wyższe zyski
- AData oferuje nowe karty pamięci SDHC, SDXC i microSDHC
- Sony pokazało pierwszy projektor kina domowego z 4K
- Hannspree wprowadza na polski rynek dwa nowe telewizory
- Odtwarzacz Blu-ray Samsung BD-E8300 z tunerem DVB-T
- Uchwyt samochodowy do iPada CarGo - rozrywkowe podróże 0
- Jonathan 'Fatal1ty' Wendel prezentuje płyty ASRock w Polsce 2
- Bez słuchawek trudno wyjść z domu 0
- Manta prezentuje odswieżony tablet PowerTab MID05S 0
- Akcesoria poszerzają możliwości fotografa 0
- LilyJade – nowy robak atakuje przez Facebooka 0
- Rok na jednym paluszku 0
- Philips PicoPix 2480, czyli przenośne kino w kieszeni 1
- Otwarta obudowa AeroCool Strike-X AIR 4
- Czy potrzebujemy nowej wersji Androida? 1
- Dobry uchwyt to podstawa 0
- Razer BlackShark Battlefield 3 - nadchodzi prawdziwie drapieżny zestaw słuchawkowy! 2
- Kolekcjonerskie słuchawki dla fanów Battlefield 3 - Razer BlackShark 1
- Firma Manta Multimedia została oficjalnym partnerem Reprezentacji Polski w Piłce Nożnej! 1
- Zasil swoją sieć z AirLive dzięki PoE-FSH8PW 0
- 72Prekariat05:47 | Return of Gordon Lameman
- 17Uwaga Oszust Krętacz Zagato_V12 aka xDave705:36 | toomek77
- 115panie przodem05:36 | ŚLEDŹ
- 3nalepszy ale i nie za drogi xD papier do brother dcp-j12505:27 | grongor
- 7377World of Tanks04:52 | Master_Chief
- 4463NVIDIA GeForce 6xx - Oficjalny temat04:32 | eloszki
- 8Hard Reset benchmark04:11 | rolandwally83
- 19System nie uruchamia się po dodaniu ramu03:57 | dr Bliss
- 31161Battlefield 303:11 | Tonic
- 25614Anime - temat ogólny03:08 | misticzx
- 115panie przodem05:36 | ŚLEDŹ
- 7377World of Tanks04:52 | Master_Chief
- 4463NVIDIA GeForce 6xx - Oficjalny temat04:32 | eloszki
- 31161Battlefield 303:11 | Tonic
- 25614Anime - temat ogólny03:08 | misticzx
- 1323Max Payne 302:41 | Moonglow
- 6160League of Legends [LoL]02:39 | YasiuSpacerowicz
- 11590Diablo 3 - oficjalny temat01:25 | aY227
- 1319Lista polecanych kart dźwiękowych01:18 | Ven
- 28936Prezentujemy swoje maszynki.01:16 | MaxForces










0%
Brawa dla Pana Sobkowskiego za wspaniały artykuł. Dzieki takim artykułom enter jest taki interesujący. Mam nadzieje ze publikacje pana R.S. zagoszczą na stałe na PCLabie, bede mógł wtedy zapomnieć o zakupach w kiosku.
Pozdarawiam.
0%
Ja wolę jednak poczekać na K8L.
0%
Jakie znowu 4 tysiące?
0%
0%
A odnośnie tematu - Intel chyba w końcu wyciągnął wnioski ze "średnio" udanej architektury NetBurst... jesli na dodatek cena najwolniejszych modeli tych procesorów będzie oscylowała w granicach 800-900zł to szykuje się naprawdę bardzo dobry produkt...
I sam jestem ciekaw jaka rzeczywiście będzie odpowiedź AMD na Conroe? (tzn. jak będzie ze wzrostem wydajności w K8L gdy już się pojawi na rynku).
0%
Ja wolę jednak poczekać na K8L.
Tylko kto takie coś kupuje
A jeżeli chodzi o k8l to myślisz że te proce będą rozdawali za darmo i będą one jednocześnie kilkanaście razy wydajne niż np.k8
Pozdrawiam
Mówię o najwyższym modelu.