
Procesor Intel Core 2 Duo (nazwa kodowa: Conroe) niedługo trafi na rynek, a informacje o jego wydajności, jakie zaczęły się od pewnego czasu pojawiać, sprawiają że czekamy z coraz większą niecierpliwością. Zanim jednak poznamy wyniki testów, zobaczmy, co też takiego ma ten procesor w środku - dowiemy się w ten sposób, czego się można po nim spodziewać w praktyce. Zapraszamy do zwiedzania makro- i mikroarchitektury Intel Core 2.
Podwójne, a w przyszłości zwielokrotnione jądro, to rozwiązanie lansowane od pewnego czasu jako środek zwiększania wydajności procesorów - praktycznie jedyny wobec zahamowania przez fizykę możliwości przyspieszania zegarów i wyczerpania możliwości rozwoju mikroarchitektury układów. Wyczerpania? Conroe/Merom/Woodcrest udowadnia, że lansowany za czasów Pentium 4 pogląd o wyczerpaniu możliwości rozwoju był całkowicie błędny.
Podwójność pozorowana
Zostawmy na później mikroarchitekturę i na początek prześledźmy różne koncepcje realizacji podwójnego jądra w dotychczasowych procesorach Intela. Podstawą tych koncepcji jest architektura SMP - Symmetrical MultiProcessing - w której wszystkie procesory mają jednakowy dostęp do pozostałych zasobów komputera. Od tej koncepcji wyszedł Intel w swojej pierwszej konstrukcji dwurdzeniowej.
Podwójne jądro procesorów Smithfield to w rzeczywistości klasyczna konfiguracja SMP, złożona z dwóch niezależnych procesorów na jednym chipie - złośliwi mówią, że to po prostu dwa sąsiadujące ze sobą na waflu Prescotty, wycięte jako jeden kawałek.
SMP na jednym chipie sprawdziło się zadowalająco, ale... im większy jest chip, tym mniejszy procentowy uzysk sprawnych chipów z jednego wafla, więc w następnej konstrukcji "dwurdzeniowej", o kodowej nazwie Presler, Intel zrezygnował z pozorowania podwójnego jądra.
|
|
Presler to dwa całkiem osobne procesory Cedar Mill, umieszczone na wspólnej płytce podłoża. Zarówno w układzie Smithfield jak i w Preslerze dwa procesory, wchodzące w skład konstrukcji, połączone są ze sobą wspólna szyną FSB. Za jej pośrednictwem odbywa się rozwiązywanie podstawowego problemu architektur wieloprocesorowych, jakim jest uzgadnianie spójności cache. O co tu chodzi?
Problem spójności cache
Współczesne procesory wykonują operacje przede wszystkim na danych zawartych w systemie pamięci podręcznych cache. Co prawda w zestawach instrukcji SSE przewidziano możliwość operacji z pominięciem cache, jednak w praktyce są one bardzo rzadko stosowane. Wyobraźmy sobie sytuację, w której jeden z procesorów zmodyfikował dane, na których dalsze operacje ma wykonywać drugi - w jego pamięci cache dane te nie są zmodyfikowane! W układach przewidzianych do stosowania w konfiguracjach wieloprocesorowych stosuje się więc systemy zachowania spójności cache (cache coherency). W sytuacji takiej jak wyżej opisana odwołanie do zmodyfikowanych przez inny procesor danych wymaga przesłania ich z pamięci cache procesora - autora modyfikacji - do pamięci cache procesora podejmującego dalszą obróbkę. W większości procesorów przy uzgadnianiu spójności cache przesyłana jest zawartość całego wiersza - 64 bajty. Transmisja taka blokuje dostęp do szyny FSB, a procesor, który ma dalej obrabiać dane, traci całkiem sporo czasu oczekując na jej zakończenie. W procesorach Intela strata ta jest minimalizowana przez dużą szybkość szyny FSB, jednak mimo to jest znacząca - szesnaście cykli transmisyjnych szyny, potrzebne do przesłania 64 bajtów, to stracone kilkadziesiąt cykli zegara procesora. Jeśli do tego dodamy czas tracony na przesłanie informacji o modyfikacjach i czas potrzebny do nawiązania transmisji, widzimy wyraźnie słabe strony SMP. Praktycznie mierzony czas komunikacji cache L2-cache L2 w architekturach SMP Smithfield i Presler wynosi około 200 nanosekund. Problem spójności dotyczy nie tylko cache L2, ale także pamięci podręcznej pierwszego poziomu dla danych. Pamięć ta jest jednak w intelowskich architekturach niewielka, więc problem spójności występuje relatywnie rzadziej.
SMP również w K8
Architektura K8 od początku projektowana była z myślą o podwójnym rdzeniu. W praktyce jednak K8 z dwoma rdzeniami to dwa osobne procesory, wyposażone we wspólny zestaw interfejsów dostępny za pośrednictwem przełącznika krzyżowego. Ta swoista forma architektury SMP, bo trudno to inaczej określić, ma nad klasyczną SMP zasadniczą przewagę - dzięki komunikacji przez przełącznik krzyżowy transmisja danych przy uzgadnianiu spójności cache odbywa się z szybkością taktowania zegara procesora. Czas trwania tego procesu jest dzięki temu znacznie krótszy niż przy klasycznej architekturze SMP, jednak cała procedura też trochę trwa. Warto zauważyć, że architektura systemu pamięci cache w K8, nazwana exclusive cache, eliminuje problem spójności L1 - uzgodnienie danych obejmuje całość podsystemu, równocześnie L1 i L2. Mierzony praktycznie czas komunikacji L2-L2 w procesorze Athlon 64 to 110 nanosekund. Znacznie krócej, niż w przypadku Pentium D, jednak - podobnie jak przy połączeniu SMP na poziomie szyny FSB transmisja blokowała szynę, tak przy połączeniu na poziomie przełącznika krzyżowego transmisja zajmuje ten przełącznik, odcinając na pewien czas obydwa jądra od możliwości komunikacji z otoczeniem. Jedyną korzyścią jest krótszy czas oczekiwania przez procesor przejmujący dane - tym zresztą tłumaczy się fakt, że procesory Athlon 64 X2 zyskują na podwójnym jądrze więcej wydajności niż układy Pentium D. Ale problem spójności cache można rozwiązać w bardzo prosty sposób...
- AMD Trinity APU – co wiemy o następcy Llano? 57
- Sandy Bridge E – testujemy procesory Core i7-3960X oraz i7-3930K 141
- AMD FX-8150 – mikroarchitektura Bulldozer i nowa generacja procesorów AMD 608
- Test procesorów za 300–400 zł 126
- Procesor AMD FX podkręcony do 8,4 GHz 155
- AMD APU A6-3650 (Llano) – tańszy model procesora Fusion ze zintegrowanym układem graficznym 96
- OC School – niedoceniane zalety chipsetu Intel X58, materiał wideo 32
- ASUS OC School, czyli szkoła podkręcania. Część 2. – niedoceniane cechy X58 45
- AMD A8-3850 (Llano APU) – pierwszy układ Fusion do desktopów 225
- AMD A8-3850 (Llano APU) – pierwszy układ Fusion do desktopów 225
- Sandy Bridge E – testujemy procesory Core i7-3960X oraz i7-3930K 141
- AMD FX-8150 – mikroarchitektura Bulldozer i nowa generacja procesorów AMD 608
- Wyciskanie soków z Sandy Bridge – fakty i mity na temat podkręcania procesora oraz specjalnie przeznaczonej do niego pamięci 72
- Test procesorów za 300–400 zł 126
- Intel Core i7-990X – najnowszy sześciordzeniowiec Intela do najbardziej ekstremalnych zastosowań 70
- ASUS OC School, czyli szkoła podkręcania. Część 2. – niedoceniane cechy X58 45
- Intel Core i7-2820QM – test czołowego modelu procesora Sandy Bridge do laptopów 28
- Procesor AMD FX podkręcony do 8,4 GHz 155
- AMD A8-3850 (Llano APU) – pierwszy układ Fusion do desktopów 225
- Procesor AMD FX podkręcony do 8,4 GHz 155
- Sandy Bridge E – testujemy procesory Core i7-3960X oraz i7-3930K 141
- OC School – niedoceniane zalety chipsetu Intel X58, materiał wideo 32
- AMD APU A6-3650 (Llano) – tańszy model procesora Fusion ze zintegrowanym układem graficznym 96
- AMD Trinity APU – co wiemy o następcy Llano? 57
- Wyciskanie soków z Sandy Bridge – fakty i mity na temat podkręcania procesora oraz specjalnie przeznaczonej do niego pamięci 72
- Intel Core i7-2820QM – test czołowego modelu procesora Sandy Bridge do laptopów 28
- Intel Core i7-990X – najnowszy sześciordzeniowiec Intela do najbardziej ekstremalnych zastosowań 70
- Procesory x86 wciąż przegrywają z ARM. Przez ceny 38
- IBM jednak nie będzie produkować procesorów AMD 20
- Nowe Athlony II X4 przeznaczone dla podstawki FM1 19
- Jagodowe Atomy dla telewizorów i set-top-boksów 5
- Istota "trójcy" według AMD: Piledriver, Northern Islands i...? 15
- 28-nanometrowe APU firmy AMD - oficjalnie dopiero za rok 14
- AMD "Trinity" w testach grafiki zmiażdży całą ofertę Intela. "Ivy Bridge" też 44
- IBM będzie produkować procesory AMD "Trinity" 25
- AMD anulowało 10- i 20-rdzeniowe procesory 20
- AMD anulowało 10- i 20-rdzeniowe procesory 20
- AMD "Trinity" w testach grafiki zmiażdży całą ofertę Intela. "Ivy Bridge" też 44
- Procesory x86 wciąż przegrywają z ARM. Przez ceny 38
- IBM będzie produkować procesory AMD "Trinity" 25
- Kolejne testy Ivy Bridge pojawiły się w sieci 25
- IBM jednak nie będzie produkować procesorów AMD 20
- Istota "trójcy" według AMD: Piledriver, Northern Islands i...? 15
- Nowe Athlony II X4 przeznaczone dla podstawki FM1 19
- 28-nanometrowe APU firmy AMD - oficjalnie dopiero za rok 14
- Nowe Athlony II X4 przeznaczone dla podstawki FM1 19
- AMD anulowało 10- i 20-rdzeniowe procesory 20
- AMD "Trinity" w testach grafiki zmiażdży całą ofertę Intela. "Ivy Bridge" też 44
- 28-nanometrowe APU firmy AMD - oficjalnie dopiero za rok 14
- IBM będzie produkować procesory AMD "Trinity" 25
- Procesory x86 wciąż przegrywają z ARM. Przez ceny 38
- Kolejne testy Ivy Bridge pojawiły się w sieci 25
- Istota "trójcy" według AMD: Piledriver, Northern Islands i...? 15
- IBM jednak nie będzie produkować procesorów AMD 20
- Google Bouncer – sposób na ostateczne rozprawienie się ze szkodliwymi programami w Android Markecie? 0
- JUŻ JEST AIWI MOTION DETECTOR KOZUMI W POLSCE! Dostępny tylko w ACTION! Sprawdź już dziś! 2
- Podróże z kamerą w samochodzie 1
- ZyNOS 4.0: nowe certyfikowane oprogramowanie IPv6 do przełączników ZyXELa 0
- Brennestuhl: domowy sprzęt elektryczny na wyciągnięcie ręki 1
- Niezależny test programów antywirusowych - dostajesz to, za co płacisz 2
- Komputronik Pro-DH600: kompaktowe desktopy dla firm 3
- Legendarne etui G-Form do tabletów na polskim rynku 5
- Genius na CES 2012 3
- Trojany kradnące dane bankowe atakują tysiące komputerów każdego dnia 0
- Xavax: tańsze ogrzewanie domu przez Internet 6
- Tablety Lark FreeMe: tak tanio jeszcze nie było 2
- Atak phishingowy na użytkowników Allegro - rzekome zwolnienie z prowizji 2
- Polska premiera kart Radeon HD 7950: Asus, HIS, Gigabyte 2
- 2011 - dobry rok dla graczy sponsorowanych przez SteelSeries. 2012 zapowiada się równie dobrze... 2
- 1windows 7 nie da sie zainstalowac19:47 | nilotikus
- 0[warsztaty] Startup Weekend Trójmiasto19:46 | apa-sf
- 4Cooler Master HAF 912 Plus vs cooler master 690 ii advanced19:46 | Sancho Panda
- 6Sprzedam: FiiO E7, iriver E100 8GB, ac rc pro x2, interkonekt audio, kondy, śledzie19:46 | rayfe
- 1884WĄTEK ZBIORCZY - Lista polecanych zasilaczy19:45 | bic44
- 222Dlaczego Jaruzelskiego nie zamknęli jeszcze za stan wojenny?19:45 | usrsrc
- 0Pieczenie Galaxy GF 8800GT19:45 | szymich
- 5Domena + serwer19:45 | SpiderWeb
- 74Samsung SSD 830 Series 256 GB - Problem z wydajnością19:44 | ficias
- 23i5 2500k dziwne rzeczy19:44 | Anannke
- 1884WĄTEK ZBIORCZY - Lista polecanych zasilaczy19:45 | bic44
- 222Dlaczego Jaruzelskiego nie zamknęli jeszcze za stan wojenny?19:45 | usrsrc
- 3248FIFA 1219:43 | PowerOfIce
- 5427[Wątek Główny] Sandy Bridge19:42 | Assassin
- 4958Porozumienie ACTA19:41 | islandx
- 25528Prezentujemy swoje maszynki.19:39 | Think
- 4571The Elder Scrolls V Skyrim19:35 | Apio_jest_tylko_jeden
- 9847Tanie granie19:34 | Nigihayami
- 204Sandy Bridge za 170zł czyli Celeron G530 (2C/2T) 2,4GHz19:33 | chrupPL
- 485Red Letter Day19:30 | chrupPL


0%
Brawa dla Pana Sobkowskiego za wspaniały artykuł. Dzieki takim artykułom enter jest taki interesujący. Mam nadzieje ze publikacje pana R.S. zagoszczą na stałe na PCLabie, bede mógł wtedy zapomnieć o zakupach w kiosku.
Pozdarawiam.
0%
Ja wolę jednak poczekać na K8L.
0%
Jakie znowu 4 tysiące?
0%
0%
A odnośnie tematu - Intel chyba w końcu wyciągnął wnioski ze "średnio" udanej architektury NetBurst... jesli na dodatek cena najwolniejszych modeli tych procesorów będzie oscylowała w granicach 800-900zł to szykuje się naprawdę bardzo dobry produkt...
I sam jestem ciekaw jaka rzeczywiście będzie odpowiedź AMD na Conroe? (tzn. jak będzie ze wzrostem wydajności w K8L gdy już się pojawi na rynku).
0%
Ja wolę jednak poczekać na K8L.
Tylko kto takie coś kupuje
A jeżeli chodzi o k8l to myślisz że te proce będą rozdawali za darmo i będą one jednocześnie kilkanaście razy wydajne niż np.k8
Pozdrawiam
Mówię o najwyższym modelu.