komentarze
ntt_systemZobacz profil
Poziom ostrzeżenia: 0%
ntt_system2006.11.12, 22:16
i tym oto sposobem widzimy poczatek konca podniecania sie intelem smilies/szczerbaty.gif , pisalem ze beda 4 rdzenie? no ale wykasowali post bo byla klutnia.
*Konto usunięte*2006.11.09, 08:22
CYTAT(Svean @ 7 listopada 2006, 13:56) <{POST_SNAPBACK}>
Chłopaki - tylko sie nie pobijcie! smilies/szczerbaty.gif

Moim zdaniem artykuł jest bardzo obiektywny - mówi, że AMD nic nie mówi, i że to może dobrze, a może niekoniecznie. Po czym fani Intela mówią, że będzie kicha, a fani AMD że będzie super, a serwis reklamuje Intela więc pewnie dlatego nie pisze jasno że K8L będzie boski. A w sumie nic nie wiadomo i tzreba będzie poczekać do premiery i pierwszych testów.

Ja osobiście liczę, że K8L skopie tyłek Conroe i podwyższy poprzeczkę nowym pomysłom Intela, ale nie zauważyłem podejścia anty-AMD ani autora artykułu, ani samego PCLab-u.

ale ile mine zanim to cos sie pokaze w polskich sklepach bo to prawie rok

prawie rok to kupe czasu a liczczy sie co aktualnie ma a nie co bedzie miec
smilies/szczerbaty.gif
SveanZobacz profil
Poziom ostrzeżenia: 0%
Svean2006.11.07, 13:56
Chłopaki - tylko sie nie pobijcie! smilies/szczerbaty.gif

Moim zdaniem artykuł jest bardzo obiektywny - mówi, że AMD nic nie mówi, i że to może dobrze, a może niekoniecznie. Po czym fani Intela mówią, że będzie kicha, a fani AMD że będzie super, a serwis reklamuje Intela więc pewnie dlatego nie pisze jasno że K8L będzie boski. A w sumie nic nie wiadomo i tzreba będzie poczekać do premiery i pierwszych testów.

Ja osobiście liczę, że K8L skopie tyłek Conroe i podwyższy poprzeczkę nowym pomysłom Intela, ale nie zauważyłem podejścia anty-AMD ani autora artykułu, ani samego PCLab-u.
DuchuZobacz profil
Poziom ostrzeżenia: 0%
Duchu2006.11.02, 10:02
Dzieciaków neostrady i innych fanatyków AMD przydało by się przygotowywać na ostte starcie z rzeczywistością... Szykuje się kolejny "Wiliamette" tylko że teraz w wykonaniu AMD...

P.S.
CYTAT
Shark19 no co sie dziwisz że PClab reklamuje tak procki Intela, jakby tobie dali w łape tyle co PClabowi to byś sie nawet wyżekł swojego AMD. Ciekaw jestem czy PClab bedzie robić takie odliczanie w przypadku premiery k8L. ^_^

Litości... smilies/thumbdown.gif

Pozdr.
*Konto usunięte*2006.11.02, 07:39
CYTAT(Sajron @ 2 November 2006, 03:50) <{POST_SNAPBACK}>


Te 4 czerwone kwadraciki co zaznaczyles to nie są complex decoders tylko microcode units , proponuje luknąć na ten obrazek:

A wiesz gdzie są właściwe dekodery instrukcji ?? Przylegają do bloków mikrokodu od prawej strony.

Zaznaczyłem bloki mikrokodu bo one leżą w sąsiedztwie dekoderów i są zdecydowanie lepiej widoczne. Jeżeli ich jest 4 dekoderów tez jest 4.


Proponuje luknąć na ten obrazek, tylko weź po uwagę że jest on odwrócony w poziomie.

http://www.chip-architect.com/news/K8L_floorplan.jpg
*Konto usunięte*2006.11.02, 03:50
Shark19 no co sie dziwisz że PClab reklamuje tak procki Intela, jakby tobie dali w łape tyle co PClabowi to byś sie nawet wyżekł swojego AMD. Ciekaw jestem czy PClab bedzie robić takie odliczanie w przypadku premiery k8L. ^_^


Może coś z moimi oczami jest nie teges ale wydaje mi się, że jakość obrazku jest taka sama wszędzie i nie ulega drastycznemu pogorszeniu w okolicy dekoderów instrukcji. Po co AMD miało by ściemniać?



CYTAT(Shark19 @ 2 listopada 2006, 03:02) <{POST_SNAPBACK}>
I żeby nie było wątpliwości wystarczy popatrzeć na inne zdjęcie z tego artykułu , gdzie wyraźnie widać ze dekoderów jest tyle ile ma być, czyli 4.


Te 4 czerwone kwadraciki co zaznaczyles to nie są complex decoders tylko microcode units , proponuje luknąć na ten obrazek:

*Konto usunięte*2006.11.02, 02:36
CYTAT(CMDR_PAIN @ 31 October 2006, 22:29) <{POST_SNAPBACK}>
Tak, tak, a świstak siedzi...
Polecam lekturkę:
http://www.realworldtech.com/forums/index....9&roomid=11
Nie mówię, że się na tym znam, czy aby to rozumię, ale gdyby Intel zmodyfikował Yonah'a poszerzając potok wykonawczy (more issue ports, wider execution), czyli zwiększył max(IPC) z 3 do 4, to Core2 nie byłby taki przebojowy jak teraz, a już w ogóle nie w SuperPI. Z resztą, to po co w ogóle robili tyle zmian w Core2, bali się że nie dają rady poprowadzić ścieżek do kryształu ??
Te "kosmetyczne" zmiany jak je nazwałeś dają właśnie najwięcej. Weźmy OO Loads, before stores, czyli Memory Disambiguation i odpow. w "K8L" daje dużo, bo Backend nie musi czekać na dane, Frontend go lepiej "nakarmi". Oczywiste jest single cycle SSE{1,2,3,4}. Może dać 2 - krotnego kopa na niektórych kodach, zresztą looknij na benche Conroe. Btw, nie bronie tutaj "K8L", bo nie jestem jakimś pedalskim ( !=gej ) dzieciakiem neostrady, który lubi robić bajzel na technicznym forum.
Chodzi o to, że uważam iż się mylisz, że te "kosmetyczne" zmiany w rdzeniu nic nie dają. Dość trochę da zwiększenie instruction fetch z 16 do 32 byte i poszerzenie magistral caches L{1,2} ( ciekawy link: http://www.digit-life.com/articles2/mainbo...t-ddr2-800.html ). Zresztą, co ja ci będę mamrotał. Tutaj masz mądry tekst:
http://www.agner.org/optimize/microarchitecture.pdf.
Jak ci się nudzi to poszukaj posty Paula DeMone na www.realworldtech.com, kumaty koleś. ( ta sama stronka co na początku ).
Mam nadzieję, że cię nie uraziłem.
Pozdro

O ktoś tu dobrze i bardzo mądze pisze.

Piwko dla tego Pana
*Konto usunięte*2006.11.02, 02:02
Więc przeczytałem i stwierdzam:

CYTAT
512-pozycyjny system przewidywania, powiększona pamięć historii rozgałęzień kodu, podwojona pojemność stosu powrotnego - wszystko to nie ma praktycznego związku ze współczynnikiem IPC.

smilies/shocked.gif

Dobra, bezpośredniego związku ze wspołczynnikiem IPC to nie ma, ale pośrednio ma ogromny wpływ na IPC.

Wszystkie te 3 usprawnienia zwiększają skutecznośc predykcji skoków, a tym samym zmniejszają liczbę błędnych trafień cache.
Dzięki sprawniejszemu systemowi predykcji skoków, potoki procka rzadziej musza być wstrzymywane opróżniane i napełniane ponownie, a taka koniecznośc powoduje chwilową przerwę w wykonywaniu kodu i średni IPC spada.
Im sprawniejszy system predykcji skoków, tym średnie IPC idzie w góre.

Sprawność systemu predykcji rozgałęzień ma ogromy wpływ na wydajność całego CPU, wystarczy zwiększyć ją delikatnie ( co jedank jest bardzo trudne ) by wydajność procesora wyraźnie wzrosła, zgodnie z tym wykresem




I przypominam jeszcze jedno, K8 ma predykcje wręcz tragiczną, więc o jej lekką poprawę nie jest trudno. Właśnie tu w systemach predykcji rozgałęzień leżą duże rezerwy układów K8 ( szacowane przezemnie na ok. 15% , tzn. gdyby tylko K8 zaopatrzyć w predykcję rozgełezień tej klasy co w Prescottcie / C2D, byłby on ok. 15% wydajniejszy ).




CYTAT
Out of order load execution - niekolejne wykonywanie operacji pobrań, to coś, co znamy już z Conroe pod nazwą Memory Disambiguation. Pobranie potrzebnych danych lub instrukcji nie musi oczekiwać na to, by zostały pobrane lub zapisane dane z poprzednich operacji. To rozwiązanie w oczywisty sposób zwiększa przepływność, ale nie ma żadnego wpływu na współczynnik IPC!

Również się nie zgadzam.

Ma pośredni wpływ na IPC - tak jak i zwiększenie przepływności każdym innym sposobem jak np. podkręceniem pamięci czy zastosowaniem zintegrowanego z CPU kontrolera RAM.
Analogiczna sytuacja jak z predykjcją rozgałęzień.

"Pobranie potrzebnych danych lub instrukcji nie musi oczekiwać na to, by zostały pobrane lub zapisane dane z poprzednich operacji."

Właśnie - CPU nie musi oczekiwać na potrzebne dane. A jak oczekuje to średnie IPC znowu spada. A że dzięki tej technologi jak i Memory Disambiugation, CPU rzadziej musi na jakieś dane oczekiwać - szybciej przechodzi do ich wykonywania i srednie IPC rośnie, nieznacznie ale rośnie.



CYTAT
Sideband Stack Optimizer - pod tą szumną nazwą kryje się niewielki układ, którego zadaniem jest modyfikacja wskaźnika stosu podczas operacji na stosie (instrukcje PUSH i POP) - w dotychczasowej konstrukcji K8 mikrooperacja modyfikacji wskaźnika stosu obciążała główny potok wykonawczy procesora. Eliminację tego obciążenia możemy, przy odrobinie dobrych chęci, uznać za krok w kierunku zwiększenia IPC.

Bardzo podobne rozwiązanie pod nazwą DSM ( Dedicated Stack Menager ) stosuje począwszy od Pentium-M Banias , poprzez Yonaha i wreszcie w C2D Intel.

Jak wynika z jego testów wewnętrznych zwiększa to wydajność o ok. 3 %



CYTAT
Popatrzmy jeszcze raz uważnie na prezentowaną przez AMD fotografię chipu. O jej nienajlepszej jakości już wspominaliśmy, ale - warto zauważyć, że jakość dodatkowo ulega drastycznemu pogorszeniu w okolicach dekoderów instrukcji we wszystkich czterech jądrach. Przypadek, czy zasłona dymna?



Zaznaczone czerwonymi kwadracikami obszary to nie są dekodery instrukcji.

I żeby nie było wątpliwości wystarczy popatrzeć na inne zdjęcie z tego artykułu , gdzie wyraźnie widać ze dekoderów jest tyle ile ma być, czyli 4.







Natomiast co do tej zasłony dymnej - nie sposób nie mieć wrażenia że jest nią ten artykuł.
Intel reklamujący się na serwisie, intel wpisujący się na forum zapraszający do artykułu o kentsfieldzie. Widać serwis mocno trzymający z Intelem.
Brakowało jeszcze czegoś co zdyskredytowało i wprowadziło by niepewność w stosunku do K8L - by ludzie miast wyczekiwać na K8L które niewiadomo czy dobre będzie, rzucili się do sklepów po C2D...
Ot taka drobna przysługa dla partnera serwisu.


Ale to tylko drobna spekulacja spostrzegawczej i bystrej znajomej osoby ( nie moja! )





A wracając do K8L - posiada on nad Conroe w jednym miejscu bardzo istotną i znaczącą przewagę , która napewno będzie kluczowa w pojedynku K8L z Conroe - ale tego narazie nie wyjaśnie aż do czasu kiedy pojawi się mój artykuł.
kresekZobacz profil
Poziom ostrzeżenia: 0%
kresek2006.11.01, 23:58
CYTAT(21szpak @ 1 listopada 2006, 23:53) <{POST_SNAPBACK}>
w przypadku Intela tez smilies/smile.gif

z Prescottem pojechali (ale i przyczyna była trochę inna), ale taki np. Dothan przecież był udanym procesorem...
wejście w 65nm też było niczego sobie...
21szpakZobacz profil
Poziom ostrzeżenia: 0%
21szpak2006.11.01, 23:53
CYTAT
przejścia na nowy wymiar zwykle nie wyglądają w przypadu AMD oszałamiająco:


w przypadku Intela tez smilies/smile.gif
kresekZobacz profil
Poziom ostrzeżenia: 0%
kresek2006.11.01, 23:16
CYTAT(21szpak @ 1 listopada 2006, 23:12) <{POST_SNAPBACK}>
Co do fotki rev. G jesli jest to prototyp to dlaczego ma tak duzo wspolnych cech rev. F ? ta fotka pochodzi zreszta z czerwca tego roku jak dobrze pamietam a wlasnie od tego miesiaca AMD zaczela produkowac procki w 65nm (nie masowo)

przejścia na nowy wymiar zwykle nie wyglądają w przypadu AMD oszałamiająco:

- 130nm - Thoroughbred A
- 90nm - Winchester

bez większych zmian, spokojne balony próbne, dopiero później mocniejsze uderzenie.

faktycznie, poczekamy, zobaczymy - ale jak już spekulujemy, to... smilies/wink.gif
21szpakZobacz profil
Poziom ostrzeżenia: 0%
21szpak2006.11.01, 23:12
CYTAT
mnie jednak bardziej przekonuje Hans de Vries

edit: no i czym w takim razie by miał być "fiolet"?


wiem ze Hans de Vries jest kompetentna osoba, rev. G bedzie posiadac zmiany, zreszta przekonamy sie juz w grudniu badz na poczatku stycznia tego roku.

Co do fotki rev. G jesli jest to prototyp to dlaczego ma tak duzo wspolnych cech rev. F ? ta fotka pochodzi zreszta z czerwca tego roku jak dobrze pamietam a wlasnie od tego miesiaca AMD zaczela produkowac procki w 65nm (nie masowo)

Zreszta pozyjemy zobaczymy to tylko miesiac lub dwa
kresekZobacz profil
Poziom ostrzeżenia: 0%
kresek2006.11.01, 22:57
CYTAT(21szpak @ 1 listopada 2006, 22:54) <{POST_SNAPBACK}>
a co powiesz na ten post? [...]

zakładam więc, że czytałeś cały wątek, i widziałeś, skąd takie informacje się pojawiły.

CYTAT
mnie bardziej on przekonuje

mnie jednak bardziej przekonuje Hans de Vries smilies/wink.gif

edit: no i czym w takim razie by miał być "fiolet"?
21szpakZobacz profil
Poziom ostrzeżenia: 0%
21szpak2006.11.01, 22:54
CYTAT(kresek @ 1 listopada 2006, 21:15) <{POST_SNAPBACK}>
co w takim razie powiesz na ten post?

edit: zresztą, autor trzyma się definicji IPC w stylu "maksymalna ilość instrukcji, którą procesor może wykonać w takcie zegara". zwykle nie to się liczy, a średnia utrzymywana w dłuższym czasie. co z tego, że procesor teoretycznie może wykonać - dajmy na to - 5 instrukcji w takcie zegara, gdy zwykle wykona 2? lepsze wyniki osiągnie bardziej zbalansowana konstrukcja, wykonująca maksymalnie 4, ale średnio - 3 instrukcje...

tak więc jak najbardziej wszystkie opisane techniki pozwolą zwiększyć IPC - rozumiane oczywiście jako średnia profilu wykonania kodu.


a co powiesz na ten post?

http://www.aceshardware.com/forums/read_po...9&forumid=1

mnie bardziej on przekonuje

zobacz tez ta animacje gdzie nalozony jest obraz niebieskiego rdzenia rew.G na rewizje F czyli obecnie produkowany rdzen
http://129.15.202.185/athlon_rev_g/wtf_mates.html
StormZobacz profil
Poziom ostrzeżenia: 0%
Storm2006.11.01, 22:38
rysiek rysiek rysiek smilies/shocked.gif
kresekZobacz profil
Poziom ostrzeżenia: 0%
kresek2006.11.01, 21:15
CYTAT(21szpak @ 1 listopada 2006, 17:42) <{POST_SNAPBACK}>
A oto obraz jadra w rewizji G tzw. Brisbane [...]
Rewizja G ma dodany jeden kompleks dekodera instrykcji (4) a obecna rewizja F ma ich 3 wiec jednak zmiany w brisbane beda miec miejsce i nie beda to zmiany kosmetyczne

co w takim razie powiesz na ten post?

edit: zresztą, autor trzyma się definicji IPC w stylu "maksymalna ilość instrukcji, którą procesor może wykonać w takcie zegara". zwykle nie to się liczy, a średnia utrzymywana w dłuższym czasie. co z tego, że procesor teoretycznie może wykonać - dajmy na to - 5 instrukcji w takcie zegara, gdy zwykle wykona 2? lepsze wyniki osiągnie bardziej zbalansowana konstrukcja, wykonująca maksymalnie 4, ale średnio - 3 instrukcje...

tak więc jak najbardziej wszystkie opisane techniki pozwolą zwiększyć IPC - rozumiane oczywiście jako średnia profilu wykonania kodu.
*Konto usunięte*2006.11.01, 20:04
CYTAT(21szpak @ 1 listopada 2006, 18:55) <{POST_SNAPBACK}>
Mozliwe ze AMD do konstrukcji pamieci cache L3 uzulo technologi Z-RAM do ktorej to wykupilo licencje, technologia ta zaklada zmniejszenie powierzchni pamieci cache blisko 50% wzgledem tradycyjnie wykonanego cache L2 wiec w takim wypadku L3 bedzie tansze w produkcji niz zwykly L2.

3 poziom pamieci cache przyspiesza tez komunikacje z pamiecia glowna RAM pozatym dopiero pamiec L3 w K8L bedzie wspulna dla wszystkich rdzeni a nie jak jest to w C2D pamiec cache L2


Gratuluję wiedzy na temat K8L naprawdę zaskoczyłeś mnie;) Widać że bardzo się procesorami AMD interesujesz smilies/bigsmile.gif smilies/thumbup.gif
21szpakZobacz profil
Poziom ostrzeżenia: 0%
21szpak2006.11.01, 18:55
CYTAT(Wulfgar @ 1 listopada 2006, 18:13) <{POST_SNAPBACK}>
czy dodanie L3 nie bedzie czynnikiem znacznie zwiekszajacym cene produkcji procka?

czy nie mozna by zrobic wspolnego L2 (zamiast dodatkowego pozimu) dla wszystkich 4 rdzeni?
PS tak, nie znam sie na prockach smilies/szczerbaty.gif


Mozliwe ze AMD do konstrukcji pamieci cache L3 uzulo technologi Z-RAM do ktorej to wykupilo licencje, technologia ta zaklada zmniejszenie powierzchni pamieci cache blisko 50% wzgledem tradycyjnie wykonanego cache L2 wiec w takim wypadku L3 bedzie tansze w produkcji niz zwykly L2.

3 poziom pamieci cache przyspiesza tez komunikacje z pamiecia glowna RAM pozatym dopiero pamiec L3 w K8L bedzie wspulna dla wszystkich rdzeni a nie jak jest to w C2D pamiec cache L2
WulfgarZobacz profil
Poziom ostrzeżenia: 0%
Wulfgar2006.11.01, 18:13
czy dodanie L3 nie bedzie czynnikiem znacznie zwiekszajacym cene produkcji procka?

czy nie mozna by zrobic wspolnego L2 (zamiast dodatkowego pozimu) dla wszystkich 4 rdzeni?



PS tak, nie znam sie na prockach smilies/szczerbaty.gif
21szpakZobacz profil
Poziom ostrzeżenia: 0%
21szpak2006.11.01, 17:42
Polecam ten artykuł o K8L

http://www.pureoverclock.com/review.php?id=37





Zobaczcie gdzie prowadza strzalki od tekstu: IPC enhanced CPU cores



na ostatnim slajdzie zaznaczone jest co zostalo dodane do rev.H

A oto obraz jadra w rewizji G tzw. Brisbane


Rewizja G ma dodany jeden kompleks dekodera instrykcji (4) a obecna rewizja F ma ich 3 wiec jednak zmiany w brisbane beda miec miejsce i nie beda to zmiany kosmetyczne
Funkcja komentowania została wyłączona. Do dyskusji zapraszamy na forum.