komentarze
AssassinZobacz profil
Poziom ostrzeżenia: 0%
Assassin2011.07.12, 08:27
W zasadzie to powinno porównywać się cenę i wydajność w danych zastosowaniach. Podejście Intela i AMD do wielowątkowości jest tak różne, że porównania rdzeń w rdzeń i watek w wątek tracą sens. Oba podejścia mają swoje wady i zalety. Mi się chyba trochę bardziej podoba nowa filozofia AMD, ale z drugiej strony wydaje się, że Intel ma lepiej dopracowaną architekturę i proces technologiczny. Dlatego rywalizacja może być wyrównana i ciekawa.
Promilus1984Zobacz profil
Poziom ostrzeżenia: 0%
Promilus19842011.07.12, 08:52
Grave, kolego... ile rdzeni x86 ma bulldozer? Ano 4. A dlaczego 4?
Ano bo integer cluster nie łyka rozkazów x86 tylko uops. uops które generuje dekoder x86 i przesyła do dispatch unit. Rdzeń procesora w obecnych czasach to najmniejsza autonomiczna część wielordzeniowego procesora przetwarzająca kod maszynowy (w tym wypadku x86) zatem obejmuje to cały frontend zawierający m.in. bufory reorganizujące (ROB), logikę odpowiedzialną za zmianę nazw rejestrów (tak by wykorzystać te 72 lub więcej wewnętrznych i by puścić rozkazy w kilka potoków), cache L1I, wreszcie dekodery. Jest i więcej elementów, ile? To wystarczy zobaczyć porównania diagramów reprezentujących k8, k10, core 2, nehalema, sandy bridge...
Zatem moduł to jeden rdzeń x86. A jak są przetwarzane 2 wątki? Czy to wystarczy pod dekoder dwa klastry int podpiąć i już? No właśnie też nie. W tym wypadku praktycznie cały front end jest przystosowany do tzw. vertical multi threading, cluster int to single thread, fpu to symmetric multithreading. Zatem Bulldozer wykorzystuje odmienną implementację od HT intela, natomiast łączy je jedno - że z jednego fizycznego rdzenia x86 są 2 logiczne procesory w systemie. HT bazuje na nieefektywności wykorzystania jednostek wykonawczych, CMT bazuje na nieefektywności wykorzystania front endu, z szczególnym uwzględnieniem dekodera.
LeeLoo_TZobacz profil
Poziom ostrzeżenia: 0%
LeeLoo_T2011.07.12, 09:43
Amitoza @ 2011.07.11 22:56  Post: 490849
I tym właśnie jest bulldozer - niczym więcej. Cały frontend jest współdzielony jak u intela, FPU także. Dublowane są jedynie jednostki stałoprzecinkowe. Nie wiem czy zdajesz sobie sprawę, ale FPU działa tak samo jak u intela czyli SMT.

Uzywanie okreslenia modul i rdzen ma sens, ale nie sa jednoznaczne. W przypadku Bulldozera mowienie o rdzeniach i modulach w tym samym kontekscie starego pojecia ma podstawy o tyle, ze bedzie sie on zachowywal jak prawdziwy fizyczny, majacy stale zasoby i przewidywalna wydajnosc. W przypadku SMT on/off mamy troche jak rzut moneta, czyli 8 logicznych przeciw 4 fizycznym, roznica teoretycznie polega w wiekszosci na polowie dostenych zasobow dla tych pierwszych. Przez to nie ma sensu uzywac opisu dla procesora z HT, ze ma podwojna ilosc rdzeni, bo sa one innego rodzaju, a przy Bulldozer beda mialy constans. Na poziomie modulu moga zachodzic tez niekorzystne warunki, kiedy wydajnosc spadnie nawet o polowe do jednego 'rdzenia', ale znowu to bedzie przewidywalne w jakich sytuacjach i w czym jest ograniczenie, ktore bedzie raczej nieusuwalne bez odpowiednich modyfikacji, optymalizacji.
marc99Zobacz profil
Poziom ostrzeżenia: 0%
marc992011.07.12, 09:50
Ale ciężko fanom Intela pogodzić się z tym, że AMD ma teraz 'poprawiony HT', a oni tylko zwykły. :)

PCLab to chyba dalej portal branżowy i najważniejsze są ścisłe informacje co czym jest, a nie marketing.
dysan112Zobacz profil
Poziom ostrzeżenia: 0%
dysan1122011.07.12, 09:58
Ani źle ani dobrze. Postęp jest i tyle. Tyle że 90% ludzi pewnie nie wykorzystało by połowy mocy tego procesora.
Dwa rdzenie bym chciał zobaczyć w akcji tego AMD nisko taktowane (poniżej 2GHz) i jak wygląda tutaj pobór prądu. Dało by to odpowiedz czy w laptopach będzie i netbookach jakiś zysk. I jak ma to się ma do konkurencji Intela z SB.
AmitozaZobacz profil
Poziom ostrzeżenia: 0%
Amitoza2011.07.12, 10:01
dysan112 @ 2011.07.12 09:58  Post: 490910
Ani źle ani dobrze. Postęp jest i tyle. Tyle że 90% ludzi pewnie nie wykorzystało by połowy mocy tego procesora.
Dwa rdzenie bym chciał zobaczyć w akcji tego AMD nisko taktowane (poniżej 2GHz) i jak wygląda tutaj pobór prądu. Dało by to odpowiedz czy w laptopach będzie i netbookach jakiś zysk. I jak ma to się ma do konkurencji Intela z SB.

tylko, że to porónanie iele nie da, bo bulldozer trafi do notebooków, ale pod postacią APU i będzie mieć o połowę mniej rdzeni niż topowy desktopowy model, a do tego dostanie o 50% mocniejsze GPU, więc w tej chwili kompletnie nie wiadomo, jak będzie zachowywać się taki układ w przypadku poboru energii - inna sprawa, że w przyszłym roku, to te 32nm będą mieć dopięte na ostatni guzik.
AssassinZobacz profil
Poziom ostrzeżenia: 0%
Assassin2011.07.12, 11:00
marc99 @ 2011.07.12 09:50  Post: 490907
Ale ciężko fanom Intela pogodzić się z tym, że AMD ma teraz 'poprawiony HT', a oni tylko zwykły. :)
Poprawiony HT to by był, gdyby poprawili skalowanie wielowątkowe bez wzrostu liczby tranzystorów. Tutaj mamy wyraźną poprawę wydajności wielowątkowej przy wyraźnym wzroście budżetu tranzystorów na rdzeń (w znaczeniu: moduł). Po prostu zupełnie inne podejście, trudne do bezpośredniego porównania.
VymmiataczZobacz profil
Poziom ostrzeżenia: 0%
Vymmiatacz2011.07.12, 11:00
Ale przecież Prima Aprilis już był :/
ArlicZobacz profil
Poziom ostrzeżenia: 0%
Arlic2011.07.12, 11:10
Assassin @ 2011.07.12 07:41  Post: 490875
Arlic @ 2011.07.11 23:32  Post: 490857
Dość śmieszne jest jak pani Grave zaciekle walczy o prawdę wyjętą prost z rękawa,
ale tak to jest, plotkary nie mają zajęcia to plotkują, grave nie ma zajęcia to kłamię, trolluje i wychwala swego niebieskiego boga.

Taka dyskusja byłaby niemożliwa bez wcinek Arlika o 'niebieskim bogu', oczywiście zawsze skrajnie pro-AMD-owskich :E Grave może nie mieć racji, ale pisze merytorycznie i wcale nie pro-Intelowsko. W sumie teraz broni marketingowych posunięć AMD ;)

Ja wiem dobrze jak piszę grave, on piszę dość z sensem, tylko człowieka wkurza jego forma wypowiedzi, która jest podobna do strony z dużą ilością reklam google :E

Forma wypowiedzi Grave w każdym poście.
1. Ckliwe opowiadania
2. Hipotezy grave jak to by mogło być
3. Reklama Intela
4. AMD jest jednak złe i będzie gorsze
5. Maskowanie się brazosem, że uważał kiedyś że są dobre

Więc Grave, wykasuj pkt.3 z każdej wypowiedzi, i na pewno będzie lepiej!

Zachowanie Grave:
Jeżeli Grave zobaczy trolla intela - plusuje go i potwierdza że mówi prawdę
W przeciwnym wypadku Grave atakuje hipotezami i reklamami 'google'

Niech moc niebieskiego boga będzie z wami! :E
AmitozaZobacz profil
Poziom ostrzeżenia: 0%
Amitoza2011.07.12, 11:53
po prostu zamiast sie użerać zacytujęczęśc patentu:

''In the illustrated embodiment, core 100 may include the instruction cache (IC) 110 coupled to provide instructions to the instruction fetch unit (IFU) 120. IFU 120 may be coupled to the branch prediction unit (BPU) 130 and to the instruction decode unit (DEC) 140. DEC 140 may be coupled to provide operations to a plurality of integer execution clusters 150a-b as well as to a floating point unit (FPU) 160. '

Tyle wyjaśnienia chyba wystarczy.
VegaZobacz profil
Poziom ostrzeżenia: 0%
Autor publikacjiVega2011.07.12, 11:56
Arlic, a co Ty wniosłeś do dyskusji, na temat, oprócz kopania się po kostkach z Grave-em? Kocioł garnkowi przyganiał.
StanleyZobacz profil
Poziom ostrzeżenia: 0%
Stanley2011.07.12, 13:09
Ponad setka komentów o tym czy 4 rdzenie czy 8 rdzeni.
To jest 8 rdzeni x86 + 4 rdzenie x87.
Wydajność pojedynczego rdzenia 4 drożnego Buldozera zbliżona do 4 drożnego Sandy Bridge.
Kropka. (no chyba że dodali 6 jednostek wykonawczych..nie jestem na czasie)

Tak jak dla kart graficznych ocena procesora zależy od jego wydajności i zastosowań ot i tyle..tak jak z grubsza nie jest istotne ile pojemności ma silnik ważna jest moc, moment, spalanie. I dyskusja nad tym jak nazywać jest moim zdaniem tylko biciem piany.

W Buldozerze 4 moduly = 4x2x4=32 jeddnostki wykonawcze, w 4 rdzeniowym Sandy Bridge czy HT czy bez HT 4x4=16, ich wydajność wydaje sie podobna, dlugość potoku nie ma znaczenia o ile dobrze dziala przewidywanie skoków itp.
4 jednostki to na tyle dużo że dodano uklad rezerwacji jednostek wykonawczych(jak w knajpie) dla drugiego watku udajac drugi rdzeń(stolik) ale nie zwieksza to wydajności pojedynczego watku który może sobie zarezerwować max 4 jednostki(krzesła) np. dla wykonania 4 niezależnych operacji jednocześnie(4 osobowej rodziny). Czyli wydajność rdzeń w rdzeń Sandy Bridge i Buldozer z tego punktu widzenia powinna być identyczna(jest oczywiście szereg innych czynników) Dlatego można w przybliżeniu powiedzieć że gdyby oprzeć sie na teoretycznej maksymalnej ilości jednocześnie wykonywanych zadań w tym samym czasie - 32 bedzie równoważne 8 rdzeniom Intela po 4 jednostki każdy.

AMD moglo zrobić przecież procesor z 8 jednostkami zmiennoprzecinkowymi jak Sandy Bridge, nie dali wszedzie FPU dzieki temu oszczedzili powierzchnie, zapotrzebowanie na energie, bedzie to można sprzedać taniej bez komplikowania konstrukcji rdzenia o układ rezerwacji jednostek wykonawczych, dekodera etc. i sprzedawać w cenie 4 rdzeniowego procesora
HT nigdy nie zrobi z 4 rdzeni 8, natomiast Buldozer z punktu widzenia możliwości JEST 8 rdzeniowym x86 z 4 rdzeniami x87(dawniej przecież to bylo osobno).

(za glupi jestem by to zrozumieć):
http://www.realworldtech.com/page.cfm?Arti...7033728&p=2
http://www.realworldtech.com/page.cfm?Arti...0181333&p=6
Do tej pory zdaje mi sie że w pojedynczym rdzeniu od czasu K8 byly po 3 jednostki wykonawcze ALU, Barcelona do tej architektury zasadniczo wniosla 'tylko' cache l3 (pewnie to spore uproszczenie) a Buldozer jest już 4 drożny, podczas gdy już od czasu Core(a może Core2) Intel w procesory pakuje po 4 jednostki wykonawcze(może Sandy Bridge to zmienia, pewnie nie jestem na czasie?) dzieki temu i innym zabiegom IPC pojedynczego rdzenia jest wyższe niż każdego starszego AMD - praktycznie poza zasiegiem.
scooby14444Zobacz profil
Poziom ostrzeżenia: 0%
scooby144442011.07.12, 14:51
Właśnie zrobiłem test Gulftowna na standardowych taktach. Cinenench R10: 30723, PhysX z 3DMarka11: 9511, co daje 25 i 27% na korzyść Gulftowna. W aplikacjach nie wykorzystujących wszystkich wątków przewaga będzie na pewno większa. AMD nawet nie zbliżyło się do Intela, i porównujemy tu najnowszy highend AMD, który jeszcze nie wyszedł do 1,5 letniego procka Intela. Z tego wynika że AMD jest 2 lata w plecy, może jakby wsadzili z 12 rdzeni do by dogonili Gulftowna.
Także Buldożer pokonuje Sandy Bridge chyba tylko w chorych umysłach fanów AMD z klapkami na oczach
PCCPUZobacz profil
Poziom ostrzeżenia: 0%
PCCPU2011.07.12, 15:41
Stanley @ 2011.07.12 13:09  Post: 490957
Ponad setka komentów o tym czy 4 rdzenie czy 8 rdzeni.
To jest 8 rdzeni x86 + 4 rdzenie x87.
Wydajność pojedynczego rdzenia 4 drożnego Buldozera zbliżona do 4 drożnego Sandy Bridge.
Kropka. (no chyba że dodali 6 jednostek wykonawczych..nie jestem na czasie)

Tak jak dla kart graficznych ocena procesora zależy od jego wydajności i zastosowań ot i tyle..tak jak z grubsza nie jest istotne ile pojemności ma silnik ważna jest moc, moment, spalanie. I dyskusja nad tym jak nazywać jest moim zdaniem tylko biciem piany.

W Buldozerze 4 moduly = 4x2x4=32 jeddnostki wykonawcze, w 4 rdzeniowym Sandy Bridge czy HT czy bez HT 4x4=16, ich wydajność wydaje sie podobna, dlugość potoku nie ma znaczenia o ile dobrze dziala przewidywanie skoków itp.
4 jednostki to na tyle dużo że dodano uklad rezerwacji jednostek wykonawczych(jak w knajpie) dla drugiego watku udajac drugi rdzeń(stolik) ale nie zwieksza to wydajności pojedynczego watku który może sobie zarezerwować max 4 jednostki(krzesła) np. dla wykonania 4 niezależnych operacji jednocześnie(4 osobowej rodziny). Czyli wydajność rdzeń w rdzeń Sandy Bridge i Buldozer z tego punktu widzenia powinna być identyczna(jest oczywiście szereg innych czynników) Dlatego można w przybliżeniu powiedzieć że gdyby oprzeć sie na teoretycznej maksymalnej ilości jednocześnie wykonywanych zadań w tym samym czasie - 32 bedzie równoważne 8 rdzeniom Intela po 4 jednostki każdy.

AMD moglo zrobić przecież procesor z 8 jednostkami zmiennoprzecinkowymi jak Sandy Bridge, nie dali wszedzie FPU dzieki temu oszczedzili powierzchnie, zapotrzebowanie na energie, bedzie to można sprzedać taniej bez komplikowania konstrukcji rdzenia o układ rezerwacji jednostek wykonawczych, dekodera etc. i sprzedawać w cenie 4 rdzeniowego procesora
HT nigdy nie zrobi z 4 rdzeni 8, natomiast Buldozer z punktu widzenia możliwości JEST 8 rdzeniowym x86 z 4 rdzeniami x87(dawniej przecież to bylo osobno).

(za glupi jestem by to zrozumieć):
http://www.realworldtech.com/page.cfm?Arti...7033728&p=2
http://www.realworldtech.com/page.cfm?Arti...0181333&p=6
Do tej pory zdaje mi sie że w pojedynczym rdzeniu od czasu K8 byly po 3 jednostki wykonawcze ALU, Barcelona do tej architektury zasadniczo wniosla 'tylko' cache l3 (pewnie to spore uproszczenie) a Buldozer jest już 4 drożny, podczas gdy już od czasu Core(a może Core2) Intel w procesory pakuje po 4 jednostki wykonawcze(może Sandy Bridge to zmienia, pewnie nie jestem na czasie?) dzieki temu i innym zabiegom IPC pojedynczego rdzenia jest wyższe niż każdego starszego AMD - praktycznie poza zasiegiem.

Blok Integer w rdzeniu Sandy Bridge ma 3 ALU i 2 AGU natomiast jeden z dwóch bloków INT w module Bulldozera ma 2 ALU i 2 AGLU(AGU + okrojone ALU jednak nie jednocześnie) co sumarycznie w Multi Thread daje 4ALU i 4AGLU. Co do FPU to w SB na rdzeń przypada 1x 128b lub 1x 256b AVX natomias z kolei w module BD mamy 2x 128b AVX lub 1x 256b AVX. Co do Frontend który odgrywa w CPU główną role w dekodowaniu x86 i który ma wiele sprytnych mechanizmów to właśnie ten blok jest x86 a bloki jednostek wykonawczych dostają już gotowe zdekodowane dane do przeliczenia. W rdzeniu SB są 4 dekodery(lub inaczej 1 dekoder czterodrożny) x86 i 3 z nich są to dekodery proste( Simple Decoder) a jeden złożony(Complex Decoder)(3+4 micro op) natomiast w module BD są również 4 dekodery x86 tyle że wszystkie są dekoderami do operacji złożonych 4x 2 micro op lub 4x 1 Macro op. Dla porównania w K10 Phenom są 3 Complex Decodery x86(3x 2 micro op lub 3x 1 Macro op). W K10 Phenom są 3x ALU/AGU(nie jednocześnie) co w efekcie dawało max operacji na Integer w jednym takcie ok 1.5ALU i 1.5AGU. Co do Cache to Core SB ma L1I 32KB 8-way i L1D 32KB 8-way natomiast Moduł(Core) Bulldozera ma L1 64KB 2-way i 2x L1D 16KB 4-way z kolei K10 Phenom ma 1LI 64KB 2-way i L1D 64KB 2-way.
Bez Cache L2 rdzeń K10 Phenom zajmuje ok 33 miliony tranzystorów, SB 55 milionów tranzystorów a Moduł(Core) BD to ok 70 mln tranzystorów.
W patentach jak czarne na białym jest że Moduł to jeden rdzeń x86 z dwoma blokami(Cluster) Integer i jednym blokiem FPU.
eagleZobacz profil
Poziom ostrzeżenia: 0%
eagle2011.07.12, 16:02
scooby14444 @ 2011.07.12 14:51  Post: 490999
Właśnie zrobiłem test Gulftowna na standardowych taktach. Cinenench R10: 30723, PhysX z 3DMarka11: 9511, co daje 25 i 27% na korzyść Gulftowna. W aplikacjach nie wykorzystujących wszystkich wątków przewaga będzie na pewno większa. AMD nawet nie zbliżyło się do Intela, i porównujemy tu najnowszy highend AMD, który jeszcze nie wyszedł do 1,5 letniego procka Intela. Z tego wynika że AMD jest 2 lata w plecy, może jakby wsadzili z 12 rdzeni do by dogonili Gulftowna.
Także Buldożer pokonuje Sandy Bridge chyba tylko w chorych umysłach fanów AMD z klapkami na oczach

A czemu ty się upierasz porównywać układ intela który jest większy i droższy ?
to jest funboystwo w czystej postaci.

ArlicZobacz profil
Poziom ostrzeżenia: 0%
Arlic2011.07.12, 16:15
mooon @ 2011.07.12 16:02  Post: 491012
scooby14444 @ 2011.07.12 14:51  Post: 490999
Właśnie zrobiłem test Gulftowna na standardowych taktach. Cinenench R10: 30723, PhysX z 3DMarka11: 9511, co daje 25 i 27% na korzyść Gulftowna. W aplikacjach nie wykorzystujących wszystkich wątków przewaga będzie na pewno większa. AMD nawet nie zbliżyło się do Intela, i porównujemy tu najnowszy highend AMD, który jeszcze nie wyszedł do 1,5 letniego procka Intela. Z tego wynika że AMD jest 2 lata w plecy, może jakby wsadzili z 12 rdzeni do by dogonili Gulftowna.
Także Buldożer pokonuje Sandy Bridge chyba tylko w chorych umysłach fanów AMD z klapkami na oczach

A czemu ty się upierasz porównywać układ intela który jest większy i droższy ?
to jest funboystwo w czystej postaci.


Bo to któryś z członków wyznawców niebieskiego bożka.
Myślą że jak narobią wiele kont wychwalających produkty intela, to niebieski bożek ich zauważy i wypłaci im jałmużnę !! :E
*Konto usunięte*2011.07.12, 16:46
PCCPU @ 2011.07.12 15:41  Post: 491008
Stanley @ 2011.07.12 13:09  Post: 490957
Ponad setka komentów o tym czy 4 rdzenie czy 8 rdzeni.
To jest 8 rdzeni x86 + 4 rdzenie x87.
Wydajność pojedynczego rdzenia 4 drożnego Buldozera zbliżona do 4 drożnego Sandy Bridge.
Kropka. (no chyba że dodali 6 jednostek wykonawczych..nie jestem na czasie)

Tak jak dla kart graficznych ocena procesora zależy od jego wydajności i zastosowań ot i tyle..tak jak z grubsza nie jest istotne ile pojemności ma silnik ważna jest moc, moment, spalanie. I dyskusja nad tym jak nazywać jest moim zdaniem tylko biciem piany.

W Buldozerze 4 moduly = 4x2x4=32 jeddnostki wykonawcze, w 4 rdzeniowym Sandy Bridge czy HT czy bez HT 4x4=16, ich wydajność wydaje sie podobna, dlugość potoku nie ma znaczenia o ile dobrze dziala przewidywanie skoków itp.
4 jednostki to na tyle dużo że dodano uklad rezerwacji jednostek wykonawczych(jak w knajpie) dla drugiego watku udajac drugi rdzeń(stolik) ale nie zwieksza to wydajności pojedynczego watku który może sobie zarezerwować max 4 jednostki(krzesła) np. dla wykonania 4 niezależnych operacji jednocześnie(4 osobowej rodziny). Czyli wydajność rdzeń w rdzeń Sandy Bridge i Buldozer z tego punktu widzenia powinna być identyczna(jest oczywiście szereg innych czynników) Dlatego można w przybliżeniu powiedzieć że gdyby oprzeć sie na teoretycznej maksymalnej ilości jednocześnie wykonywanych zadań w tym samym czasie - 32 bedzie równoważne 8 rdzeniom Intela po 4 jednostki każdy.

AMD moglo zrobić przecież procesor z 8 jednostkami zmiennoprzecinkowymi jak Sandy Bridge, nie dali wszedzie FPU dzieki temu oszczedzili powierzchnie, zapotrzebowanie na energie, bedzie to można sprzedać taniej bez komplikowania konstrukcji rdzenia o układ rezerwacji jednostek wykonawczych, dekodera etc. i sprzedawać w cenie 4 rdzeniowego procesora
HT nigdy nie zrobi z 4 rdzeni 8, natomiast Buldozer z punktu widzenia możliwości JEST 8 rdzeniowym x86 z 4 rdzeniami x87(dawniej przecież to bylo osobno).

(za glupi jestem by to zrozumieć):
http://www.realworldtech.com/page.cfm?Arti...7033728&p=2
http://www.realworldtech.com/page.cfm?Arti...0181333&p=6
Do tej pory zdaje mi sie że w pojedynczym rdzeniu od czasu K8 byly po 3 jednostki wykonawcze ALU, Barcelona do tej architektury zasadniczo wniosla 'tylko' cache l3 (pewnie to spore uproszczenie) a Buldozer jest już 4 drożny, podczas gdy już od czasu Core(a może Core2) Intel w procesory pakuje po 4 jednostki wykonawcze(może Sandy Bridge to zmienia, pewnie nie jestem na czasie?) dzieki temu i innym zabiegom IPC pojedynczego rdzenia jest wyższe niż każdego starszego AMD - praktycznie poza zasiegiem.

Blok Integer w rdzeniu Sandy Bridge ma 3 ALU i 2 AGU natomiast jeden z dwóch bloków INT w module Bulldozera ma 2 ALU i 2 AGLU(AGU + okrojone ALU jednak nie jednocześnie) co sumarycznie w Multi Thread daje 4ALU i 4AGLU. Co do FPU to w SB na rdzeń przypada 1x 128b lub 1x 256b AVX natomias z kolei w module BD mamy 2x 128b AVX lub 1x 256b AVX. Co do Frontend który odgrywa w CPU główną role w dekodowaniu x86 i który ma wiele sprytnych mechanizmów to właśnie ten blok jest x86 a bloki jednostek wykonawczych dostają już gotowe zdekodowane dane do przeliczenia. W rdzeniu SB są 4 dekodery(lub inaczej 1 dekoder czterodrożny) x86 i 3 z nich są to dekodery proste( Simple Decoder) a jeden złożony(Complex Decoder)(3+4 micro op) natomiast w module BD są również 4 dekodery x86 tyle że wszystkie są dekoderami do operacji złożonych 4x 2 micro op lub 4x 1 Macro op. Dla porównania w K10 Phenom są 3 Complex Decodery x86(3x 2 micro op lub 3x 1 Macro op). W K10 Phenom są 3x ALU/AGU(nie jednocześnie) co w efekcie dawało max operacji na Integer w jednym takcie ok 1.5ALU i 1.5AGU. Co do Cache to Core SB ma L1I 32KB 8-way i L1D 32KB 8-way natomiast Moduł(Core) Bulldozera ma L1 64KB 2-way i 2x L1D 16KB 4-way z kolei K10 Phenom ma 1LI 64KB 2-way i L1D 64KB 2-way.
Bez Cache L2 rdzeń K10 Phenom zajmuje ok 33 miliony tranzystorów, SB 55 milionów tranzystorów a Moduł(Core) BD to ok 70 mln tranzystorów.
W patentach jak czarne na białym jest że Moduł to jeden rdzeń x86 z dwoma blokami(Cluster) Integer i jednym blokiem FPU.




Tyle w teorii, a w praktyce po tych pseudo testach widzę, że nie jest wesoło z wydajnością 1 wątku....

Nie ma aplikacji 8 wątkowych dla użytkowników...nawet 6 wątkowych. Większy sens ma dobry procesor 4 wątkowy...

Zobaczymy jak będzie. Bo liczy się też energooszczędność. Buldożer to procesor na lata w sensie negatywnym, bo nie ulegnie większym zmianom (CPU)... Za rok zawita nam w lapkach.... Oby wypaliło, bo jak nie to będzie się AMD kisiło z niskimi cenami jak przy phenomach II....
rainyZobacz profil
Poziom ostrzeżenia: 0%
rainy2011.07.12, 16:53
scooby14444 @ 2011.07.12 14:51  Post: 490999
Właśnie zrobiłem test Gulftowna na standardowych taktach. Cinenench R10: 30723, PhysX z 3DMarka11: 9511, co daje 25 i 27% na korzyść Gulftowna. W aplikacjach nie wykorzystujących wszystkich wątków przewaga będzie na pewno większa. AMD nawet nie zbliżyło się do Intela, i porównujemy tu najnowszy highend AMD, który jeszcze nie wyszedł do 1,5 letniego procka Intela. Z tego wynika że AMD jest 2 lata w plecy, może jakby wsadzili z 12 rdzeni do by dogonili Gulftowna.
Także Buldożer pokonuje Sandy Bridge chyba tylko w chorych umysłach fanów AMD z klapkami na oczach



To taka rewelacja, iż 6-rdzeniowy/12-wątkowy procesor okazuje się szybszy niż 4-rdzeniowy/8-wątkowy?
Jeżeli już, to te 320 dolarów za najmocniejszego Bulldozera, to najwyższa półka mid-range ewentualnie dolna high-end.

Btw, możesz nam podać ile kosztował Cię (lub Twoich rodziców) ten procesor?
DRUDA_INŻ_AMD_DEZobacz profil
Poziom ostrzeżenia: 0%
DRUDA_INŻ_AMD_DE2011.07.12, 17:10
Ciekawy jestem skąd wy bierzecie te wszystkie innowacje a pro po Procesora Buldożer ,ani go nie widzieliście ani AMD nie przedstawiło jeszcze konkretnych danych architektury a wy już wszystko wiecie jak będzie działał i co to będzie .

Ten co pisze tutaj że to prcesor 8 rdzeniowy ma rację i nie ma racji ,jak również ten którzy napisze że to cztery moduły po niby dwa rdzenie każdy również ma rację i nie ma racji . Przekonacie się niebawem co kryje się w nowej lub starej skonsuldowanej architekturze .
Zapraszam do merytorycznej dyskusji .
DRUDA_INŻ_AMD_DEZobacz profil
Poziom ostrzeżenia: 0%
DRUDA_INŻ_AMD_DE2011.07.12, 17:13
Promilus1984 @ 2011.07.12 08:52  Post: 490891
Grave, kolego... ile rdzeni x86 ma bulldozer? Ano 4. A dlaczego 4?
Ano bo integer cluster nie łyka rozkazów x86 tylko uops. uops które generuje dekoder x86 i przesyła do dispatch unit. Rdzeń procesora w obecnych czasach to najmniejsza autonomiczna część wielordzeniowego procesora przetwarzająca kod maszynowy (w tym wypadku x86) zatem obejmuje to cały frontend zawierający m.in. bufory reorganizujące (ROB), logikę odpowiedzialną za zmianę nazw rejestrów (tak by wykorzystać te 72 lub więcej wewnętrznych i by puścić rozkazy w kilka potoków), cache L1I, wreszcie dekodery. Jest i więcej elementów, ile? To wystarczy zobaczyć porównania diagramów reprezentujących k8, k10, core 2, nehalema, sandy bridge...
Zatem moduł to jeden rdzeń x86. A jak są przetwarzane 2 wątki? Czy to wystarczy pod dekoder dwa klastry int podpiąć i już? No właśnie też nie. W tym wypadku praktycznie cały front end jest przystosowany do tzw. vertical multi threading, cluster int to single thread, fpu to symmetric multithreading. Zatem Bulldozer wykorzystuje odmienną implementację od HT intela, natomiast łączy je jedno - że z jednego fizycznego rdzenia x86 są 2 logiczne procesory w systemie. HT bazuje na nieefektywności wykorzystania jednostek wykonawczych, CMT bazuje na nieefektywności wykorzystania front endu, z szczególnym uwzględnieniem dekodera.



Ty kolego jest prawie najbliżej rozwiązania zagadki , twój tok myślenia jest dobry jednak pominąłeś jedną istotną kwestię ! Zgadnij jaką ?
Funkcja komentowania została wyłączona. Do dyskusji zapraszamy na forum.