artykuły

AMD Steamroller – następca Piledriver (Vishera i Trinity). Czego możemy się spodziewać po kolejnej generacji modułowych procesorów?

Steamroller w pigułce

81 5 kwietnia 2013, 08:30 Mateusz Brzostek

Kilka dni temu AMD zaprezentowało swoim inwestorom plany na najbliższą przyszłość, informując między innymi o tym, że architektura Steamroller po raz pierwszy zostanie wykorzystana jeszcze w 2013 roku. To żadna nowość, ale kolejne witryny internetowe zaczęły się ścigać w kopiowaniu informacji sprzed pół roku i podawaniu ich jako nowych. Dlatego przygotowaliśmy dla Was mały, ale wyczerpujący zbiór informacji o nadchodzących procesorach AMD. Uwaga: nie pogubcie się w bitach, bajtach, megahercach i gigatransferach!

Spis treści

W zeszłym roku podczas konferencji AFDS 2012 nowy (wówczas) szef AMD Rory Read powiedział, że od tej pory produkty AMD będą opracowywane regularnie jak w zegarku. Nie zwykliśmy wierzyć bezkrytycznie w zapewnienia „zielonych”, ale to nowe AMD Rory'ego Reada chyba rzeczywiście działa inaczej – „rozkłady jazdy” (roadmaps) nie zmieniają się już co miesiąc. Steamroller od dawna był zapowiadany na drugą połowę 2013 roku, ale niektóre witryny najwyraźniej nie mogą się powstrzymać od powtarzania tego bez końca... 

Steamroller – kolejne ogniwo ewolucji

O architekturze Steamroller (ang. 'walec') już pisaliśmy, a od tamtego czasu nie ujawniono żadnych nowych informacji, ale przypomnijmy krótko, co o niej wiadomo. To kolejny etap rozwoju modułowych procesorów x86 o klastrowej wielowątkowości. Pierwszy raz zastosowana w modułach Bulldozer, została usprawniona i obecnie, jako moduły Piledriver, jest dostępna w sklepach w procesorach Vishera (FX-x3xx) Trinity, a już niebawem także w Richland (APU serii A10 i niższych). Steamroller jest krokiem w kierunku zwiększenia wydajności jednego wątku i efektywności energetycznej.

Dodatkowy dekoder rozkazów, usprawnione przewidywanie skoków i powiększona pamięć podręczna dla instrukcji mają pomóc szybciej „karmić” rdzenie pracą. Powiększono też wewnętrzne bufory zapisu i odczytu do pamięci podręcznej przechowującej dane. W połączeniu z niesprecyzowanymi ulepszeniami schedulera rozkazów ma to umożliwić rdzeniowi Steamroller wykonanie do 30% więcej mikrooperacji w tym samym czasie, niż potrafi rdzeń Piledriver (mowa o maksymalnym wzroście i o mikrooperacjach – nie można tego mylić z wydajnością w konkretnych programach!). Zainteresowanych szczegółami zapraszamy do wcześniejszego artykułu: „Gorące wieści z Hot Chips 2012”.

Pierwszymi procesorami z modułami Steamroller mają być układy o nazwie roboczej Kaveri, przeznaczone do laptopów i komputerów biurkowych ze średniego segmentu (tam gdzie dziś spotyka się procesory Trinity i Richland). Potem moduły Steamroller zostaną wykorzystane do budowy procesorów desktopowych i serwerowych bez układu graficznego, nie wiadomo jednak, jak długo przyjdzie na nie czekać.

Strona:
pybekZobacz profil
Poziom ostrzeżenia: 0%
pybek2013.04.05, 08:52
Jeśli dobrze zrozumiałem, nowych procesorów FX nie będzie w tym roku...
SunTzuZobacz profil
Poziom ostrzeżenia: 0%
SunTzu2013.04.05, 08:56
No to teraz mamy prawie 4 oraz 6 rdzeniowe procesory, a nie 2/3 modułowe. Jeszcze tylko zdublują fetch to marketingowa papka będzie równała się z prawdą.
Steamroller jest krokiem w kierunku zwiększenia wydajności jednego wątku i efektywności energetycznej.

Największym konkretem tutaj jest drugi decoder w module, takie stwierdzenie jest dość niebezpieczne przy braku precyzyjnych informacji. Jak dla mnie to zwiększyli głównie wydajność wielowątkową.
Brak informacji o FPU pozwala sądzić, że dalej jest jedno FPU na moduł, co troche hamuje procesor

W uproszczeniu można powiedzieć, że przy takiej samej szerokości magistrali i liczbie połączeń na laminacie GDDR5 zapewnia wyższą przepustowość niż DDR3, ale kosztem większych opóźnień.

W sumie ciekawa sprawa, która nie miała wpływu na GPU, może mieć na CPU. Zastosowanie GDDR5 może zmniejszyć wydajność CPU, a zwiększyć GPU. Trzeba by tu policzyć, ale chyba tak może być. Z tego co czytałem, to AMD ma nie dać GDDR5 ze względu na cenę, będzie tylko DDR3.

DDR3 trójkanałowe by wystarczyło. Tylko trzeba by je integrować na PCB.
jackowoZobacz profil
Poziom ostrzeżenia: 0%
jackowo2013.04.05, 09:23
11#3
AMD końcem 2013 roku przejdzie na 28 nm. Intel procesory w 22 nm będzie miał już od półtorej roku... Czyżby wybór 28 nm podyktowany był przeniesieniem produkcji poza GF?
ext73Zobacz profil
Poziom ostrzeżenia: 0%
ext732013.04.05, 09:24
-14#4
trochę poza głównym tematem ... ale poruszonym ;) -> CoreBoot jest rewelacyjny ... start Ubuntu z takiej maszyny i SSD to kilak sekund ... rekordziści ponoć mieszczą się w 3 sekundach - cały system z gotowym do pracy desktopem ;)

http://www.youtube.com/watch?v=NAGtUD-IS-Y
ciekawią mnie te minusy ;) to wygląda, jak by strach 'przed nieznanym' ;)
szmonZobacz profil
Poziom ostrzeżenia: 0%
szmon2013.04.05, 09:36
Ciekawe czy ten walec po raz kolejny pokaże swoją szybkość i zmiażdży oczekiwania użytkowników na dobry układ...

ext73 @ 2013.04.05 09:24  Post: 647854
trochę poza głównym tematem ... ale poruszonym ;) -> CoreBoot jest rewelacyjny ... start Ubuntu z takiej maszyny i SSD to kilak sekund ... rekordziści ponoć mieszczą się w 3 sekundach - cały system z gotowym do pracy desktopem ;)

http://www.youtube.com/watch?v=NAGtUD-IS-Y


Bez CoreBoot z dyskiem SSD też się da:
http://www.youtube.com/watch?v=BG34wbrAN5g
m a c i e kZobacz profil
Poziom ostrzeżenia: 0%
m a c i e k2013.04.05, 09:37
Niech wreszcie poprawią wydajność jednego rdzenia, to może wydajność w grach będzie lepsza
arvalZobacz profil
Poziom ostrzeżenia: 0%
arval2013.04.05, 09:46
-1#7
'W Kaveri po raz pierwszy ma zostać zintegrowana przestrzeń adresowa CPU i GPU (przynajmniej w świecie komputerów osobistych)'

Podoba mi się to że zarówno AMD jak i Intel wprowadziły w nowym procesorach zunifikowane adresowanie pamięci (AMD HSA, Intel InstantAccess). To może być spory przełom. Obie firmy wprowadzają takie rozwiązanie praktycznie jednocześnie więc jest szansa na standaryzację. No i co najważniejsze na wsparcie ze strony programistów.
mbrzostekZobacz profil
Poziom ostrzeżenia: 0%
Autor publikacjimbrzostek2013.04.05, 09:52
arval @ 2013.04.05 09:46  Post: 647866
zunifikowane adresowanie pamięci (AMD HSA, Intel InstantAccess)

InstantAccess to NIE JEST zunifikowana pamięć - to implementacja zero-copy (transferów bez kopiowania, tylko z przeliczeniem adresu), co potrafią już Llano, Trinity i Richland. Poza tym (jeśli dobrze zrozumiałem dokumentację) InstantAccess moża wykorzystać na razie tylko w DirectX, a zero-copy u AMD tylko w OpenGL i OpenCL. Być może współdzielenie powierzchni między API jakoś tu pomaga - ale niech się wypowie jakiś znawca od tych spraw :)
arvalZobacz profil
Poziom ostrzeżenia: 0%
arval2013.04.05, 10:09
mbrzostek @ 2013.04.05 09:52  Post: 647868
arval @ 2013.04.05 09:46  Post: 647866
zunifikowane adresowanie pamięci (AMD HSA, Intel InstantAccess)

InstantAccess to NIE JEST zunifikowana pamięć - to implementacja zero-copy (transferów bez kopiowania, tylko z przeliczeniem adresu), co potrafią już Llano, Trinity i Richland.


Wygląda to podobnie:

'With InstantAccess, Intel's graphics driver can deliver a pointer to a location in GPU memory that the CPU can then access directly. The CPU can work on that GPU address without a copy and then release it back to the GPU' - AnandTech

Masz więc dostęp z poziomu procesora CPU do pamięci GPU. Bezpośredni wskaźnik. Możesz więc modyfikować tą pamięć zwykłym programem wykonywanym przez CPU a GPU korzysta z tych danych w locie. Intel specjalnie przygotował własne rozszerzenia dla DX11.1 ponieważ API Microsoftu nie pozwalało na uzyskanie wskaźników do obiektów na których pracuje GPU (przykładowo tekstur, tablic vertexów itp.)

Ale może się mylę. Przydałby się jakiś artykuł który by to wyjaśniał. Czym się oba podejścia różnią od siebie. Bo to ciekawy temat
piwo1Zobacz profil
Poziom ostrzeżenia: 0%
piwo12013.04.05, 10:35
10#10
jak dla mnie najwazniejsza informacja z tego artykulu jest to, ze nastepca richlanda ma miec 6 rdzeni a nie 4ry. nikt wczesniej o tym nie wspominal. ja sie przymierzam do kevari juz od paru lat. chyba po 6 latach zamienie swoja integre w plycie i phenomka2 na ta nowosc. wyglada apetycznie. ale to i tak nie zmieni plynnosci dzialania herosow 3 :)
Zaloguj się, by móc komentować
1