Na każdej stronie wyczekiwanej prezentacji AMD świeci informacja o embargo - do 05:01PM PDT 17 września, czyli do 02:01 CET, 18 września.
Trochę zaskoczyło nas „embargo” do drugiej w nocy naszego czasu, na materiał przekazany o godzinie 15:00– czyżby ktoś liczył na to, że o tej porze nikomu nie zechce się czytać? Na życzenie AMD podpisaliśmy dokument NDA. A co dostaliśmy w zamian?
Początek jest taki.
No tak, wszystko to już niby znamy, ale spróbujmy poczytać „miedzy wierszami”. A czytając w ten sposób i równocześnie pamiętając, co też było przy tym slajdzie mówione, dowiadujemy się, że wybór pomiędzy dwoma a czterema jądrami to zdecydowanie zbyt mały zakres. Dlaczego więc nie 1-2-3-4? Wygląda dość rozsądnie, a jeśli tylko otrzyma sensowną strukturę cen, może stanowić duży sukces, zarówno bezpośrednio w sprzedaży, jak i w odbudowie podupadającej ostatnio rozpoznawalności marki AMD. Dlaczego od razu duży sukces? Na początek – w postaci bardzo głośnej informacji, przebiegającej we wszystkich kierunkach przez Internet. Aby dowiedzieć się, na czym polega szansa na sukces procesora trzyrdzeniowego w czasach, kiedy takie konstrukcje nie cieszą się popularnością, jeśli chodzi o wiedzę o nich, proponujemy dalszą lekturę. Warto również poznać metody, jakimi układ może być wykonywany i towarzyszące tym metodom trudności.
Potrójne już było
Potrójne jądro procesora już było. Co więcej, występuje obecnie na rynku w milionach sztuk. Oczywiście jako procesor Xenon w konsolach Xbox 360. Programiści piszący gry na Xbox 360 bardzo sobie chwalą jego potrójność (na początku "opór materii" był całkiem spory) – wiele algorytmów trudno podzielić skutecznie na większą liczbę równolegle obsługiwanych wątków.
Okazuje się, że koncepcja AMD zaczyna się dobrze pokazywać z wielu różnych stron. Niektórzy wcześni krytycy stawiają jednak pewien problem konstrukcyjny – w jaki sposób trzy 64-bitowe jądra mają korzystać z dwóch 128-bitowych interfejsów pamięci? Ich błąd i zapóźnienie informacyjne – w AMD K10 zlikwidowano dwa 128-bitowe interfejsy, zastępując je czterema 64-bitowymi. Jest to logiczne i skuteczne w przypadku wszystkich czterech spodziewanych wersji procesora – od jednordzeniowej po czterordzeniową. Dlaczego? Bo przecież nigdzie nie jest powiedziane, że dane znajdujące się w pamięci obok należą do tej samej aplikacji, a w najlepszym razie – czy są w ogóle potrzebne. Wymyślony problem okazuje się już nie istnieć.
Na schemacie blokowym, jaki pokazaliśmy wyżej, wszystko jest łatwe i proste, jeśli jednak porównamy sobie „floorplan” Phenoma X4 z Phenomem X3, różnice okażą się drastyczne.
Polegają one na zmianie kształtu obszarów, zajmowanych przez niektóre, większe bloki funkcjonalne – takim obszarem jest na przykład pamięć cache L3, której kształt musiałby ulec zmianie. A to równa się prawie całkowitemu przekonstruowaniu takiego bloku. Rzecz kosztowna, skomplikowana i czasochłonna.
Kiedy i jak?
Jednym z najczęściej stawianych wobec AMD pytań było: „Czy trzydzeniowe Phenomy będą w rzeczywistości układami czterordzeniowymi, z zablokowanym wadliwym rdzeniem, czy też mają to być nowe układy, projektowane od początku jako trzyrdzeniowe?”. Oczywiście AMD wzdraga się bardzo przed przyznaniem do korzystania z wadliwych chipów, utrzymując, że konstrukcja jest całkowicie, od podstaw trzyrdzeniowa. Jednak dość trudno w to uwierzyć... Tłumaczyliśmy wcześniej, że nowy floorplan układu to zarazem projektowanie jego części od nowa. Taka wersja wydarzeń jednak, swoją drogą, mogłaby stanowić doskonałe uzasadnienie długotrwałości procesu produkcyjno-wdrożeniowego Phenomów.
Skoro natywny triple core jest jednak, jak wcześniej pokazaliśmy, bardzo odmienny od quad core , a z roadmapy wynika, że debiutować ma razem z dual core, znaczyłoby, że AMD sprostało gigantycznemu obciążeniu, w postaci zaprojektowania trzech dość odrębnych procesorów. A nawet czterech, bo przecież jeszcze jest serwerowa Barcelona!
Jednak warto zauważyć, że wykorzystywanie układów częściowo wadliwych jest powszechną praktyką, stosowaną przez wielu producentów. Najlepszym przykładem takiej praktyki są zasady stosowane w IBM i u innych producentów procesorów Cell. Jakie? Procesor z działającymi wszystkimi ośmioma SPP otrzymuje przeznaczenie do zadań specjalnych (serwery typu blade i inne konstrukcje HPC), do konsol trafiają procesory z siedmioma do pięciu sprawnymi SPP, zaś te, w których udało się uzyskać zaledwie 4 lub mniej działających SPP, trafiają też do jakiejś grupy zastosowań. Nikt się tego nie wstydzi, ani z tym nie kryje, a przecież wszyscy wiemy, że uzysk procesorów w 65-nanometrowym procesie AMD nie jest rewelacyjny, więc i takich defektów może być sporo.
Nie zwracając jednak uwagi na to, czy Phenom X3 będzie „zagospodarowanym odpadem produkcyjnym”, czy procesorem z od nowa zaprojektowanym layoutem, wydaje się on pomysłem wręcz rewelacyjnym. Mniej-więcej w połowie drabinki cenowej pomiędzy modelami Phenom X2 i i Phenom X4, za to z wydajnością zdecydowanie bliższą temu drugiemu, ma wielkie szanse stać się ulubionym procesorem mniej zamożnych komputerowych entuzjastów.
O tej wydajności to oczywiście przypuszczenie, ale nie bez podstaw – kiedy powstawał Xenon do Xbox 360, przeprowadzane liczne symulacje wykazywały, że zastosowanie czterech jąder Power 970 przynosiło zysk wydajności w zakresie 0 do 5 procent. Dlaczegoż zresztą miałoby być inaczej? Popatrzmy przez chwilę na wyniki naszych własnych testów. Wynika z nich dość jednoznacznie, że trójrdzeniowa konstrukcja ma prawo okazać się wręcz optymalna w wielu typach zadań, a tylko w nielicznych ustępuje wyraźnie konstrukcji czterordzeniowej. W sumie jedynie od struktury cen zależy, czy Phenom X3 zrobi zasłużoną karierę.