Jak to było możliwe?
W jaki sposób udało się architekturę Hammer tak usprawnić, by nie tylko mogła rywalizować, ale wręcz pokonała pod względem wydajności arcydzieło, jakim wydawał się do niedawna intelowski Core 2 Duo? W makroarchitekturze – wiadomo, że jądro K10 otrzymało drugą jednostkę zmiennoprzecinkową, umożliwiającą poszerzenie operacji SIMD (SSE) do 128 bitów. To jednak nie wyjaśnia w żaden sposób, dlaczego K10 jest wydajniejsze od Core 2 Duo w operacjach logicznych i całkowitoliczbowych. Tymczasem wyjaśnienie jest stosunkowo proste. Jądro K10 dysponuje dwoma dedykowanymi schedulerami – osobnym dla operacji ALU i osobnym, 36-drogowym dla operacji FP, tymczasem Conroe musi sobie radzić z jednym, zaledwie 32-drogowym schedulerem.
Wystarczyło więc poszerzenie szyn dostępu do pamięci cache i kontrolera pamięci RAM, by w operacjach SSE uzyskać przewagę dochodzącą do 60% przy pracy z jednakowymi zegarami. To samo poszerzenie szyn pozwoliło również na zwiększenie wydajności operacji arytmetyczno-logicznych, wystarczająco duże, by zapewniło przewagę w benchmarkach. Co ciekawe, choć logiczne w kontekście konstrukcji schedulerów, przewaga K10 w operacjach logicznych i całkowitoliczbowych nad Core 2 jest tym większa, im większy jest w wykonywanym kodzie udział operacji SSE.
Powołujemy się w niniejszym tekście na wyniki i oszacowania dostarczone przez AMD. Wielu Czytelników może więc postawić zarzut, że wyniki te są marketingowo zawyżone. Sam nie oparłbym się takiemu podejrzeniu, gdyby nie potwierdzenie ze strony... samego Intela. Korporacja sprawia wrażenie wyraźnie zaniepokojonej nadchodzącą konkurencją, chociaż pokłada duże nadzieje w Penrynie, który ponoć ma się rozprawić z K10.
