Wehikuł czasu, czyli CrossFire oraz SLI
Dopóty, dopóki sprzęt komputerowy nie będzie zdolny policzyć dowolnej rzeczy w czasie rzeczywistym albo renderować obrazu o wysokiej rozdzielczości w 120 kl./s, nie będzie można powiedzieć, że procesory lub karty graficzne są już wystarczająco szybkie. Producenci tych podzespołów na szczęście zdają sobie z tego sprawę i zapewniają potencjalnym użytkownikom ogromne możliwości łączenia urządzeń, by wspólnie pracowały nad jednym zadaniem. System z wieloma procesorami czy wieloma kartami graficznymi może złożyć każdy... oczywiście pod warunkiem, że ma odpowiednio gruby portfel.
Dzisiaj zajmiemy się konfiguracjami złożonymi z więcej niż jednej karty, a mianowicie systemami CrossFire (technika łączenia Radeonów) oraz SLI (technika łączenia kart GeForce), które na rynku są od lat, ale wciąż sprawiają mniejsze bądź większe problemy. Jen-Hsun Huang, prezes Nvidii, lubi o SLI myśleć jak o wehikule czasu, bo jak mówi, „udostępnia twórcom oprogramowania oraz graczom moc, którą pojedyncze produkty będą zapewniać dopiero w bliżej nieokreślonej (kilka lat) przyszłości”, i efekty łączenia na przykład dwóch kart graficznych pokazują słuszność tego twierdzenia. Przykład? GeForce GTX 680 SLI w Far Cry 4. Pojedynczy kepler w tej grze osiąga około 42–43 kl./s, a więc jeśliby konserwatywnie założyć skalowanie SLI wraz z dołożeniem kolejnej karty na poziomie 70%, konfiguracja złożona z dwóch takich kart osiągałaby około 70 kl./s. Wystarczy przejrzeć nasz ostatni test w najnowszej produkcji Ubisoftu, aby się przekonać, że posiadacze dwóch GTX-ów 680 w trybie SLI już od ponad 2 lat mogą cieszyć się wydajnością czołowego Maxwella, czyli GTX-a 980. Oczywiście, to tylko teoria, gdyż dochodzi wiele innych czynników, o których nieco więcej napiszemy w dalszych akapitach.
Tak czy inaczej, można sprawić, aby kilka GPU pracowało nad jednym obrazem (a właściwie nad kolejnymi klatkami następującymi po sobie), a zaleta jest oczywista: często pozwala to zagrać w zwykle niegrywalnych trybach lub znacznie zwiększyć płynność animacji. To może być niezbędne na przykład do tego, aby dało się grać na 120- czy 144-hercowym monitorze w niesamowitej płynności obrazu w najwyższych ustawieniach szczegółowości. Z plusów to w zasadzie tyle... ale niczego więcej nie należało się spodziewać.
Gorsze strony CrossFire i SLI
Niestety, systemy multi-GPU mają znacznie więcej wad niż zalet, dlatego naszym zdaniem takie konfiguracje powinny się ograniczać do najszybszych kart graficznych. Przy porównywalnej liczbie klatek na sekundę (np. we wspomnianym przykładzie GTX 680 SLI kontra GTX 980) zawsze pojedyncze i duże GPU wyjdzie na prowadzenie pod względem realnej płynności obrazu. W styczniu przedstawiliśmy metodę FCAT, polegającą na sprzętowym przechwytywaniu klatek dopiero na ekranie monitora. Metoda ta pozwoliła zobrazować na wykresach zacięcia, od których nie są wolne konfiguracje złożone z wielu kart graficznych, i od tamtej pory wciąż z niej korzystamy, monitorując przy okazji to, jak zmienia się sytuacja wraz z kolejnymi wydaniami sterowników, I trzeba powiedzieć, że zmienia się to wszystko raczej wolno. Rozwiązania multi-GPU wciąż nie są idealne i by działały poprawnie, musi współgrać ze sobą kilka czynników: karty graficzne, sterowniki oraz gry.
Występowanie zacięć to jednak niejedyny problem. Innym są profile do poszczególnych gier i programów użytkowych w sterownikach. Zdarza się, że jeszcze długo po tym, jak gra trafia do sprzedaży, nie są dostępne sterowniki zapewniające w niej obsługę techniki CrossFire lub SLI. Sama gra nie będzie umiała skorzystać z większej liczby rdzeni GPU, jeśli sterownik nie zajmie się tym odpowiednio. Innymi słowy, posiadacze trzech czołowych kart graficznych i tak będą mogli wykorzystać tylko jedną z nich, jeśli Nvidia lub AMD nie dopisze w sterownikach odpowiedniego profilu. Wracając do wspomnianych opóźnień: naszym zdaniem długo to więcej niż 2–3 tygodnie, po którym to czasie zainteresowanie danym tytułem znacząco spada. Zakładamy przy tym, że posiadacz dwóch lub trzech kart to zapalony gracz, który praktycznie natychmiast kupuje wszelkie interesujące go nowości i nie ma zamiaru czekać na przykład miesiąc, aż pojawi się stosowny profil do CrossFire lub SLI w sterownikach.
Innym problemem jest to, że obecność w obudowie więcej niż jednej karty trzeba wziąć pod uwagę, dobierając inne podzespoły. Podstawa to zasilacz: naturalnie, wraz z każdą kolejną kartą liniowo wzrasta zapotrzebowanie całego zestawu na energię, a maszyny do grania w rozdzielczości 4K (ale w prawdziwej 4K, a nie skalowanej i w 30 kl./s ;)) potrafią pobierać z gniazdka nawet 900–1000 W.
Następnie trzeba pomyśleć o procesorze. Użycie SLI i CrossFire zwiększa jego obciążenie (także za sprawą obciążenia wynikającego z działania sterownika), dlatego jesteśmy ograniczeni do najwydajniejszych rozwiązań, to jest podkręconych Core i5 oraz Core i7 Sandy Bridge i Ivy Bridge lub ogólnie układów z serii Intel Haswell – również Core i5 i Core i7. Zastosowanie zbyt słabego procesora doprowadzi do tego, że dołożenie drugiej lub trzeciej karty nie przyniesie żadnej korzyści – po prostu nie będą one wykorzystywane i/lub wydajność takiej konfiguracji nie będzie się skalować ze względu właśnie na ograniczoną moc procesora, a to poważny problem. Może się bowiem okazać, że wydatek setek czy tysięcy złotych na kolejną kartę graficzną nie zapewni żadnego przyrostu wydajności, a czasem nawet spowoduje pogorszenie osiągów (ze względu na dodatkowe obciążenie)!.
Przyrost mocy wraz z kolejnymi kartami graficznymi, czyli jak to się skaluje
Do najczęściej omawianych problemów multi-GPU (CrossFire i SLI) należy skalowanie. Jedną z oznak dobrego skalowania jest to, że dołożenie drugiej karty zapewnia wydajność dwukrotnie większą od osiągów pojedynczej, a dołożenie trzeciej – trzykrotnie większą. Tak idealne skalowanie jednak nie jest możliwe, a powodów jest wiele, od działania sterownika po wydajność procesora. Oczywiście, producenci wciąż pracują nad rozwiązaniem tego problemu, ale nie ma co ukrywać, że przeznaczają na to znacznie mniejsze środki niż na opracowywanie nowych architektur czy dodatków do sterowników, z których skorzystają wszyscy, a nie tylko ci, którzy mają w komputerze przynajmniej dwie karty graficzne.
Wracając do skalowania: to, że po dołożeniu drugiej karty liczba klatek na sekundę się nie zwiększy, czasami wcale nie musi oznaczać, że zakup był całkowicie nietrafiony. Możliwe bowiem, że procesor po prostu nie domaga i karty graficzne zaczynają się nudzić, a raportowane przez programy diagnostyczne obciążenie wynosi tylko 70–80% na kartę. W takiej sytuacji płynność animacji co prawda się nie poprawi, ale można włączyć dodatkowy efekt, na przykład ustawić bardziej intensywne wygładzanie krawędzi. W ten sposób obciążenie kart się zwiększy i zapewnimy sobie lepszą jakość obrazu przy niezmienionej liczbie klatek na sekundę. Oto właśnie tajemnica całego tego „skalowania”: czasem zapewnia jedynie lepszą jakość obrazu, nie zaś większą płynność.
Testy CrossFire i SLI
Do naszej redakcji przyjechało w krótkich odstępach czasu trochę wysokiej klasy sprzętu. Nie mogliśmy jednak pozwolić sobie na żadne kompromisy, więc na potrzeby niniejszego artykułu zmieniliśmy platformę testową, bo Core i7-4770K z konsumenckiej linii zdawał się trochę nie pasować do trzech najlepszych kart graficznych pracujących jednocześnie ;)
Platformę testową oparliśmy zatem na procesorze Intel Core i7-5930K, czyli sześciordzeniowcu w architekturze Haswell, który zapewnia więcej linii PCI Express niż jakikolwiek inny układ tej firmy – aż 40. Osadziliśmy go na najlepszej płycie głównej X99, modelu Asus Rampage V Extreme, wraz z 32 GB pamięci operacyjnej.
Najważniejszym punktem testów były jednak pomiary wydajności kart graficznych. Użyliśmy czołowych modeli AMD i Nvidii. Z oferty „czerwonych” wzięliśmy trzy Radeony R9 290X firmy Club3D, taktowane z częstotliwością: rdzeń – 1050 MHz, pamięć – 1350 MHz. Z katalogu „zielonych” wybraliśmy trzy karty Gigabyte GeForce GTX 980 G1 Gaming, których taktowanie wynosi: rdzeń – 1228 MHz (rośnie do 1354 MHz), pamięć – 1753 MHz.
Wszystkie testy wykonaliśmy z użyciem techniki FCAT. Co prawda zwykle, dla większej przejrzystości artykułu, nie pokazujemy „zaawansowanych” wykresów wygenerowanych za pomocą tego narzędzia, jednak tym razem to zrobimy, w końcu mamy do czynienia z systemami multi-GPU, w których mikrozacięcia występują znacznie częściej i mogą całkowicie popsuć zabawę.
Platforma testowa i ustawienia
Wszystkie testy wydajności kart graficznych i procesorów zostały wykonane przy użyciu techniki FCAT.
Platforma do pomiarów wydajności kart graficznych składała się z następujących podzespołów:
Sprzęt | Dostawca | |
---|---|---|
Procesor | Core i7-5930K @ 4,5 GHz | www.x-kom.pl |
Płyta główna | Asus Rampage V Extreme X99 | pl.asus.com |
Monitor | Asus ROG Swift PG278Q (2560 × 1440, 144 Hz, G-Sync) | www.nvidia.pl |
Monitor 4K | NEC EA244UHD (3840 × 2160, 60 Hz) | www.necdisplay.com |
Karty graficzne | Club3D R9 290X royalAce | www.extrememem.pl |
Karty graficzne | Gigabyte GTX 980 G1 Gaming | www.gigabyte.com |
Miernik natężenia dźwięku | Sonopan SON-50 | www.sonopan.com.pl |
Pamięć | Crucial Ballistix Sport 32 GB 2400 MHz C16 | www.crucial.com |
Nośnik systemowy | Plextor M3 Pro 256 GB | www.plextor-digital.com |
Nośnik dodatkowy | Seagate Barracuda Desktop 4 TB | www.seagate.com |
Schładzacz procesora | Zalman CNPS 11X Extreme | www.zalman.com |
Zasilacz | Corsair AX1200 1200 W | www.corsair.com |
Obudowa | Aerocool Strike-X ST | aerocool.com.pl |
Backup danych | Acronis True Image 2014 | www.acronis.pl |
System operacyjny:
- Windows 8.1 64-bitowy.
Sterowniki:
- AMD Catalyst 14.12 Omega,
- Nvidia GeForce 344.75 WHQL.
Minimalna liczba klatek na sekundę – FCAT a wykresy słupkowe
Niekiedy wartości na wykresach słupkowych zamieszczonych w tym artykule zdają się nie odpowiadać wartościom na szczegółowych wykresach z wynikami pomiaru FCAT. Oto przykład:
Na powyższym wykresie widać, że obie konfiguracje zaliczyły spadki wydajności, sporo poniżej 20 kl./s...
...a jednak już na wykresie słupkowym minimalne wskazywane wartości to nieco powyżej 30 kl./s.
Dzieje się tak, ponieważ mechanizm FCAT oblicza minimalną liczbę klatek na podstawie parametru 99per, czyli bierze wszystkie wyniki pomiarów i odrzuca 1% skrajnych. Dopiero na podstawie reszty generowane są wartości na wykresach.
Z tego względu zalecamy przyjrzenie się nie tylko wykresom słupkowym, ale także szczegółowej prezentacji czasu generowania poszczególnych klatek.
Testy – GeForce GTX 980 kontra Radeon R9 290X
Na dalszych stronach przedstawiamy porównanie pojedynczych kart graficznych Radeon R9 290X (model royalKing firmy Club3D) oraz GeForce GTX 980 (model G1 Gaming firmy Gigabyte).
A oto uśrednione wyniki z 11 przetestowanych przez nas gier.
Assassin's Creed: Unity
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Battlefield 4
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Call of Duty: Advanced Warfare
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Crysis 3 (Welcome to the Jungle)
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
Crysis 3 (The Root of All Evil)
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
Crysis 3 (Welcome to the Jungle)
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Crysis 3 (The Root of All Evil)
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Far Cry 4
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Max Payne 3
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Middle-earth: Shadow of Mordor
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Ryse: Son of Rome
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Tomb Raider
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Watch Dogs
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
The Witcher 2: Assassins of Kings (Las)
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
The Witcher 2: Assassins of Kings (Wieża)
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
The Witcher 2: Assassins of Kings (Las)
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
The Witcher 2: Assassins of Kings (Wieża)
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Testy – GeForce GTX 980 SLI kontra Radeon R9 290X CrossFire
Dalsze strony zawierają wyniki testów wydajności dwóch tandemów kart graficznych: GeForce GTX 980 w trybie SLI oraz Radeon R9 290X w trybie CrossFire.
Poniżej przedstawiamy uśrednione rezultaty w wybranych przez nas grach.
Assassin's Creed: Unity
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Battlefield 4
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Call of Duty: Advanced Warfare
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Crysis 3 (Welcome to the Jungle)
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
Crysis 3 (The Root of All Evil)
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
Crysis 3 (Welcome to the Jungle)
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Crysis 3 (The Root of All Evil)
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Far Cry 4
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Max Payne 3
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Middle-earth: Shadow of Mordor
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Ryse: Son of Rome
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Tomb Raider
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
Watch Dogs
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
The Witcher 2: Assassins of Kings (Las)
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
The Witcher 2: Assassins of Kings (Wieża)
2560 × 1440 – milisekundy
2560 × 1440 – klatki na sekundę
2560 × 1440 – wykres procentowy
2560 × 1440 – średnia wydajność
The Witcher 2: Assassins of Kings (Las)
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność
The Witcher 2: Assassins of Kings (Wieża)
4K (3840 × 2160) – milisekundy
4K (3840 × 2160) – klatki na sekundę
4K (3840 × 2160) – wykres procentowy
4K (3840 × 2160) – średnia wydajność