artykuły

Od czego zależy wydajność GPU

25
13 marca 2020, 19:00 Piotr Gołąb

Jak na wydajność układu graficznego wpływa TDP, częstotliwość taktowania, napięcie zasilające GPU czy szerokość szyny pamięci. Czy liczba rdzeni RT bezpośrednio przekłada się na szybkość generowania grafiki tworzonej przy użyciu ray tracingu, czy też inne elementy mają kluczowy wpływ. Jak bardzo konkretne bloki GPU wpływają na wydajność kart. Przeprowadzając proste testy, udało nam się odpowiedzieć na te pytania.

Spis treści

W artykule Test najpopularniejszych kart graficznych ostatniej dekady sprawdzaliśmy, jak zmieniała się wydajność najchętniej kupowanych kart graficznych w ciągu ostatnich lat. Kolejne generacje GPU, zmiany procesu technologicznego wpływały na znaczny wzrost wydajności. Oczywiście rosła również cena. Aktualnie na przeciętną kartę graficzną trzeba przeznaczyć około 1000 złotych, kilka lat temu za 1500 złotych można było kupić znacznie wyżej usytuowany w hierarchii model. W obrębie 10 lat postęp jest bardzo duży, jeżeli jednak spojrzymy na znacznie krótszy okres czasu, który obejmuje jedną lub dwie architektury, rodzi się pytanie o segmentacje kart. Flagowy GPU określa aktualne możliwości najnowszej technologii i technik, na nic więcej nie możemy liczyć. Oczywiście karty wyposażone topowy układ graficzny, są drogie, obecnie nawet bardzo. Tak duża kwota wstępu do grona graczy byłaby dla wielu osób zaporą nie do przebycia, toteż od wielu lat producenci układów graficznych skutecznie tworzą wiele słabszych i niżej wycenionych GPU. 

fot. Shutterstock

Zazwyczaj dzieje się to w dwojaki sposób. W trakcie produkcji nowych układów lepszy uzysk daje możliwość stworzenia jeszcze lepszej karty, która będzie działać szybciej. Z drugiej strony naturalne jest, że powstają słabsze modele ograniczone sztucznie przez producenta. Ograniczenie to może być zrealizowane na kilka sposobów:

  • Niższa częstotliwość taktowania rdzenia oraz TDP.
  • Mniejsza liczba bloków funkcjonalnych, która bezpośrednio przekłada się na wydajność obliczeniową.
  • Mniej pamięci graficznej, co ma znaczenie w przypadku niektórych gier.
  • Węższa magistrala pamięci.

W ten sposób, regulując te parametry, można stworzyć całą rodzinę kart, zapewniającą pełne spektrum wydajnościowe i cenowe. W wypadku architektury Turing, w sklepach znajdziemy karty z serii GTX, z czego najtańszy model GeForce GTX 1650, pozbawiony modułów RT, kosztuje nieco ponad 600 złotych. Flagowy model GeForce RTX 2080 Ti dostępny jest w cenie ponad 5000 złotych. Architektura ta sama, jednak konfiguracja GPU, rozmiar rdzenia i możliwości jakże inne. O ile firma AMD nie ma jeszcze propozycji w najwydajniejszym segmencie, to zarówno Nvidia, jak i AMD w średnim i budżetowym przedziale cenowym mają bardzo wiele modeli GPU. Co ciekawe, pod względem wydajności i cen, karty rzadko rywalizują ze sobą. Owszem, są modele mniej lub bardziej opłacalne, ale poprzez zmianę wyżej wymienionych parametrów producenci GPU są w stanie precyzyjnie umieścić dany model w segmencie wydajnościowym. 

Patrząc od strony użytkownika, pewne parametry można zmieniać poprzez konfigurację, natomiast zawsze w ograniczonym zakresie. Parametry, na które wpływ ma użytkownik to:

  • Częstotliwość pracy rdzenia graficznego - zwykle można ją zwiększyć, jednak wcześniej należy przydzielić karcie większy budżet energetyczny poprzez zwiększenie parametru TDP. Możliwości podkręcania zależą od wielu czynników, także tych zależnych od konkretnego egzemplarza, a wzrost wydajności nie przekracza kilkunastu-kilkunastu procent. 
  • Częstotliwość pracy pamięci  - podobnie jak w wypadku GPU, także i pamięć VRAM można podkręcać. W tym wypadku wszystko zależy od modelu i zainstalowanych w nim pamięci. CO więcej, w zależności od architektury wzrost wydajności uzyskany tą metodą może być różny.

Po drugiej stronie stoją parametry, które zostały arbitralnie nadane przez producenta GPU podczas segmentacji modeli. Nie mamy na nie wpływu, wszelkie decyzje związane ze specyfikacją GPU podejmujemy podczas zakupu.

  • Liczba i rodzaj jednostek obliczeniowych w GPU
  • Szerokość szyny pamięci
  • Rozmiar zamontowanej pamięci

Producent karty ─ wpływ na wydajność

Dobrze wiecie, że sam producent karty graficznej nie ma bezpośrednio dużego wpływu na wydajność GPU. Z testów kart niereferencyjnych, które dla Was przeprowadzamy, wynika, że różnice w szybkości podobnie wycenionych modeli nie przekraczają kilku procent. Zdecydowanie ważniejsze są jednak inne kryteria, na przykład układ chłodzący GPU. To on odpowiada za możliwości OC oraz za osiąganą maksymalną częstotliwość w trybie boost. Oczywiście kluczowa jest także głośność pracy, bo jeśli wydajność jest na podobnym poziomie, to podczas wyboru konkretnego modelu pod uwagę należy wziąć kolejne kryteria - również cenowe. 

Co będziemy testować? 

W tym artykule postanowiliśmy sprawdzić dla Was czynniki nie zawsze zależne od użytkownika. Na kolejnych stronach dowiecie się, jak TDP, częstotliwość taktowania, a także i napięcie zasilające GPU wpływają na końcową wydajność. Jakiego rodzaju są to zależności oraz jak duży jest to wpływ. Dodatkowo udało nam się wyizolować takie różnice jak: szerokość szyny pamięci, pojemność pamięci lub liczba rdzeni RT. Zapraszamy do lektury. 

Strona:
techonZobacz profil
Poziom ostrzeżenia: 0%
techon2020.03.13, 19:08
11#1
Wykresy z 2. strony do poprawy. W trybie nocnym nic nie widać (rysunki nie posiadają tła).
PutoutZobacz profil
Poziom ostrzeżenia: 0%
Putout2020.03.13, 20:19
-1#2
W teście szyny powinniście dać też symulacje na takiej samej przepustowości pamięci. Bo tutaj nie sama szyna robi różnicę tylko większą przepustowość
BelforZobacz profil
Poziom ostrzeżenia: 0%
Belfor2020.03.13, 20:35
Putout @ 2020.03.13 20:19  Post: 1236845
W teście szyny powinniście dać też symulacje na takiej samej przepustowości pamięci. Bo tutaj nie sama szyna robi różnicę tylko większą przepustowość

Dokładnie. Szyna danych sama z siebie nie zwiększa wydajności, bo jest tylko częścią większego systemu, czyli przepustowości pamięci.
daerraghZobacz profil
Poziom ostrzeżenia: 0%
daerragh2020.03.14, 01:06
-3#4
Dziwne wyniki undervoltingu. Mam MSI GTX 1060 w prawie najslabszej wersji tej firmy z dwoma wentylatorami. Karta robi ok. @stock Turbo 1850MHz na rdzeniu przy @stock V=1.06V. Po undervoltingu @0.9V robi 1950MHz na rdzeniu (jest to maks. Turbo, ktorego karta bez uV nie osiaga). Po OC @0.9V robi stale 2000MHz na rdzeniu. Wniosek taki, ze karta po uV przyspiesza, a u Was zwalnia. I nie ruszalem w ogole limitu TDP.

EDIT:
OK, wyglada na to, ze zrobiliscie uV i underclocking a mieliscie tylko zrobic uV (na pewno zrobiliscie underclocking, bo karta ma gorsze osiagi, czyli mniejsza czestotliwosc pracy niz @stock). Nie potrzebnie przesuneliscie wykres w dol, powinniscie w lewo jak juz (ale nie wiem czy tak sie da). Karta z wykresow ma maks. Turbo 2000MHz i to dla tej czestotliwosci powinniscie szukac najmniejszego dzialajacego napiecia. Po takim zabiegu karta powinna osiagac swoja maks. czestotliwosc Turbo ustalona przez producenta (czyli 2000MHz z wykresu) przy nizszym zuzyciu energii, czyli powinna przyspieszyc wzgledem @stock V. Tak jak u mnie: stock=1.06V 1850MHz, uV=0.9V 1950MHz, czyli wyzsza czestotliwosc (ale nie wyzsza niz maks. Turbo, czyli brak OC) przy mniejszym V, czyli mniejszym poborze.
Edytowane przez autora (2020.03.14, 02:08)
Lone_WolfZobacz profil
Poziom ostrzeżenia: 0%
Lone_Wolf2020.03.14, 04:36
' Na kolejnych slajdach pokarzemy tę procedurę krok po kroku.'

Czym chcecie tę procedurę pokarać? Umieszczeniem na tej samej stronie z komentarzem o nieporadności tłumaczenia ? :E
Edytowane przez autora (2020.03.14, 04:41)
XiaomiGorsze93Zobacz profil
Poziom ostrzeżenia: 0%
XiaomiGorsze932020.03.14, 11:35
Lone_Wolf @ 2020.03.14 04:36  Post: 1236861
' Na kolejnych slajdach pokarzemy tę procedurę krok po kroku.'

Czym chcecie tę procedurę pokarać? Umieszczeniem na tej samej stronie z komentarzem o nieporadności tłumaczenia ? :E

bo to zła procedura była i ogóle...eee...karty też były złe i yyy...procedury, procedury też były złe.
StilgarusZobacz profil
Poziom ostrzeżenia: 0%
Autor publikacjiStilgarus2020.03.14, 11:49
Belfor @ 2020.03.13 20:35  Post: 1236848
Putout @ 2020.03.13 20:19  Post: 1236845
W teście szyny powinniście dać też symulacje na takiej samej przepustowości pamięci. Bo tutaj nie sama szyna robi różnicę tylko większą przepustowość

Dokładnie. Szyna danych sama z siebie nie zwiększa wydajności, bo jest tylko częścią większego systemu, czyli przepustowości pamięci.

Pamięci pracowały z identyczną szybkością 14Gbps. Różniła je tylko szerokość szyny.
Ven2020.03.14, 12:00
Dzięki za test i za podrzucenie Vray Benchmark akurat go jeszcze nie testowałem.
Pozwolę sobie podrzuć moje wyniki mogą być dla kogoś przydatne.
Proc 3900x @4.2GHz / 1.28V
Graf: Zoltac 1080FE @ GPU-2037Hz Mem-5130Hz Vc=1075mV
Wyniki:
Y-Ray ksamples 20809
V-Ray GPU 309 mpaths
Max. Mpaths per second: 5.354216
Sampling level reached: 512 samples per pixel

I te wyniki mówią dlaczego pozostałem w AMD i dlaczego nie widzę sensu obecnie wymieniać 1080 FE (a co dopiero jak ktoś ma Ti).
Wyniki przy względnej ciszy bo procek siedzi pod Dark Rock Pro 4 na 4.2 max temp 73C w stresie. Na grafie siedzi Arctic Cooler i max temp 55C.

PutoutZobacz profil
Poziom ostrzeżenia: 0%
Putout2020.03.14, 13:45
Stilgarus @ 2020.03.14 11:49  Post: 1236885
Belfor @ 2020.03.13 20:35  Post: 1236848
(...)

Dokładnie. Szyna danych sama z siebie nie zwiększa wydajności, bo jest tylko częścią większego systemu, czyli przepustowości pamięci.

Pamięci pracowały z identyczną szybkością 14Gbps. Różniła je tylko szerokość szyny.


nie rozumiesz. chodzi o pokazanie że tak naprawdę nie liczy się szerokość szyny tylko przepustowość pamięci. tego testu właśnie zabrakło. ustawić RX 5700 na 1300 MHz żeby obie karty miały taką samą przepustowość i wtedy porównać wpływ szyny. bo to co zrobiliście tylko kultywuje mit szyny pamięci i ludzie bez zrozumienia myślą że więcej bitów da karcie jakąś turbo moc zamiast zwrócić uwagę także na rodzaj pamięci i ich taktowanie.
Edytowane przez autora (2020.03.14, 13:46)
IsomaneZobacz profil
Poziom ostrzeżenia: 0%
Isomane2020.03.14, 15:27
Putout @ 2020.03.14 13:45  Post: 1236895
Stilgarus @ 2020.03.14 11:49  Post: 1236885
(...)

Pamięci pracowały z identyczną szybkością 14Gbps. Różniła je tylko szerokość szyny.


nie rozumiesz. chodzi o pokazanie że tak naprawdę nie liczy się szerokość szyny tylko przepustowość pamięci. tego testu właśnie zabrakło. ustawić RX 5700 na 1300 MHz żeby obie karty miały taką samą przepustowość i wtedy porównać wpływ szyny. bo to co zrobiliście tylko kultywuje mit szyny pamięci i ludzie bez zrozumienia myślą że więcej bitów da karcie jakąś turbo moc zamiast zwrócić uwagę także na rodzaj pamięci i ich taktowanie.


No ja też nie rozumiem, także jakbyś mógł to weź wytłumacz, bo specjalistą od tego zagadnienia nie jestem. Wydawało mi się zawsze, że przepustowość pamięci karty = szybkość pamięci * szyna. O ile by tak było, zmniejszenie szerokości szyny skutkowałoby zmniejszeniem przepustowości, o ile szybkość pamięci pozostanie ta sama. W którym momencie się mylę ?
edit. Ten moment, gdy piszesz coś i dostajesz minusa, a typ pod tobą pisze to samo i dostaje plusa :D
Edytowane przez autora (2020.03.14, 16:54)
Zaloguj się, by móc komentować
1