Intel Core i9-9980XE – 18-rdzeniowy procesor z dziewiątej generacji Core

Numerację procesorów zmieniono na serię 9000, żeby dać do zrozumienia, że są wydajniejsze od Core dziewiątej generacji do małej podstawki LGA1151. Porzucono zapomnianą serię Kaby Lake X, która sprawiała kłopoty producentom płyt głównych i nie miała zbyt wielu praktycznych zalet. Poza tym procesorom przybyło – względem odpowiadających im modeli z poprzedniej generacji – megaherców, linii PCI Express i pamięci podręcznej trzeciego poziomu. Można przypuszczać, że oddech konkurencji, układów Ryzen Threadripper, wymusił rezygnację z segmentacji procesorów na te o większych i mniejszych możliwościach. Mogło to być też skutkiem usprawnień w technice produkcji: w dojrzałym procesie produkcyjnym łatwiej znaleźć odpowiednio dużo krzemowych jąder o niewielkiej liczbie niesprawnych lub niespełniających wymagań podsystemów.

Model	Rdzenie /wątki	Taktowanie bazowe	Taktowanie boost	Pamięć podręczna L3	Linie PCI-E	Cena	TDP
Core i9-9980XE	18/36	3,0 GHz	4,5 GHz	24,75 MB	44	ok. 9500 zł	165 W
Core i9-7980XE	18/36	2,6 GHz	4,4 GHz	24,75 MB	44	ok. 10 500 zł	165 W
Core i9-9960X	16/32	3,1 GHz	4,5 GHz	22 MB	44	ok. 1690 dol.	165 W
Core i9-7960X	16/32	2,8 GHz	4,4 GHz	22 MB	44	ok. 1700 dol.	165 W
Core i9-9940X	14/28	3,3 GHz	4,5 GHz	19,25 MB	44	ok. 1390 dol.	165 W
Core i9-7940X	14/28	3,1 GHz	4,4 GHz	19,25 MB	44	ok. 1400 dol.	165 W
Core i9-9920X	12/24	3,5 GHz	4,5 GHz	19,25 MB	44	ok. 1200 dol.	165 W
Core i9-7920X	12/24	2,9 GHz	4,4 GHz	16,5 MB	44	ok. 4950 zł	165 W
Core i9-9900X	10/20	3,5 GHz	4,5 GHz	19,25 MB	44	ok. 1000 dol.	165 W
Core i9-7900X	10/20	3,3 GHz	4,5 GHz	13,75 MB	44	ok. 4200 zł	140 W
Core i7-9820X	10/20	3,3 GHz	4,2 GHz	16,5 MB	44	ok. 900 dol.	165 W
Core i7-7820X	8/16	3,6 GHz	4,5 GHz	11 MB	28	ok. 2420 zł	140 W
Core i7-9800X	8/16	3,8 GHz	4,5 GHz	16,5 MB	44	ok. 600 dol.	165 W
Core i7-7800X	6/12	3,5 GHz	4,0 GHz	8,25 MB	28	ok. 1570 zł	140 W

Przetestowaliśmy najwyższy model Core X dziewiątej generacji: Core i9-9980XE. Jest najwydajniejszy, ale nie spodziewaliśmy się, że w jakikolwiek sposób nas zaskoczy, bo różni się od poprzednika tylko taktowaniem. Zapewne ciekawsze efekty ulepszeń Intela zauważylibyśmy na przykładzie któregoś z niższych modeli – niektóre mają dwa razy więcej pamięci podręcznej niż ich poprzednicy.

Co tak długo?

Uważni Czytelnicy pewnie zauważyli, że Core i9-9980XE mieliśmy już kilka tygodni temu. Rozpoczęliśmy testy prawie natychmiast, ale od razu natrafiliśmy na ważny problem: nie było wiadomo, jak należy ustawić parametry taktowania i trybu turbo. Wydaje się, że to nic trudnego: wkładam procesor, wczytuję ustawienia domyślne i zaczynam testy, tak?

Zwykle nie. Staramy się dopilnować, żeby procesory były testowane w możliwie neutralnych warunkach, niezależnie od wpływu płyty głównej, wykorzystanego zestawu pamięci czy błędów, które bardzo często występują we wczesnych wersjach UEFI do nowo wprowadzonych procesorów. Wśród sprzętu z wysokiej półki (procesory z odblokowanym mnożnikiem, szybka pamięć...) bardzo nieliczne (mniej niż 1 przypadek na 100) są sytuacje, w których złożenie komputera i uruchomienie go bez żadnej ingerencji w ustawienia UEFI da oczekiwaną i obiecaną przez producenta wydajność.

Intel podaje trzy poziomy taktowania dla Core i9-9980XE: 4,5 GHz (maksymalna częstotliwość taktowania turbo z Turbo Boost Max 3.0), 4,4 GHz (maksymalna częstotliwość taktowania turbo bez Turbo Boost Max 3.0) oraz 3,0 GHz (częstotliwość „domyślna”) – te trzy są nadrukowane na pudełku oraz podane w katalogu produktów na stronie ark.intel.com. Wydajność procesora w każdym wyobrażalnym scenariuszu użytkowania zależy bardzo mocno od parametrów, których nie podano: długości trwania najszybszego poziomu turbo oraz maksymalnej częstotliwości taktowania w sytuacji, kiedy wszystkie rdzenie są obciążone.

W karcie danych procesora nie ma żadnych szczegółowych informacji na ten temat. W karcie danych starszych procesorów Intela znajdował się cały rozdział poświęcony limitom energetycznym turbo i działaniu zabezpieczenia termicznego, ale począwszy od układów ósmej generacji (Core i7-8700K i inne) te informacje już nie są publikowane. Jak sugerują niektórzy, Intel celowo nie podaje sugerowanych parametrów trybu turbo, żeby dać producentom płyt głównych pole do popisu w dziedzinie różnych polepszaczy turbo – albo po prostu odblokowanych limitów energetycznych. W ten sposób lepsze płyty główne mogą obiecywać lepszą wydajność.

To czego ma się spodziewać użytkownik, który kupił lub zamierza kupić ten procesor? Trzeba zdać się na automatyczne ustawienia zaproponowane przez płytę główną. Zrobiliśmy tak z modelem Asus Rampage VI Extreme, którego do tej pory używaliśmy do testów procesorów LGA2066. Płyta, na którą dotąd mogliśmy liczyć, ustawiła automatycznie parametry turbo na wartości, które wydały nam się pomyłką. Limit energetyczny krótkiego turbo (PL2) ustalono na 198 W, a limit czasu – na 1 sekundę. To oznacza, że procesor mógł przekroczyć moc równą TDP (165 W) na 1 sekundę; efekt działania takiego turbo jest niezauważalny w większości testów wydajności i praktycznych zastosowań. Dotychczas Intel zalecał ustawienie limitu turbo na wartość o 25% większą, niż wynosi TDP (czyli 206 W), i 8 sekund. Inżynierowie Asusa zapytani o parametry turbo odpowiedzieli, że ta płyta nie obsługuje Core i9-9980XE i że zapewne będzie potrzebna nowa. Tymczasem i9-7980XE działał ze znacznie lepszymi parametrami turbo, dzięki czemu był szybszy od ustawionego na Auto i9-9980XE…

Przez pewien czas większość producentów płyt głównych podawała, że istniejące modele są kompatybilne wyłącznie z procesorami Core z serii 7000 – choć mogliśmy bez problemu uruchomić i9-9980XE nawet na płytach z UEFI sprzed roku. Wyjątkiem był ASRock, który bardzo szybko wydał aktualizacje UEFI do swoich płyt X299 i dodał Core X z serii 9000 do listy obsługiwanych procesorów. Postaraliśmy się więc o model ASRock X299 Gaming K6 z UEFI w wersji 1.70. Niestety, to nie zmieniło sytuacji: limity turbo były ustawione na takie same podejrzanie niskie wartości. Inżynierowie ASRocka byli pomocni: jak się dowiedzieliśmy, Intel nie zalecił żadnych konkretnych ustawień limitów turbo. Sam ASRock radzi ustawić limit mocy PL2 na maksymalną wartość (4095 W), co powoduje, że procesor ograniczają wyłącznie tabela mnożników turbo oraz zabezpieczenie termiczne. Dopóki temperatura procesora pozostaje w normie, turbo działa w nieskończoność.

Sięgnęliśmy jeszcze po trzecią płytę, tym razem jedną z nowych konstrukcji wprowadzonych z myślą o wykorzystaniu z Core X z serii 9000: Gigabyte X299 Aorus Master. Ten model już od najwcześniejszej wersji UEFI obsługuje Core i9-9980XE i powinien być doskonale przygotowany do takiej współpracy. Również na tej płycie automatyczne ustawienia ignorują limit mocy, a taktowanie procesora jest określone przez tabelę mnożników i zabezpieczenie termiczne.

Ostatecznie zdecydowaliśmy, że przetestujemy Core i9-9980XE właśnie w taki sposób: z limitem turbo ustawionym na 4095 W, czyli w praktyce nieistotnym. Skoro nie wiadomo, jakie są zamierzone przez Intela ustawienia, jakość procesora będzie najlepiej odzwierciedlona w takich warunkach, jakie stworzy typowy użytkownik, zmieniający w UEFI możliwie mało. W dokładnie takich samych ustawieniach przetestowaliśmy ponownie Core i9-7980XE – wcześniejszy 18-rdzeniowy model Skylake X.

To oczywiście oznacza, że pobór energii Core i9-9980XE podczas naszych testów daleko przekraczał wartość równą TDP. To okoliczność, na którą Intel wydaje milczącą zgodę i z którą powinni się liczyć użytkownicy. Zawsze można ograniczyć limit mocy turbo przez ustawienie go w UEFI na wybraną wartość.

Core i9-9980XE – taktowanie i turbo

Taktowanie Skylake X w zależności od wykonywania kodu AVX

Przyjęło się myśleć i pisać, że częstotliwość taktowania procesorów Intela obsługujących instrukcje AVX512 przyjmuje trzy poziomy: jeden podczas wykonywania „tradycyjnych” instrukcji, nieco niższy podczas wykonywania programów z instrukcjami AVX256 i jeszcze niższy podczas wykonywania instrukcji AVX512. To pewne uproszczenie, z którego musimy na chwilę zrezygnować. W rzeczywistości instrukcje wywołują spadek częstotliwości taktowania nie w zależności od grup czy szerokości instrukcji (AVX256 lub AVX512), ale od ilości obrabianych danych. Większość instrukcji AVX256 nie powoduje spowolnień do średniego poziomu; wywołują je te, które konsumują najwięcej danych i kosztują najwięcej energii. Na przykład VPMULDQ, czyli mnożenie spakowanych liczb całkowitych, należy do instrukcji AVX256, ale nie powoduje spadku częstotliwości taktowania:

Również 512-bitowe instrukcje AVX w większości przypadków wymuszają tylko średni poziom taktowania. Spadek do najniższej częstotliwości jest powodowany tylko wykonywaniem 512-bitowych instrukcji FMA, np. VFMADDxxxPD – mnożeniem z dodawaniem spakowanych 64-bitowych liczb zmiennoprzecinkowych o podwójnej precyzji:

Co więcej, sporadyczne wystąpienie AVX512 w kodzie nie powoduje spowolnień – tak było w procesorach Haswell i Broadwell, ale nie w Skylake X. Jedna „ciężka” instrukcja wpleciona pomiędzy 100 innych ciągle pozwala zachować szybsze taktowanie. Zmianami częstotliwości zarządza wbudowany w procesor kontroler zasilania i taktowania, który przyznaje poszczególnym rdzeniom licencje (terminologia Intela) na konkretny poziom turbo: najwyższy, średni (AVX256) lub najniższy (AVX512). Przyznanie licencji na szybsze taktowanie i zmiana częstotliwości w górę zajmują ponad 2 ms; zmiana w dół zajmuje nieco mniej. Zbyt częste przełączanie częstotliwości taktowania mogłoby znacząco redukować wydajność, dlatego procesor pozwala sobie na sporadyczne „ciężkie” instrukcje bez spowalniania.

To w końcu jaką częstotliwość taktowania ma Core i9-9980XE?

Jak wspomnieliśmy, Intel nie dokumentuje wszystkich szczegółów – trzeba było sprawdzić to w praktyce, a nie w specyfikacji lub we wskazaniach programów diagnostycznych. Dane przedstawione poniżej odzwierciedlają taktowanie podczas wykonywania niewielkiego programu testowego z różnymi rodzajami instrukcji.

Na niebiesko zaznaczyliśmy taktowanie Core i9-9980XE, a na szaro – i9-7980XE. Trzy poziomy odpowiadają programom bez AVX, z AVX256 oraz z AVX512 (najwyższa, średnia i najniższa licencja turbo).

Odkryliśmy w ten sposób dwa nieudokumentowane zachowania procesora dotyczące taktowania.

W ustawieniach fabrycznych Core i9-9980XE ani Core i9-7980XE nie mają ustalonych offsetów AVX, czyli częstotliwość taktowania podczas wykonywania mniej i bardziej intensywnych instrukcji wektorowych nie jest zawsze niższa o stałą wartość od częstotliwości, którą procesor by przyjął w trakcie wykonywania mało intensywnych instrukcji. Wygląda na to, że procesory mają trzy oddzielne tabele mnożników: dla kodu skalarnego, dla kodu wektorowego o niskiej przepustowości i dla kodu wektorowego o najwyższej przepustowości.
Core i9-9980XE ma pięć różnych poziomów turbo podczas wykonywania kodu skalarnego, ale sześć podczas wykonywania kodu AVX512-FMA. Dla i9-7980XE nie ma różnicy, czy obliczamy FMA na 5 czy 12 rdzeniach; i9-9980XE ma jeden poziom turbo dla 5–8 obciążonych rdzeni i oddzielny dla 9–12 obciążonych rdzeni.

Warto zauważyć, że taktowanie i9-7980XE i i9-9980XE podczas najwyższego obciążenia jest takie samo. Taktowanie turbo w razie obciążenia jednego lub dwóch rdzeni również jest zbliżone. Sądzimy, że to efekt bardziej skrupulatnego sortowania procesorów. Taktowanie jednego–dwóch rdzeni jest w obu procesorach ograniczone jakością krzemu, a taktowanie podczas obciążenia wszystkich rdzeni instrukcjami wektorowymi – budżetem energetycznym. Core i9-9980XE największą przewagę nad starszym 18-rdzeniowcem ma przy średnim obciążeniu, np. kiedy wszystkie rdzenie wykonują kod bez AVX.

Intel Turbo Boost Max 3.0 – lepsze turbo dla najlepszych rdzeni

Znana ze starszych procesorów Broadwell i Skylake X technika przyspieszania dwóch najlepszych (oznaczonych w fabryce) rdzeni bardziej niż pozostałych działa od pewnego czasu zupełnie bezingerencyjnie. Najnowsza wersja Windows (Windows 10 1809) oraz systemy Linux z kernelem z ostatnich miesięcy nie wymagają instalacji specjalnego sterownika – wszystko jest wbudowane w system operacyjny. Zachowanie TBM3.0 można przywrócić do poprzedniego stanu (wymagającego aplikacji Intela) przez zmianę odpowiedniego ustawienia w UEFI.

Turbo Boost Max 3.0 nie wpływa na taktowanie AVX (średnia i najniższa licencja turbo).

Gigabyte X299 Aorus Master

Wszystkie testy wydajności wykonaliśmy na płycie Gigabyte X299 Aorus Master. To jedna z płyt, które producenci wprowadzili w tym roku z myślą o Core X dziewiątej generacji. Domyślamy się, że przy ich projektowaniu wykorzystano doświadczenia nabyte w trakcie użytkowania procesorów Skylake X poprzedniej generacji.

Wspólną cechą nowych płyt są znacznie bardziej rozbudowane systemy chłodzenia komponentów zasilających procesor. Liche ozdobne radiatory nie sprawdziły się w zeszłym roku w połączeniu z prądożernymi 18-rdzeniowymi układami, i tym razem postarano się o lepsze.

A przynajmniej taki był zamiar: zastosowano porządny radiator z wieloma żebrami, o konstrukcji podobnej do najlepszych schładzaczy procesorów i kart graficznych. Niestety, jakiś sabotażysta zakrył żebra ozdobną blaszką, która całkowicie blokuje przepływ powietrza wokół każdego żebra radiatora. O celowości tego sabotażu przekonuje nas to, jak starannie zadbano o zakończenie skośnych wycięć w tym samym miejscu po obu stronach: bliższej procesora i tej dalszej.

Na szczęście jest jeszcze druga część radiatora, umieszczona równolegle do portów I/O, połączona z grzejącymi się elementami za pomocą grubego ciepłowodu. Wyposażono ją nawet w mały wentylator o średnicy 35 mm i prędkości 5000 obr./min (maksymalnie do 9000 obr./min, ale jego prędkość jest ustawiona na stałe). Niestety, i ta część nie uchroniła się przed sabotażem: dopływ powietrza do wentylatora jest starannie zablokowany przez plastikową osłonę portów I/O oraz metalową maskownicę.

O dziwo, mimo tych wszystkich absurdów system chłodzenia działa całkiem nieźle. Temperatura tranzystorów w układzie zasilania nie przekroczyła 80°C nawet po podkręceniu, kiedy procesor pobierał ok. 500 W. Również kultura pracy małego wentylatorka nie pozostawia wiele do życzenia. Był on zdecydowanie cichszy niż dwa 120-milimetrowe wentylatory na chłodnicy układu AIO chłodzącego procesor.

Pomiędzy portami I/O a gniazdami RAM-u umieszczono kontroler układu zasilania: Renesas/Intersil ISL69138. Zasilanie rdzeni procesora (V_IN, dalej konwertowane w obudowie procesora) jest sterowane sześciofazowo. Sygnały sterujące zostają podwojone i przesunięte przez umieszczone na spodzie laminatu podwajacze ISL6617A, zanim dotrą do zintegrowanych w jednej obudowie sterownika oraz górnego i dolnego mosfetu.

Prąd do peryferyjnych podsystemów procesora jest dostarczany przez skromny konwerter z dwoma tranzystorami, jedną cewką i jednym kondensatorem.

Aby zmieścić rozbudowany układ zasilania na ograniczonej powierzchni, zrezygnowano z jednego z otworów mocujących na górnej krawędzi. Na szczęście płyta usztywniona radiatorem od góry i metalową osłoną od spodu raczej nic na tym nie straci. Osłona spodu odprowadza również ciepło z podwajaczy PWM i powierzchni laminatu pod układem zasilania procesora.

Gigabyte X299 Aorus Master ma zestaw funkcji, do którego przyzwyczaiły nas płyty z wysokiej półki. Odseparowany układ dźwiękowy, zewnętrzne i wewnętrzne złącza USB 3.1 Gen 2 i mnóstwo złączy do podświetlenia RGB nie są już niczym unikatowym. Na szczęście inżynierowie Gigabyte'a zrezygnowali z pięciopinowych złączy RGBW, do których nie dało się podłączyć popularnych i tanich taśm z diodami RGB.

Za komunikację sieciową odpowiadają dwa kontrolery LAN-u: Intel I219-V (1 Gb/s) oraz Realtek RTL8125 (2,5 Gb/s). Gigabyte jest jedną z pierwszych firm, które zdecydowały się na nowy kontroler szybkiego LAN-u Realteka zamiast jednego z produktów Aquantii, do tej pory używanych w płytach z najwyższej półki. Zamontowano również kartę sieciową WiFi Intel 8265NGW, zapewniającą sieć w standardzie 802.11ac i wyposażoną w podwójną antenę (2×2, do 867 Mb/s).

Płyta ma trzy gniazda M.2, z których najwyższe (M2M) jest podłączone do procesora i jest zawsze aktywne, nawet jeśli zainstalujemy cztery karty graficzne, które wtedy pracują z prędkościami ×16/×8/×8/×8. Dwa pozostałe gniazda M.2 są podłączone do chipsetu, obsługują również nośniki z sygnałowaniem SATA, a zainstalowanie w jednym w nich nośnika wyłącza dwa porty SATA.

Płyta Gigabyte X299 doskonale się spisała podczas naszych ograniczonych testów. Podkręcanie jest łatwe i nie sprawia kłopotów, układ zasilania jest dobrze przygotowany nawet na najcięższe obciążenia. Lekką irytację wywołują tylko charakterystyczne dla Gigabyte'a cechy UEFI (np. nie można wyłączyć kontrolera WiFi/Bluetooth) i absurdalny (ale działający zadowalająco!) system chłodzenia układu zasilania procesora.

Galeria

ASRock X299 Gaming K6

Część eksperymentów z taktowaniem i trybem turbo procesora Skylake X przeprowadziliśmy na płycie ASRock X299 Gaming K6. Jako jedna z pierwszych na rynku oficjalnie obsługiwała nowe Core X dziewiątej generacji. Inżynierowie ASRocka wydali już dwie przeznaczone do nich wersje UEFI, co doskonale świadczy o marce: starsze płyty zostały bardzo szybko przystosowane do nowych procesorów.

W ofercie płyt X299 ASRocka są jeszcze dwie tańsze konstrukcje, Extreme 4 w wersjach ATX i mikro-ATX.

Wyposażenie tej płyty pozwala wykorzystać podstawowe zalety platformy Skylake X. Do dyspozycji są trzy sloty PCI-E dla kart graficznych (maks. ×16/×16/×8) i trzy gniazda M.2. Wszystkie M.2 są podłączone do chipsetu, więc można w nich zainstalować nośniki z sygnałowaniem PCI-E albo SATA, ale każdy zainstalowany nośnik wyłącza jeden lub dwa porty SATA. Płyta ASRocka była również jedną z niewielu, które obsługiwały pamięć ECC (niebuforowaną) – niestety, powyżej pewnej wersji UEFI pamięć ECC już nie działa, bo Intel rezerwuje tę możliwość dla droższych procesorów Xeon W.

Płyta ma dwa kontrolery LAN: Intel I211 oraz I219-V. Jest też miejsce na slot M.2 dla karty sieciowej WiFi, ale w tym modelu jej nie ma.

Układ zasilania procesora jest rozbudowany, ale chłodzony radiatorem o bardzo małej powierzchni. Spisywał się wystarczająco dobrze podczas testów 18-rdzeniowego procesora z limitem mocy ustawionym na 165 W lub 198 W (takie były ustawienia domyślne). Nie podejmowaliśmy prób podkręcania, ale nie zalecamy połączenia tej płyty z 18-rdzeniowym układem Skylake X i zniesionym limitem mocy PL2.

Zestaw testowy i procedura

Jak zwykle wszystkie testy przeprowadziliśmy z wykorzystaniem możliwie nowych wersji gier, systemu operacyjnego, sterowników karty graficznej oraz UEFI płyt głównych.

W testach wydajności w grach i programach użytkowych działających pod kontrolą Windows użyliśmy systemu i sterowników w następujących wersjach:

Windows 10, kompilacja 1809;
Nvidia GeForce 416.XX.

We wszystkich testach wykorzystujemy pamięć o najszybszym obsługiwanym przez producenta taktowaniu. To oznacza następujące częstotliwości taktowania i opóźnienia:

procesory Ryzen Threadripper pierwszej generacji oraz Intel Core do podstawki LGA2066 – DDR-2666 CL16 16-16-36 1N;
procesory Ryzen Threadripper drugiej generacji – DDR-2933 CL16 16-16-36 1N;
wszystkie procesory po podkręceniu – DDR-3200 CL16 16-16-36 1N.

Wszystkie testy w ustawieniach fabrycznych wykonaliśmy przy takich parametrach, jakie określił producent procesora. Tryb turbo działał wyłącznie w ramach ograniczeń producenta procesora – różne „polepszacze” turbo zwiększające limity prądu lub mnożniki turbo powyżej fabrycznych ustawień były wyłączone. Chodzi tu o dostępne na wybranych płytach funkcje: Enhanced Turbo, Enhanced Boost, Multicore Enhancement itp.

	Sprzęt	Dostawca
Płyta główna LGA2066	Gigabyte X299 Aorus Master	www.gigabyte.pl
Płyta główna TR4	Asus ROG Zenith Extreme	www.amd.com
Płyta główna LGA1151	Asus Maximus X Formula	www.asus.com
Płyta główna AM4	Asus Crosshair VI Extreme UEFI 6101	www.asus.com
Karta graficzna (testy w Windows)	Zotac GeForce GTX 1080 AMP! Extreme	www.zotac.com
Pamięć DDR4	G.Skill TridentZ DDR-3600 4 × 8 GB F4-3600C16Q-32GTZR	własna
Nośniki SSD	2 × SSD Crucial M500 960 GB	www.crucial.com
Zestaw chłodzenia cieczą (LGA2066, LGA1151, AM4)	SilentiumPC Navis Pro 240	www.silentiumpc.com
Zasilacz	Enermax Platimax 850 W	www.enermax.pl

Testy profesjonalne – renderowanie

V-Ray

Blender 2.79

Test renderowania dużej sceny przeprowadziliśmy z wykorzystaniem projektu Gooseberry z kolekcji przykładowych projektów na oficjalnej stronie Blendera.

Test renderowania małej sceny to ten sam benchmark, którego użyliśmy w poprzednich artykułach.

Corona

Corona to popularny renderer dostępny jako wtyczka do 3ds Maxa, Cinema 4D, a także jako samodzielne oprogramowanie i w postaci serwera umożliwiającego rozdzielenie zadań pomiędzy wiele komputerów.

Cinebench

Gdzie jest test w Cinebenchu? Postanowiliśmy z niego zrezygnować z powodów wyjaśnionych we wcześniejszym artykule. Czytelnik, który lubi czerpać informacje ze źródła, powinien sobie poradzić.

Testy profesjonalne – obróbka i kodowanie wideo

Adobe Premiere Pro

Przeprowadziliśmy dwa warianty testu w Premiere Pro. W pierwszym największe znaczenie ma kodowanie filmu 4K o małej głębi kolorów z minimalną obróbką (tylko montaż, bez korekcji kolorów i zaawansowanych efektów).

Drugi wariant testu obejmuje rozbudowany projekt z mniej więcej 48 GB plików źródłowych w rozdzielczości 4K nagranych z krzywą tonalną S-Log. Materiały są poddawane korekcji kolorów, stabilizacji i innym efektom, a na koniec eksportowane jednocześnie do dwóch plików H.264 o różnych parametrach kodowania i różnej przepływności.

DaVinci Resolve

W tym teście mierzymy czas eksportowania filmu złożonego z czterech plików źródłowych 4K pochodzących z kamery RED. Tego rodzaju kamery nagrywają obraz w surowej postaci podobnej do plików RAW w fotografii; eksportowanie filmu to nie tylko kodowanie wideo do innego formatu, ale również demozaikowanie (ang. debayering) i inne efekty.

Kodowanie wideo – x264

Kodowanie wideo – H.265 (Handbrake)

Testy profesjonalne – Adobe After Effects, Adobe Photoshop

Adobe After Effects CC 2018

Adobe Photoshop CC 2018

Testy biurowe – Chrome, JavaScript, 7-Zip

Dodatkowe testy

Szachy – analiza (Stockfish 10)

Ten test odzwierciedla wydajność procesorów podczas ciągłej analizy partii szachowej. To długotrwałe, stałe obciążenie. Po kilku minutach analizy, która doprowadza komputer do równowagi termicznej, mierzymy wydajność przez minutę. Wykorzystaliśmy najsilniejszy silnik szachowy, Stockfish 10. Komputer analizuje możliwe ruchy i ocenia siłę pozycji z partii rozegranej na tegorocznym turnieju na wyspie Man pomiędzy arcymistrzem Maxime'em Vachier-Lagrave'em a mistrzem międzynarodowym Nikolasem Lubbem.

Silnik Stockfish jest dostępny w trzech wersjach, zoptymalizowanych pod kątem układów o różnych zestawach instrukcji. Podajemy wynik najszybszej wersji – w przypadku procesorów Skylake X wersja BMI2 jest nieco szybsza od wersji POPCNT, a w przypadku procesorów Zen – na odwrót.

Dziękujemy czytelnikowi krzyyss za porady dotyczące wykorzystania komputerowych szachów oraz pomoc w przygotowaniu testu!

Szachy – krótki test (Stockfish 8)

W tym teście komputer ma ograniczony czas i musi wykonać najlepszy, jego zdaniem, ruch. Test trwa od kilkunastu sekund (na najwydajniejszych procesorach) do około minuty (na bardzo wolnych procesorach). To sprawia, że pokazuje wydajność w krótkich zadaniach, które zwykle zostają zakończone w trakcie trwania maksymalnego przyspieszenia procesora („krótkiego” turbo).

Symulacja MES – OpenFOAM, XiFoam

Symulacja przepływu cieczy to jedno z zastosowań metody elementów skończonych (MES) – techniki matematycznej pozwalającej szybko otrzymać przybliżone rozwiązanie układu równań różniczkowych. MES jest podstawą symulacji fizycznych związanych z wytrzymałością materiałów i konstrukcji, przepływem cieczy i gazów, aerodynamiką, kinematyką maszyn. To podstawowa technika matematycznego modelowania w mechanice. Test symulacji przepływu cieczy wykonujemy w OpenFOAM – otwartoźródłowym pakiecie oprogramowania do modelowania i symulacji. To najpopularniejsza opcja alternatywna do płatnych zestawów oprogramowania, takich jak: Solidworks, PTC Creo, ANSYS Fluent.

W tym teście symulujemy spalanie gazu w zwężającej się dyszy (znany eksperyment R. Pitza i J. Daily'ego z 1983 roku, popularny jako tutorial do OpenFOAM) za pomocą solvera XiFoam. Ten test wykorzystuje ok. 7 GB pamięci operacyjnej i składa się z trzech etapów. Dwa pierwsze trwają kilkadziesiąt sekund i są jednowątkowe. Główną, najdłużej trwającą część symulacji można rozłożyć nawet na 64 wątki.

Duża symulacja w OpenFOAM wymaga przede wszystkim dużej przepustowości pamięci operacyjnej, choć oczywiście ważna jest też duża moc obliczeniowa. Procesory z czterokanałowym kontrolerem RAM-u są znacznie szybsze od tych z dwukanałowym, nawet jeśli nie mają znacznie więcej rdzeni.

Pobór energii

Na wykresie uwzględniającym maksymalne obciążenie procesora przedstawiliśmy najwyższy pobór mocy, jaki przez co najmniej minutę zarejestrowaliśmy w czasie testów. W przypadku procesorów Skylake X było to w trakcie renderowania dużej sceny w Blenderze lub podczas symulacji w OpenFOAM.

Core i9-9980XE pobiera w spoczynku i przy niewielkim obciążeniu mniej prądu od i9-7980XE. Jednak szybsze taktowanie powoduje, że podczas największego obciążenia jest o 10% bardziej prądożerny od swojego poprzednika. Różnica raczej nie ma większego znaczenia ani w rachunkach za energię elektryczną, ani w wyborze układu chłodzenia. Poborem mocy można sterować przez ustawienie limitu mocy w trybie turbo; oczywiście, odbywa się to kosztem utraty wydajności w zadaniach wielowątkowych.

Podkręcanie Core i9-9980XE

Do podkręcania nowego procesora Skylake X wykorzystaliśmy dość proste środki: zmieniliśmy tylko różne limity natężenia prądu, taktowanie i opóźnienia pamięci, napięcie zasilania procesora, mnożnik i offsety AVX.

napięcie zasilania (V_CORE): 1,27 V
napięcie wejściowe ISVR (V_RIN): 1,9 V
mnożnik: ×46
offset AVX256: -8
offset AVX512: -12

Ostatecznie częstotliwość taktowania układu w większości testów wynosiła 4600 MHz. W aplikacjach wykorzystujących AVX (Blender, Premiere Pro, V-Ray) wynosiło od ok. 3600 MHz do ok. 4400 MHz, zależnie od intensywności obliczeń wektorowych.

Jak się okazało, po zmianie procesora z i9-9980XE na i9-7980XE płyta główna nawet nie wykryła, że zmieniliśmy procesor, i nie zaproponowała wczytania domyślnych ustawień. Postanowiliśmy wykorzystać tę okazję do sprawdzenia, czy starszy układ może pracować z identycznymi ustawieniami. Okazało się, że tak! To samo napięcie zasilania, kompensacja LLC, takie same częstotliwości taktowania dawały tak samo stabilną maszynę. Oczywiście, różniły się pobór energii oraz raportowana temperatura.

Zarejestrowaliśmy wskazywaną przez procesory temperaturę. Przypominamy, że to wskazanie ma mało wspólnego z rzeczywistością i jest dla nas istotne tylko dlatego, że zabezpieczenie termiczne spowalniające procesor jest wyzwalane właśnie w zależności od tego parametru. Wystarczy wspomnieć, że w pomieszczeniu panowała temperatura 23°C, zewnętrzna powierzchnia IHS-a miała w spoczynku temperaturę ok. 27–29°C, a obu procesorom zdarzało się wskazywać około 25°C.

Dzięki nieco niższej konsumpcji energii oraz przylutowanemu rozpraszaczowi ciepła i9-9980XE pracuje w tych samych warunkach o 10 stopni dalej od progu zabezpieczenia termicznego. Ale przy podanych wyżej ustawieniach napięcia i taktowania zabezpieczenie termiczne nie było ograniczeniem w podkręcaniu. Stabilność podczas obciążenia AVX była ograniczona jakością krzemu i ustalonym napięciem zasilania. Zapewne moglibyśmy osiągnąć szybsze taktowanie AVX po podkręceniu, gdyby płyta główna umożliwiała ustawienie różnych poziomów napięcia dla różnych licencji turbo.

Podczas kilkunastominutowego obciążenia temperatura raportowana przez elementy układu zasilania na płycie nie przekroczyła 70°C. Raportowana przez procesor pobierana moc nie była wskazywana tak dokładnie jak w przypadku procesorów Core i9-9900K. Podczas maksymalnego obciążenia zarówno i9-7980XE, jak i i9-9980XE podawały, że pobierają nie więcej niż 120 W, podczas gdy cały komputer pobierał w rzeczywistości 545 W (i9-9980XE) lub 590 W (i9-7980XE). To skutek albo działania jakichś mechanizmów sterowania podkręcaniem, albo błędu w UEFI wspólnego dla wszystkich trzech płyt (Asus Rampage VI Extreme, ASRock X299 Gaming K6, Gigabyte X299 Aorus Master).

Podkręcanie – renderowanie

V-Ray

Blender 2.79

Test renderowania dużej sceny przeprowadziliśmy z wykorzystaniem projektu Gooseberry z kolekcji przykładowych projektów na oficjalnej stronie Blendera.

Test małej sceny to ten sam benchmark, którego użyliśmy w poprzednich artykułach.

Corona

Corona to popularny renderer dostępny jako wtyczka do 3ds Max, Cinema 4D, a także jako samodzielne oprogramowanie i w postaci serwera umożliwiającego rozdzielenie zadań pomiędzy wiele komputerów.

Podkręcanie – obróbka i kodowanie wideo

Adobe Premiere Pro

DaVinci Resolve

Kodowanie wideo – x264

Kodowanie wideo – H.265 (Handbrake)

Podkręcanie – Adobe After Effects, Adobe Photoshop

Podkręcanie – Chrome, JavaScript, 7-Zip

Podkręcanie – dodatkowe testy

Szachy – analiza (Stockfish 10)

Silnik Stockfish jest dostępny w trzech wersjach, zoptymalizowanych pod kątem układów o różnych zestawach instrukcji. Podajemy wynik najszybszej wersji – w przypadku procesorów Skylake X wersja BMI2 jest nieco szybsza od POPCNT, a w przypadku procesorów Zen – na odwrót.

Dziękujemy czytelnikowi krzyyss za porady dotyczące wykorzystania komputerowych szachów oraz pomoc w przygotowaniu testu!

Szachy – krótki test (Stockfish 8)

Symulacja MES – OpenFOAM, XiFoam

Duża symulacja w OpenFOAM wymaga przede wszystkim dużej przepustowości pamięci operacyjnej, chociaż oczywiście ważna jest też duża moc obliczeniowa. Procesory z czterokanałowym kontrolerem RAM-u są znacznie szybsze od tych z dwukanałowym, nawet jeśli nie mają znacznie więcej rdzeni.

Core i9-9980XE kontra Core i9-7980XE

Core i9-9980XE kontra Threadripper 2990WX

Podsumowanie

Odświeżony Skylake X – z każdej strony odrobinę lepiej

Najważniejszą cechą Core i9-9980XE jest to, że jest drogi. Za cenę samego procesora można złożyć dwie nieźle wyposażone stacje robocze, i obie z nich będą szybsze niż dowolny 2–3-letni komputer. Wszystko, co dalej piszemy, należy rozważać z uwzględnieniem tej najważniejszej cechy.

Core i9-9980XE jest owocem ciągłych usprawnień w procesie produkcyjnym Intela, bardziej rygorystycznego sortowania oraz lepszego wykorzystania budżetu energetycznego. Ten ostatni jest wyznaczony przez możliwości prądowe płyt głównych oraz możliwości układów chłodzenia, nie przez Intela. Dokumentacja procesora jest celowo lakoniczna i pozostawia pole do interpretacji producentom płyt głównych i entuzjastom podkręcania. To zdecydowany kontrast w porównaniu z procesorami Ryzen Threadripper z serii WX – te są ściśle ograniczone przez limit mocy ustawiony na taką samą wartość jak podany na stronie producenta i na pudełku parametr TDP.

Dzięki przylutowaniu IHS-a i lepszemu dopasowaniu tabeli mnożników do konsumpcji energii przy różnych poziomach taktowania i9-9980XE jest podczas średniego obciążenia znacznie szybciej taktowany niż i9-7980XE – nawet do 400 MHz. To daje zauważalny wzrost wydajności w wielu zastosowaniach. Niestety, skutkuje też nieco wyższym poborem energii w trakcie wysokiego obciążenia. Ten procesor reprezentuje podobny krok względem Core X z serii 7000 co procesory dziewiątej generacji do podstawki LGA1151 względem swoich poprzedników. Intel sięgnął w tegorocznych produktach po wszystkie dostępne środki, żeby poprawić wydajność bez zasadniczego postępu technologicznego.

Core i9-9980XE jest zatem szybszy od i9-7980XE w każdych warunkach, a kosztuje tyle samo lub nieco mniej. Ktoś, dla kogo poprzedni 18-rdzeniowiec Intela był atrakcyjny, już nie ma powodu, żeby nie wybrać zamiast niego nowego modelu.

Jednak taniej można kupić układ Ryzen Threadripper 2990WX – różnica w cenie to ok. 1500 zł w polskich sklepach i ok. 1000 zł dla tych, którzy nie mają nic przeciwko wysyłce z zagranicznego magazynu. Ten tysiąc można przeznaczyć np. na zestaw pamięci operacyjnej o większej pojemności lub większej prędkości (co zresztą bardzo się przydaje w obu maszynach). Threadripper jest mniej wydajny w małowątkowych lub przestarzałych technicznie programach, ale deklasuje i9-9980XE w wydajności wielowątkowej i funkcjonalności. Można do niego podłączyć więcej urządzeń PCI Express i pamięć ECC.

W zależności od zastosowania, koniecznych akceleratorów obliczeniowych, podsystemu dyskowego i perspektyw modernizacji lepszym wyborem raz będzie jeden procesor, raz drugi. Threadripper wygrywa pod trzema ostatnimi względami, ale Core i9-9980XE jest znacznie mniej wrażliwy na niedostatki oprogramowania.

A już niebawem (jeśli plany ogłoszone przez Intela się nie zmieniły, to jeszcze przed końcem roku) spodziewamy się jeszcze bardziej egzotycznej maszyny obliczeniowej: 28-rdzeniowego Xeona W-3175X.

Intel Core i9-9980XE

Zalety	Wady
bardzo wysoka wydajność wielowątkowa	bardzo wysoka cena
dobra wydajność małowątkowa	ograniczona funkcjonalność (ECC, linie PCI Express)
dobre możliwości podkręcania