komentarze
mbrzostekZobacz profil
Poziom ostrzeżenia: 0%
Autor publikacjimbrzostek2020.05.11, 15:58
Assassin @ 2020.05.11 15:01  Post: 1243341
Średni przyrost wydajności we wszystkich testach na 1 CCX to 3,77, a po odrzuceniu skrajnych wyników - 3,25.

Nie sądzę, że średnia wydajność jest tu ważna. To podobna sytuacja, co porównywanie i9-9900K do TR 2920X (wykres ze starego artykułu): policzona w jakiś wybrany przez nas sposób średnia jest prawie równa, ale wydajność tych dwóch procesorów wcale nie jest podobna. Jeśli ktoś wybierze X lub Y, to z powodu tych skrajnych wyników, w których przewaga jednego nad drugim jest największa. Albo jeszcze inaczej: gdyby AMD czy Intel mogli wprowadzić jakieś zmiany w architekturze, które zupełnie by nie zmieniły wydajności w 95% zastosowań, ale w pewnych programach dawały przyspieszenie o XX%, to warto sięgać po takie ulepszenie? W moich oczach te kilka zastosowań, w których 3300X jest zauważalnie szybszy, jest istotne, nawet jeżeli w średniej gdzieś to ginie.

graben @ 2020.05.09 19:09  Post: 1243187
Jeśli AMD w kolejnej generacji zastosuje aktywny interposer

Nie sądzę, że w bliskiej przyszłości (1-3 lata) przekładki – a na pewno nie aktywne –staną się dość tanie i proste w produkcji, żeby budować z nich taki 'domowy' produkt o stosunkowo niskiej cenie i sprzedawany w dużej ilości. Wszystkie produkowane do tej pory układy z przekładką (w dodatku pasywną) są w pewnym sensie opłacane przez profesjonalne zastosowania. Np. Radeon VII istnieje i opłaca się tylko dlatego, że potrzebne były Radeony Instinct z tym GPU – nie sądzę, że opłacało by się wkładać wysiłek inżynieryjny w opracowanie go, gdyby zawsze miał pozostać tylko drogą kartą graficzną do gier i półprofesjonalnych zastosowań.
AssassinZobacz profil
Poziom ostrzeżenia: 0%
Assassin2020.05.12, 09:50
Czy warto sięgać to kwestia bilansu korzyści i kosztów. Do i9-9900K do TR 2920X to bym jednak raczej nie porównywał, bo tu mediana jest na poziomie 1%, a tam liczenie mediany pewnie nie miałoby żadnego sensu. Bardziej można to porównać do eDRAM-u stosowanego swego czasu u Intela. On poprawiał wydajność w skrajnych przypadkach nawet powyżej 50%, ale równie często nie dawał nic. Ostatecznie Intel uznał, że się po prostu nie opłaca (zbyt wysokie koszty względem korzyści).

Tutaj też nie mówimy raczej o prostym ulepszeniu architektury, ale zmianie pewnej filozofii, która będzie kosztowała (w budżecie tranzystorów i/lub uzysku). W końcu po coś AMD te CCX-y wymyśliło i stosowało je nawet w monolitycznych CPU. Dzięki chipletom odejście od tego może się jednak teraz opłacać.
CaroozoZobacz profil
Poziom ostrzeżenia: 0%
Caroozo2020.05.13, 10:50
bigovsky @ 2020.05.11 13:07  Post: 1243333
To przedsmak tego czego można się spodziewać po Zen 3

AMD cały czas tuninguje to, co jest największą bolączką ich CPU - IF i opóźnienia. Idzie to całkiem nieźle, ale cały czas jest jeszcze miejsce na pewne poprawki. Tak naprawdę wszystko zależy od zastosowań - jak pokazują wyniki, dla 'casuala' nie ma to kolosalnego znaczenia, ale jeśli korzystamy z oprogramowania wrażliwego na w/w czynniki, różnica jest wręcz kolosalna.
AssassinZobacz profil
Poziom ostrzeżenia: 0%
Assassin2020.05.13, 11:34
Caroozo @ 2020.05.13 10:50  Post: 1243554
AMD cały czas tuninguje to, co jest największą bolączką ich CPU - IF i opóźnienia. Idzie to całkiem nieźle, ale cały czas jest jeszcze miejsce na pewne poprawki. Tak naprawdę wszystko zależy od zastosowań - jak pokazują wyniki, dla 'casuala' nie ma to kolosalnego znaczenia, ale jeśli korzystamy z oprogramowania wrażliwego na w/w czynniki, różnica jest wręcz kolosalna.

No właśnie niekoniecznie. Jeśli wyrzucając całą koncepcję IF/CCX i robiąc klasyczny monolit (mam na mysli komunikacje między rdzaniami i cache a nie IMC) z 2x niższymi opóźnieniami możemy zyskać średnio nie więcej niż 5%, a w aplikacjach wrażliwych na to - 10%, to ja nie wiem, czy da się jeszcze poprawić IF żeby uzyskać zauważalny wzrost wydajności w realnych aplikacjach.
Rybaczek KoziołkaZobacz profil
Poziom ostrzeżenia: 0%
Rybaczek Koziołka2020.05.14, 09:25
Cyrix Cx5x86 @ 2020.05.09 15:00  Post: 1243162
rzucają się w oczy bardzo duże opóźnienia w komunikacji rdzeni


te opóźnienia są kluczem dla wydajności intela w grach we współpracy z GPU. gradacja wygląda tak:
najniższe opóźnienia - intel
ok. 2x wyższe opóźnienia - ryzeny na bazie zen2
ok. 4x wyższe opóźnienia - ryzeny na bazie pierwotnego zen, i wcześniejszych zen+

jednak w zen2 te opóźnienia są już na tyle małe (i to w podzielonym rdzeniu), że przestaje to mieć znaczenia. a problem intela polega na tym, że w wielordzeniowych monolitach, tych powyżej 6 rdzeni, te opóźnienia zaczynają być spore.

a co do aktywnego interposera...... nie tędy droga. na teraz jest to zbędne, bo dzięki temu interposer jest cienki i tani w produkcji. elementy aktywne to wszystko by zepsuły. one są po prostu zintegrowane w samych rdzeniach, te kilka dodatkowych tranzystorów nie robi im różnicy. aktywny interposer będzie potrzebny dopiero wtedy, gdy konieczna będzie regeneracja sygnału. drugie zastosowanie, to komunikacja z optoelektroniką, bo socket w końcu się tego doczeka.
Edytowane przez autora (2020.05.14, 09:29)
Rybaczek KoziołkaZobacz profil
Poziom ostrzeżenia: 0%
Rybaczek Koziołka2020.05.14, 09:51
graben @ 2020.05.09 19:09  Post: 1243187
Dzięki. Bardzo ciekawa analiza. Daje do myślenia jak komunikacja między rdzeniami wpływa na wydajność. Jak duże są możliwości optymalizacji i ewolucji komunikacji między wieloma rdzeniami obrazuje poniższy materiał
https://www.youtube.com/watch?v=G3kGSbWFig4
Jeśli AMD w kolejnej generacji zastosuje aktywny interposer z komunikacją/logiką w warstwie infinity fabric i lepszymi topologiami komunikacji między rdzeniami (np. butter donut) to będzie się działo i wiele można usprawnić.


świetny materiał w artykule, ten na YT też niezły
Kris194Zobacz profil
Poziom ostrzeżenia: 0%
Kris1942020.05.17, 16:55
Zen 3 z 8c CCX może być łakomym kąskiem :)
lolek.oloZobacz profil
Poziom ostrzeżenia: 0%
lolek.olo2020.05.24, 22:12
Bardzo ciekawa analiza. Oby jak najwięcej takich.
Wspólna pamięć L3 najczęściej pomaga w grach.
Ten wykres zegar w zegar pokazuje jakiego wzrostu wydajności można się spodziewać po ZEN3 z CCX 8C/16T w porównaniu do ZEN2 z 2x CCX 4C/8, bez uwzględniania innych usprawnień w architekturze. Jestem na 90% pewny, że w grach wzrost wydajności będzie wyższy od tego wynikającego ze średniego wzrostu IPC, szacowanego na ~15%.
Intel ma się czego bać, bo jego ostatni bastion może upaść.
Edytowane przez autora (2020.05.25, 15:45)
Zaloguj się, by móc komentować