komentarze
AssassinZobacz profil
Poziom ostrzeżenia: 0%
Assassin2012.12.03, 17:14
focus @ 2012.12.03 16:09  Post: 620241
Tak, ale najpewniej nie będzie 2-modułowca z 8 MB L3, więc takie porównanie byłoby czysto naukowe.

Niby prawda, ale cały artykuł jest bardziej naukowy niż praktyczny (co nie jest zarzutem, wręcz przeciwnie). Ciekawi mnie, ile straciliśmy na decyzji AMD o obcięciu pamięci podręcznej FXa 4300 (FX-41xx miał pełne 8MB).
radeg81Zobacz profil
Poziom ostrzeżenia: 0%
radeg812012.12.03, 17:04
lukeee @ 2012.12.03 15:29  Post: 620214
Czy można procesor nauczyć przewidywania (predykcji) rozgałęzień kodu? Wyobraźmy sobie sytuacje, że uruchamiamy swoją ulubioną grę/program, za pierwszym razem procesor gromadzi w jakiś pliku wskazówki co do rozgałęzień kodu, za drugim uruchomieniem gra chodzi już szybciej. Realne?

Po co uczyć - procesory już to umieją. Przewidywanie skoków ze sprawnością 90% to nic niezwykłego we współczesnych procesorach.
*Konto usunięte*2012.12.03, 16:20
O kurcze...
Świetny art. Faktycznie nie ma sensu niby testować FX4300 vs FX63/83...

To potwierdza moje obserwacje na temat tego, że generalnie większy cache głównie przydaje się do tych najtrudniejszych zadań. Np. w renderingu jest różnica pomiędzy procesorami z większym cachem, ale.... no właśnie nie w prostej siatce nawet high-poly.
Ciekawe, że A10 wydajne tak samo jak FX...

Najważniejszy problem o jakim trąbie od dawna jest to, że właśnie....
....może zamiast większej kaszy dać więcej rdzeni.

W przypadku Vishera widzę, że można by wcisnąć jeszcze dwa moduły zamiast L3. Takie rozwiązanie dałoby AMD odpowiednią wydajność do rywalizacji z intelem na polu serwerowym.
radek_zZobacz profil
Poziom ostrzeżenia: 0%
radek_z2012.12.03, 16:19
Nieee no. Mojej opadającej szczęki nie mam co szukać na podłodze, bede musiał iść do sąsiada piętro niżej :). PC Labowcy ostatnio czytają w myślach czytelników. Czyżbyście zdobyli kryształową kulę renderująca myśli czytelników w DX11 i dzięki temu tak skutecznie je interpretujecie:)???
focusZobacz profil
Poziom ostrzeżenia: 0%
Autor publikacjifocus2012.12.03, 16:18
rainy @ 2012.12.03 16:16  Post: 620243
focus @ 2012.12.03 16:09  Post: 620241

Tak, ale najpewniej nie będzie 2-modułowca z 8 MB L3, więc takie porównanie byłoby czysto naukowe.


Wystarczy w FX-6300 zablokować jeden moduł, oczywiście biorąc poprawkę na różnicę w zegarach - FX-4300 - 3,8 GHz, FX-6300 - 3,5 GHz.

To to ja wiem :) Chodziło mi o to, że takowy test przekaże nam wiedzę czysto teoretyczną, bo w praktyce nie będzie takiego procesora (najpewniej). O to mi chodziło, bo tak to oczywiście można było i przetestować Core i7-2600K z dwoma rdzeniami bez HT na 3 GHz i porównać do Pentiuma G860 :)
AlartZobacz profil
Poziom ostrzeżenia: 0%
Alart2012.12.03, 16:17
-1#26
lukeee @ 2012.12.03 15:29  Post: 620214
Czy można procesor nauczyć przewidywania (predykcji) rozgałęzień kodu? Wyobraźmy sobie sytuacje, że uruchamiamy swoją ulubioną grę/program, za pierwszym razem procesor gromadzi w jakiś pliku wskazówki co do rozgałęzień kodu, za drugim uruchomieniem gra chodzi już szybciej. Realne?

Raczej niezbyt realne, bo instrukcje są zaszyte w strukturze fizycznej procesora. Niektóre instrukcje potrafią być wykonywane nawet w czasie jednego taktu. Stworzenie dodatkowego pakietu instrukcji adaptacyjnych mogłoby być interesujące, ale łatwiej optymalizować programy pod procesory niż procesory pod programy:)
rainyZobacz profil
Poziom ostrzeżenia: 0%
rainy2012.12.03, 16:16
-4#25
focus @ 2012.12.03 16:09  Post: 620241

Tak, ale najpewniej nie będzie 2-modułowca z 8 MB L3, więc takie porównanie byłoby czysto naukowe.


Wystarczy w FX-6300 zablokować jeden moduł, oczywiście biorąc poprawkę na różnicę w zegarach - FX-4300 - 3,8 GHz, FX-6300 - 3,5 GHz.
focusZobacz profil
Poziom ostrzeżenia: 0%
Autor publikacjifocus2012.12.03, 16:09
Assassin @ 2012.12.03 16:04  Post: 620237
Zapowiada się bardzo ciekawy artykuł, zabieram się do czytania. Szkoda tylko, że nie daliście jeszcze Piledrivera z 8 MB L3 i zablokowanymi modułami. Patrząc jednak na zadziwiająco małe różnice między Athlonem 750 a FX-4300, cudów by pewnie nie było...

Tak, ale najpewniej nie będzie 2-modułowca z 8 MB L3, więc takie porównanie byłoby czysto naukowe.
Bono[UG]Zobacz profil
Poziom ostrzeżenia: 0%
Bono[UG]2012.12.03, 16:09
lukeee @ 2012.12.03 15:29  Post: 620214
Czy można procesor nauczyć przewidywania (predykcji) rozgałęzień kodu? Wyobraźmy sobie sytuacje, że uruchamiamy swoją ulubioną grę/program, za pierwszym razem procesor gromadzi w jakiś pliku wskazówki co do rozgałęzień kodu, za drugim uruchomieniem gra chodzi już szybciej. Realne?

I wydajność cache chcesz zabić odczytem z dysku? ;)

Pomysł jak na razie nierealny, bo procesor nie ma informacji jaki program wykonuje. Dostaje ciąg instrukcji i na ich podstawie działa.
Można by pokusić się o programowalny układ predykcji skoków. W trakcie ładowania aplikacji system ładuje odpowiedni program układu.

Jest jeszcze problem taki, pod dany program jest optymalizacja, a co z całą resztą działającą w tle? Czy taka optymalizacja miałaby działać na jeden rdzeń/moduł, czy na cały procesor? Jeżeli na poszczególne jednostki, to co z przełączaniem zadań między jednostkami?

Generalnie lepiej optymalizować kod pod daną architekturę niż procesor pod dany program. Mniej okazji do dziwnych sytuacji i spadku wydajności.
AssassinZobacz profil
Poziom ostrzeżenia: 0%
Assassin2012.12.03, 16:04
-3#22
Zapowiada się bardzo ciekawy artykuł, zabieram się do czytania. Szkoda tylko, że nie daliście jeszcze Piledrivera z 8 MB L3 i zablokowanymi modułami. Patrząc jednak na zadziwiająco małe różnice między Athlonem 750 a FX-4300, cudów by pewnie nie było...
*Konto usunięte*2012.12.03, 15:57
-2#21
jackowo @ 2012.12.03 15:36  Post: 620217

Wniosek taki że nie warto dopłacać do Core i7 jeśli gramy.


Oj marny ten wniosek, marny.

Wskazana większa uwaga przy czytaniu testu :+)
Pyth0nZobacz profil
Poziom ostrzeżenia: 0%
Pyth0n2012.12.03, 15:56
Jest jeszcze jedno - w GCC kompilacja z '-march=native' uwzględnia rozmiary i typy cache'u przy kompilacji do optymalnego rozłożenia kodu i danych w pamięci. Jest to widoczne na przykład w rozwijaniu pętli (loop unroll) - rozwija się je tylko tyle, żeby się zmieściły w icache. Jak przekroczy się granicę, wydajność drastycznie spada. Z drugiej strony za słabo rozwinięta pętla nie wykorzystuje w pełni potoku. A to tylko jeden aspekt.

W benchmarkach lepiej wypadały procesory, dla których typ i rozmiar cache odpowiadały temu użytemu do kompilacji :)
kocham fizykeZobacz profil
Poziom ostrzeżenia: 0%
kocham fizyke2012.12.03, 15:56
lukeee @ 2012.12.03 15:47  Post: 620226
kocham fizyke @ 2012.12.03 15:35  Post: 620216
(...)

Raczej nie. Chyba, że za każdym razem gra robiłaby dokładnie to samo. Problem z przewidywaniem jest w wielu miejscach i nie jest to taka prosta sprawa, jak to może wyglądać. Polecam poczytać chociażby: http://wazniak.mimuw.edu.pl/index.php?titl...w_komputerowych
Oczywiście nie chodziło mi o cała grę ( by trzeba było ją przechodzić jak po sznurku), ale o części ( pewne partie) kodu.

Na pierwszy rzut oka: więcej zachodu niż korzyści. Naprawdę polecam poczytać, jak działa procesor i wtedy będzie wiadomo, że trudno jest przewidywać między innymi z powodu skoków (funkcji, pętli, if-ów itp).
cichy45Zobacz profil
Poziom ostrzeżenia: 0%
cichy452012.12.03, 15:52
-6#18
Widać że i5 oraz i7 to genialne procesory - model z mniejszą pamięcią L3 prawie wcale nie ustępuje temu z 8Mb. Widocznie intel ma bardzo dobre mechanizmy 'pobierania z wyprzedzeniem'. Bardzo duży '+' za artykuł :D
focusZobacz profil
Poziom ostrzeżenia: 0%
Autor publikacjifocus2012.12.03, 15:48
aY227 @ 2012.12.03 15:46  Post: 620224

Niestety mam inne wnioski po przeczytaniu CAŁEGO testu :) O ile w starszych konstrukcjach wzrost wydajności był wyraźnie odczuwalny (10%+) to już w najnowszych procesorach nie ma sensu dopłacać do dodatkowych MB pam. podręcznej - między 6 a 8 różnice wydajności są mniej niż marginalne.

Musisz pamiętać, że w przypadku Sandy Bridge'a tej pamięci jest relatywnie i tak dużo, więc i zysk jest niewielki. Moim zdaniem Twój wniosek jest zbyt daleko idący.

aY227 @ 2012.12.03 15:46  Post: 620224

Dodatkowo wygląda na to iż pchanie więcej niż 8MB może powodować zauważalne spadki wydajności w aplikacjach.

Nie obserwuję tego na podstawie wyników Core i7-3820.
zawmenZobacz profil
Poziom ostrzeżenia: 0%
zawmen2012.12.03, 15:47
-4#16
brakło pomiaru zużycia prądu każdej pary (a tym samym wpływu na ten parametr ilości pamięci)
lukeeeZobacz profil
Poziom ostrzeżenia: 0%
lukeee2012.12.03, 15:47
kocham fizyke @ 2012.12.03 15:35  Post: 620216
lukeee @ 2012.12.03 15:29  Post: 620214
Czy można procesor nauczyć przewidywania (predykcji) rozgałęzień kodu? Wyobraźmy sobie sytuacje, że uruchamiamy swoją ulubioną grę/program, za pierwszym razem procesor gromadzi w jakiś pliku wskazówki co do rozgałęzień kodu, za drugim uruchomieniem gra chodzi już szybciej. Realne?

Raczej nie. Chyba, że za każdym razem gra robiłaby dokładnie to samo. Problem z przewidywaniem jest w wielu miejscach i nie jest to taka prosta sprawa, jak to może wyglądać. Polecam poczytać chociażby: http://wazniak.mimuw.edu.pl/index.php?titl...w_komputerowych
Oczywiście nie chodziło mi o cała grę ( by trzeba było ją przechodzić jak po sznurku), ale o części ( pewne partie) kodu.
Michael86Zobacz profil
Poziom ostrzeżenia: 0%
Michael862012.12.03, 15:46
-6#14
Phenom X4 9550
*Konto usunięte*2012.12.03, 15:46
-7#13
xxser @ 2012.12.03 15:33  Post: 620215
Mam procesor Core 2 Duo E8200 z 6 MB pamięci podręcznej Cache L2. Co mogę powiedzieć, że wcześniej miałem Dual Core E5300 i widać było różnicę w wydajności. Pamięć podręczna jest ważna w dzisiejszych procesorach !

Kto się zgadza, to dawać + i ocenę ! :)


Niestety mam inne wnioski po przeczytaniu CAŁEGO testu :) O ile w starszych konstrukcjach wzrost wydajności był wyraźnie odczuwalny (10%+) to już w najnowszych procesorach nie ma sensu dopłacać do dodatkowych MB pam. podręcznej - między 6 a 8 różnice wydajności są mniej niż marginalne.
Dodatkowo wygląda na to iż pchanie więcej niż 8MB może powodować zauważalne spadki wydajności w aplikacjach.
focusZobacz profil
Poziom ostrzeżenia: 0%
Autor publikacjifocus2012.12.03, 15:43
BuShMaN @ 2012.12.03 15:41  Post: 620220
AMD Phenom X4 9550?

Pioy był blisko, ale Ty trafiłeś :)
Funkcja komentowania została wyłączona. Do dyskusji zapraszamy na forum.