artykuły

Intel V8 - recenzja (prawie) na żywo

160
1 maja 2007, 17:03 Ryszard Sobkowski

Ponury sekret FB-DIMM

Opisaliśmy juz wcześniej architekturę pamięci FB-DIMM, wraz z wynikającymi z niej potencjalnymi zaletami. Popatrzmy, jak ten potencjał jest wykorzystywany w rzeczywistości.

Transmisja z szybkością 4,34 GB/s (odczyt) i opóźnienie liczące 223 cykle zegara procesora to, jak na nową klasę superpamięci, dość mizerny rezultat! Porównajmy go zresztą z osiągami klasycznych, niebuforowanych pamięci DIMM DDR-2.

Pamięci PC2-2700, czyli DDR333, zapewniają szybkość odczytu 5,2 GB/s, z opóźnieniem zaledwie 140 cykli zegara, zaś...

... w przypadku DDR2-1066, uzyskiwana jest szybkość odczytu 5,27 GB/s, przy opóźnieniu zaledwie 130 cykli zegara. Dlaczego jest tak źle, skoro miało być tak dobrze? Wspominaliśmy już o podobieństwie idei konstrukcyjnej FB-DIMM do architektury pamięci Rambus. Pamięci Rambus nie przyjęly się, ponieważ zostały wprowadzone na rynek dużo wcześniej, nim osiągnęły dojrzałość konstrukcyjną. Czyżbyśmy i w przypadku FB-DIMM mieli do czynienia z podobną sytuacją?

Strona:
JMKSZobacz profil
Poziom ostrzeżenia: 0%
JMKS2007.06.02, 00:38
Przypomnę się raz jeszcze, bo coś się obawiam że jednak już jakaś z opcji typu oddanie zestawu / wykreślenie tego testu (WPrime jak zwykle oczywiście) z planów zadziałała...
JMKSZobacz profil
Poziom ostrzeżenia: 0%
JMKS2007.05.15, 19:19
CYTAT(rs @ 10 maja 2007, 20:28) <{POST_SNAPBACK}>
Santa Rosa, P35 i G33, 600

Zostało tylko to środkowe smilies/wink.gif. NDA chyba do 21.05 jest {a w sklepach już "nawet" w Polsce od dość dawna P35 dostępne smilies/krzywy.gif}, czyli 6 dni zostało - może te 15 minut by się udało wyrwać na WPrime smilies/smile.gif. Tzn. nie chodzi mi o to żeby natychmiast, ale po prostu kiedyś jednak się z maszyną będzie trzeba pożegnać - "nie znasz dnia ani godziny" smilies/szczerbaty.gif.

Tak jeszcze odnośnie testów: PCMark05 jest ograniczony do 4 wątków? Chyba niestety tak smilies/kwasny.gif, bo też by było ciekawie...
Boro666Zobacz profil
Poziom ostrzeżenia: 0%
Boro6662007.05.11, 02:47
A bylaby szansa na jakies testy w BIONIC? Jak wiadomo ten agent uzywa tylko maksymalnie 4 jader, ale moze da sie z powodzeniem odpalic go dwukrotnie tak by wykorzystal wszystkie 8 rdzeni, tak by obciazyc je w 100%? smilies/bigsmile.gif

Na SanDiego 4000+ pakiet powiedzmy Human Proteome Folding Phase 2 (World Community Grid) liczy sie srednio 90 minut. Ciekawe jaka faktycznie jest roznica w wydajnosci takiego serwerowego potwora w porownaniu ze starym dobrym desktopem, z porzadnym 1 core smilies/bigsmile.gif
JMKSZobacz profil
Poziom ostrzeżenia: 0%
JMKS2007.05.11, 02:27
CYTAT(rs @ 10 maja 2007, 20:28) <{POST_SNAPBACK}>
Zapewniam, że nie przebiło to 3dsmax... gdyby przebiło, podane byłyby wyniki. Orthos owszem, obciąża procesor dość mocno, ale akurat niekoniecznie w sposób powidujący maksymalny pobór energii.

To może inaczej - Intel Thermal Analysis Tool na tym zadziała? smilies/bigsmile.gif Bo to by bezapelacyjnie najbardziej obciążyło smilies/smile.gif. Chociaż jakoś nawet na Kensfieldzie zdaje się nie widziałem TAT'a uruchomionego nigdy, ale prawdę mówiąc nie wiem. TAT może dziwolągów nie lubić, na jednym rdzeniu (Conroe-L) działać nie chciał smilies/wink.gif.Chociaż że "real-world application" bardziej od Orthosa obciąża to trochę dziwne, ale wierzę smilies/wink.gif.
CYTAT(rs @ 10 maja 2007, 20:28) <{POST_SNAPBACK}>
Mamy zakonotowane, jak starczy sił i czasu (bo cholerna doba ma bez sensu tylko 24 godziny, a kiedyś trzeba żyć i spać) to zrobimy i to.

To zajmie maksymalnie 15 minut tak prawdę mówiąc, łącznie ze ściągnięciem aplikacji i umieszczeniem wyników. Ewentualnie mogę podjechać i sam to zrobić smilies/wink.gif.

P35 oczywiście (również) z DDR3 (i to "odpowiednim") mam nadzieję? smilies/wink.gif By się jakiś obiektywny test przydał, bo w necie to tego trochę jest, ale póki się poważni ludzie za WRki nie wezmą smilies/cool.gif to totalnie nie wiadomo jak te wyniki porównywać... smilies/kwasny.gif
*Konto usunięte*2007.05.10, 20:28
CYTAT(JMKS @ 10 maja 2007, 00:44) <{POST_SNAPBACK}>
A cóź to za śmieszny wykres z mocą (elektryczną)? Orthos jako aplikacja dwuwątkowa wymaga uruchomienia czterech instancji programu. Zapewniam, że przebije to wszystkie inne testy pod względem pobieraniej energii...
Zapewniam, że nie przebiło to 3dsmax... gdyby przebiło, podane byłyby wyniki. Orthos owszem, obciąża procesor dość mocno, ale akurat niekoniecznie w sposób powidujący maksymalny pobór energii.

CYTAT
I jeszcze się odnośnie testu oczekiwanego przypomnę: http://forum.pclab.pl/index.php?s=&sho...t&p=3635409, bo pewnie zaraz maszynę będzie trzeba oddać i (jak zwykle...) nic z tego nie wyjdzie.
Mamy zakonotowane, jak starczy sił i czasu (bo cholerna doba ma bez sensu tylko 24 godziny, a kiedyś trzeba żyć i spać) to zrobimy i to. Teraz jestem obciążony do bólu nawałą premier - Santa Rosa, P35 i G33, a niedługo jeszcze R600, więc po prostu nie dam rady. A co do oddawania maszyny - oddamy, jak już nie będzie potrzebna! Chyba, żeby nam ją nagle wyrwali, ale zdaje mi się, że nie będzie takiego przypadku...
KvM2007.05.10, 13:38
CYTAT(rs @ 9 maja 2007, 22:52) <{POST_SNAPBACK}>
Nooo... to chyba zgadzałoby się mniej-więcej z Prawem Moore'a - podwojenie co niespełna dwa lata? Czyli - "wszystko zgodnie z planem". smilies/bigsmile.gif
A co do wielokrotnie tu i gdzie indziej dyskutowanej "wyższości Świąt Wielkiej Nocy nad Świętami Bożego Narodzenia i odwrotnie", to zamiast polemizować na temat wyższości, przyjrzyjcie się podobieństwom obu mikroarchitektur...

No chyba by się jednak nie zgadzało. Po pierwsze w prawie Moore'a jest mowa o 18 miesiącach, a nie o 2 latach. No i przez 7 lat mamy prawo oczekiwać ok 25 razy większej wydajności - no owszem dostaliśmy coś takiego, ale w postaci platformy wieloprocesorowej i z której strony nie patrzeć nie jest to uczciwe porównanie, bo platforma wieloprocesorowa była dostępna i za czasów PIII. Tymczasem jak się przyjrzymy temu co oferuje jeden rdzeń, a więc miara dla wszystkich aplikacji to jest to wzrost na poziomie 4-5 razy, a więc 5 razy mniej niż wynikałoby z prawa Moore'a!

Po raz kolejny przypomnę że przez wcześniejsze 7 lat mieliśmy do czynienia z 15 krotnym wzrostem taktowania 66-1000MHz i dodatkowym wzrostem wydajności wynikającym z usprawnień architektury. Jest wiele przykładów na to że wydajność wtedy rosła zgodnie z prawem Moore'a, a czasem nawet szybciej.

Odnośnie C2D. Owszem to jest odgrzane PIII z drobnymi usprawnieniami. Nędzna imitacja dobrego produktu który potencjalnie byłby w stanie wyprodukować intel. Owszem byłby to w miarę nowoczesny procesor - 3-4 lata temu (nawet w wersji jednordzeniowej) Nawet wtedy jednak brakowałoby mu do bycia nowoczesnym kontrolera pamięci i likwidacji FSB. I nie piszcie, że C2D tego nie potrzebuje. Owszem nie potrzebuje by wygrać z K8, ale potrzebuje by móc w pełni rozwinąć skrzydła szczególnie w konfiguracjach wieloprocesorowych.
JMKSZobacz profil
Poziom ostrzeżenia: 0%
JMKS2007.05.10, 00:44
A cóź to za śmieszny wykres z mocą (elektryczną)? Orthos jako aplikacja dwuwątkowa wymaga uruchomienia czterech instancji programu. Zapewniam, że przebije to wszystkie inne testy pod względem pobieraniej energii...

I jeszcze się odnośnie testu oczekiwanego przypomnę: http://forum.pclab.pl/index.php?s=&sho...t&p=3635409, bo pewnie zaraz maszynę będzie trzeba oddać i (jak zwykle...) nic z tego nie wyjdzie.
GraveZobacz profil
Poziom ostrzeżenia: 0%
Grave2007.05.09, 23:15
CYTAT(DaRkstaR2111 @ 9 maja 2007, 21:22) <{POST_SNAPBACK}>
Poza tym w specyfikacji to też rewelacji żadnych nie ma.


To oświeć mnie zatem jakie to rewelacje są w Core (jak mniemam tutaj rewelacja goni rewelację)? smilies/Up_to_something.gif

Pamiętaj że K10 dostał od AMD wszystkie naistotniejsze dla wydajności rozwiązania zastosowane przez Intela w Core, a nieobecne w K8.

To na początek w ramach nadrobienia zaległości. Ale to nie wszystko. Dołóz do tego daleko idące usprawnienia wykonywania instrukcji SSE [128bit] (tu w kilku punktach zdecydowana przewaga AMD), podwójny (usprawniony względem K8) zintegrowany kontroler pamięci, pamięć podręczna współdzielona przez wszystkie 4 rdzenie, udoskonalony system predykcji rozgałęzień, nową wersję szyny Hyper Transport (3.0), monolityczny 4 rdzeniowy CPU etc

Tyle w naprawdę dużym skrocie.

Po więcej zapraszam tutaj:

http://www.anandtech.com/cpuchipsets/showd...?i=2939&p=5
DaRkstaR2111Zobacz profil
Poziom ostrzeżenia: 0%
DaRkstaR21112007.05.09, 23:03
CYTAT(rs @ 9 maja 2007, 22:52) <{POST_SNAPBACK}>
przyjrzyjcie się podobieństwom obu mikroarchitektur...


Tosz pisze, że nie ma rewelacji.
*Konto usunięte*2007.05.09, 22:52
CYTAT
po 7 latach mamy do dyspozycji procesory raptem 8,5 raza szybsze
Nooo... to chyba zgadzałoby się mniej-więcej z Prawem Moore'a - podwojenie co niespełna dwa lata? Czyli - "wszystko zgodnie z planem". smilies/bigsmile.gif
A co do wielokrotnie tu i gdzie indziej dyskutowanej "wyższości Świąt Wielkiej Nocy nad Świętami Bożego Narodzenia i odwrotnie", to zamiast polemizować na temat wyższości, przyjrzyjcie się podobieństwom obu mikroarchitektur...
Funkcja komentowania została wyłączona. Do dyskusji zapraszamy na forum.
11