Tak jak komuś się będzie chciało pisać kod programu dla czterech rdzeni.To programisata musi rozdzielić zadania pomiędzy nie i jeszcze zadabać żeby były one rozdysponowane w sposób efektywny.Z tego powodu właśnie widać spadek wydajności przy 4 rdzeniach w aplikacjach pisanych specjalnie dla dwóch.Te dwie dodatkowe jednostki wykonawcze pracują tu tylko jako zbędny bufor spowalniający , zabierając instrukcje przeznaczone dla 1 i 2 rdzenia a zatem i wyniki których one potrzebują akurat w tej samej chwili.Ogólnie dopóki nie zostanie opracowany układ analizujący kod programy i rozdzielający go w sposób inteligientny pomiędzy rdzenie nie ma co sie spodziewać jakiegoś szybkiej i entuzjastycznej zmiany nastawienia programistów.Szczególnie jeśli chodzi o gry gdzie dodatkowe 0.5 roku może wykończyć projekt.
Będzie za to powrót do wyścigu GHz. już opracowano nowy materiał który zastąpi wielgaśne atomy krzemu.
Odpowiedni kompiler zalatwi sprawe wielowatkowosci... programista specjalnie nie musi sobie zawracac tym glowy... problem jest raczej nieco inny... skompilowany program bedzie musial byc dostarczany w wielu wersjach... dla AMD, dla Intela, oraz dla 1, 2 i 4 rdzeni... co daje jakies 8 mozliwosci... mysle, ze dlatego nie doczekalismy sie jeszcze prawdziwie wielowatkowych aplikacji dla mas.
Odpowiedni kompiler zalatwi sprawe wielowatkowosci... programista specjalnie nie musi sobie zawracac tym glowy... problem jest raczej nieco inny... skompilowany program bedzie musial byc dostarczany w wielu wersjach... dla AMD, dla Intela, oraz dla 1, 2 i 4 rdzeni... co daje jakies 8 mozliwosci... mysle, ze dlatego nie doczekalismy sie jeszcze prawdziwie wielowatkowych aplikacji dla mas.
Moim zdaniem problem sprawiają same języki programowania, takie jak C i C++, które były opracowywane z myślą o systemach jednoprocesorowych. Wpółbieżność realizuje się w nich przez odwołania do funkcji systemowych, nie jest ona częścią samego języka. Przykładami produkcyjnych, a nie akademickich języków programowania które wspierają współbieżność są ADA 95 oraz ADA 2005, używane przez amerykański przemysł lotniczy (np. Boening) i przez Departament Obrony USA. Wadą języka ADA jest niepopularna składnia podobna do składni Pascala, i mała ilość ofert pracy w Polsce. Proponuję zajrzeć do książki Cormena "Wprowadzenie do Algorytmów" żeby zobaczyć jak powinny działać współbieżne języki programowania.
Czy ten test jest miarodajny? Jak wygląda sprawa cache po takim "wyłączaniu" jąder?
Kentsfield ma 2x4MB cache (po 4MB na parę rdzeni) i właśnie to jest jedyny powód wyłączania rdzeni. Ale wg mnie starczy ustawić koligacje w Menedżerze urządzeń a nie "wycinać"...
zrozumiałem z tego testu tylko tyle, że wiele aplikacji wielowątkowych jest napisanych na skróty i nie działają prawidłowo. chwilowa zadyszka z przechodzeniem na wielordzeniowość a także i między innymi na 64 bity z pewnością utrudni optymalizację oprogramowania, ale to będą według mnie problemy przejściowe, a nie stała bariera.
jezeli sie nie mysle w artykule pominieto bardzo istotny aspekt pamieci l2 ktora po wylaczeniu dwuch rdzeni powoduje powstanie nam dwurdzeniowego monstra z pamiecia l2 po 4mb na rdzen.. w specyficznych przypadkach tak duza pamiec podreczna ma prawo spowodowac przyspiesznie konfiguracji dwurdzeniowej na tyle by wyprzedzic 4rdzeniowa. stawiedzono to nawet w jednym z testow pclaba dotyczacym 4rdzeniowki intela... nalezalo by porownywac raczej wylaczajac dwa rdzenie posiadajace fizycznie te sama pamic l2, jeednak przy 3 rdzeniach test bedzie juz nie mozliwy..
Amras, tu chyba by trzeba wpierw upewnić się, które rdzenie są wyłączane, boz tego co widać z biosu, można to rzrobić na kilka kombinacji...
to na koncu mojej wypowiedzi masz przeciez sugestje ze tak moze byc ale to i tak wypaczone zostaja wyniki trzech rdzeni.. tak czy inaczej test jest nie do konca obiektywny no i powinno byc napisane ktore rdzenie zostawaly wylaczone albo jaki mialo wplyw na wydajnosc wylaczanie poszeczegolnych.
dodane. mozliwe sa kobinacje 4 rdzenie 4mb l2 na poszczególne dwa (kazdy rdzenie dysponuje wspóldzielonymi z drogim 4mb l2) 3 rdzenie 4mb l2 na jeden i 4mb l2 na dwa pozostałe (jeden rdzen sysponuje 4mb l2 pozostałe dwa dziela sie również 4mb) 2 rdzenie 4mb l2 na dwa rdzenie (dwa rdzenie dziala sie 4mb l2) 2 rdzenie 4mb l2 na rdzen. (dwa rdzenie kazdy dysponuje 4mb l2)
LOL To że na jądrach niema żadnego spektakularnego przyspieszenia to nic nowego szyna danych jest zbyt cieniutka. Nieda sie tak mnożnika obniżyć ? i podnieść FSB i porównać ? Chociaż jeden teścik.
LOL To że na jądrach niema żadnego spektakularnego przyspieszenia to nic nowego szyna danych jest zbyt cieniutka. Nieda sie tak mnożnika obniżyć ? i podnieść FSB i porównać ? Chociaż jeden teścik.
A to ciekawe, jakoś pakerowi nie przeszkadza szyna...
Np RS ostatnio twerdził że Windows 2003 nie wspiera NUMA, tylko Vista.
NUMA w Windows2003
powyżej materiał źródłowy Microsoft.
To troche jak w Wyborczej.
tirinti ROX
edit: a moze na odwrot ?
P.S. Ja tam 2 rdzeniowca "dorobię" się pewnie dopiero za ~2lata więc się nie przejmuję... Ale artykuł bardzo fajnu
Będzie za to powrót do wyścigu GHz. już opracowano nowy materiał który zastąpi wielgaśne atomy krzemu.
Odpowiedni kompiler zalatwi sprawe wielowatkowosci... programista specjalnie nie musi sobie zawracac tym glowy... problem jest raczej nieco inny... skompilowany program bedzie musial byc dostarczany w wielu wersjach... dla AMD, dla Intela, oraz dla 1, 2 i 4 rdzeni... co daje jakies 8 mozliwosci... mysle, ze dlatego nie doczekalismy sie jeszcze prawdziwie wielowatkowych aplikacji dla mas.
Moim zdaniem problem sprawiają same języki programowania, takie jak C i C++, które były opracowywane z myślą o systemach jednoprocesorowych. Wpółbieżność realizuje się w nich przez odwołania do funkcji systemowych, nie jest ona częścią samego języka.
Przykładami produkcyjnych, a nie akademickich języków programowania które wspierają współbieżność są ADA 95 oraz ADA 2005, używane przez amerykański przemysł lotniczy (np. Boening) i przez Departament Obrony USA.
Wadą języka ADA jest niepopularna składnia podobna do składni Pascala, i mała ilość ofert pracy w Polsce.
Proponuję zajrzeć do książki Cormena "Wprowadzenie do Algorytmów" żeby zobaczyć jak powinny działać współbieżne języki programowania.
OpenMP troche pomaga w algorytmach przetwarzania danych.
Myśle że dlatego WinRar tak łądnie się skluje i będzie skalował jeszcze.
Kentsfield ma 2x4MB cache (po 4MB na parę rdzeni) i właśnie to jest jedyny powód wyłączania rdzeni. Ale wg mnie starczy ustawić koligacje w Menedżerze urządzeń a nie "wycinać"...
jezeli sie nie mysle w artykule pominieto bardzo istotny aspekt pamieci l2 ktora po wylaczeniu dwuch rdzeni powoduje powstanie nam dwurdzeniowego monstra z pamiecia l2 po 4mb na rdzen.. w specyficznych przypadkach tak duza pamiec podreczna ma prawo spowodowac przyspiesznie konfiguracji dwurdzeniowej na tyle by wyprzedzic 4rdzeniowa. stawiedzono to nawet w jednym z testow pclaba dotyczacym 4rdzeniowki intela... nalezalo by porownywac raczej wylaczajac dwa rdzenie posiadajace fizycznie te sama pamic l2, jeednak przy 3 rdzeniach test bedzie juz nie mozliwy..
to na koncu mojej wypowiedzi masz przeciez sugestje ze tak moze byc ale to i tak wypaczone zostaja wyniki trzech rdzeni.. tak czy inaczej test jest nie do konca obiektywny no i powinno byc napisane ktore rdzenie zostawaly wylaczone albo jaki mialo wplyw na wydajnosc wylaczanie poszeczegolnych.
dodane.
mozliwe sa kobinacje
4 rdzenie 4mb l2 na poszczególne dwa (kazdy rdzenie dysponuje wspóldzielonymi z drogim 4mb l2)
3 rdzenie 4mb l2 na jeden i 4mb l2 na dwa pozostałe (jeden rdzen sysponuje 4mb l2 pozostałe dwa dziela sie również 4mb)
2 rdzenie 4mb l2 na dwa rdzenie (dwa rdzenie dziala sie 4mb l2)
2 rdzenie 4mb l2 na rdzen. (dwa rdzenie kazdy dysponuje 4mb l2)
To że na jądrach niema żadnego spektakularnego przyspieszenia to nic nowego szyna danych jest zbyt cieniutka. Nieda sie tak mnożnika obniżyć ? i podnieść FSB i porównać ?
Chociaż jeden teścik.
To że na jądrach niema żadnego spektakularnego przyspieszenia to nic nowego szyna danych jest zbyt cieniutka. Nieda sie tak mnożnika obniżyć ? i podnieść FSB i porównać ?
Chociaż jeden teścik.
A to ciekawe, jakoś pakerowi nie przeszkadza szyna...