Haswell obsługuje też instrukcje FMA, czyli mnożenie dwóch liczb i dodawanie wyniku do trzeciej, wszystko w jednej instrukcji. Dzięki FMA dwie operacje trwające w sumie osiem cykli można zastąpić jedną. Dodatkowo zyskujemy precyzję, bo zamiast dwóch zaokrągleń (wyniku mnożenia i wyniku dodawania) następuje tylko jedno: końcowego wyniku.
Warto zauważyć, że FMA to operacje żywcem przeniesione ze świata procesorów graficznych do instrukcji x86, a AVX2, jako sposób na wektorowe przetwarzanie danych, jest koncepcyjnie podobny do sposobu, w jaki pracują GPU. Paradoksalnie AVX2 może być dla Intela krokiem w kierunku unifikacji CPU i GPU – oczywiście w odległej przyszłości. Wykorzystanie zalet instrukcji AVX2 i FMA wymaga, rzecz jasna, co najmniej skompilowania od nowa, a najlepiej dokładnej optymalizacji oprogramowania. Sporo czasu upłynie, zanim zauważymy korzyści w popularnych programach.
Fused multiply–add w CPU:
HP PA-8000 (1996) and above
Hitachi SuperH SH-4 (1998)
SCE-Toshiba Emotion Engine (1999)
Intel Itanium (2001)
STI Cell (2006)
Fujitsu SPARC64 VI (2007) and above
(MIPS-compatible) Loongson-2F (2008).[7]
AMD Evergreen GPUs (2009) and above
NVidia Fermi GPUs (2010) and above
Intel MIC (2012)
Podobnie instrukcje multimedialne/wektorowe były w prockach konsumenckich lata dekadę temu (np EE PS2). To pokazuje w którą stronę idzie rynek oraz uświadamia że w cenie procesorów Intela nie ma nowatorskich rozwiązań a płaci się za monopol. Ich procki powinny mieć zakres cen 50-400pln max.
w takim razie jednak poczekam na haswella, przenosiny z obecnoego 2600K (4,7) na Ivy byłyby zarówno zbyt kosztowne jak i miąły za mały efekt skoku wydajności,
swietny art, sporo szczegółów technicznych,
jak zawsze przy kazdej nowej architekturze, minie troche czasu zanim uda się ją wykorzystać w software, ale cieszy wzrost wydajności pojedynczego rdzenia, niezależny od software i tego czy software został skompilowany od nowa.
Hmm, tylko ta energooszczędność może kompletnie położyć OC. Będzie fajny proc do laptopów i małych desktopów (hej producenci GPU - róbcie więcej niskoprofilowych wydajnych kart )
w takim razie jednak poczekam na haswella, przenosiny z obecnoego 2600K (4,7) na Ivy byłyby zarówno zbyt kosztowne jak i miąły za mały efekt skoku wydajności,
swietny art, sporo szczegółów technicznych,
jak zawsze przy kazdej nowej architekturze, minie troche czasu zanim uda się ją wykorzystać w software, ale cieszy wzrost wydajności pojedynczego rdzenia, niezależny od software i tego czy software został skompilowany od nowa.
Warto zauważyć, że FMA to operacje żywcem przeniesione ze świata procesorów graficznych do instrukcji x86, a AVX2, jako sposób na wektorowe przetwarzanie danych, jest koncepcyjnie podobny do sposobu, w jaki pracują GPU. Paradoksalnie AVX2 może być dla Intela krokiem w kierunku unifikacji CPU i GPU – oczywiście w odległej przyszłości. Wykorzystanie zalet instrukcji AVX2 i FMA wymaga, rzecz jasna, co najmniej skompilowania od nowa, a najlepiej dokładnej optymalizacji oprogramowania. Sporo czasu upłynie, zanim zauważymy korzyści w popularnych programach.
Fused multiply–add w CPU:
HP PA-8000 (1996) and above
Hitachi SuperH SH-4 (1998)
SCE-Toshiba Emotion Engine (1999)
Intel Itanium (2001)
STI Cell (2006)
Fujitsu SPARC64 VI (2007) and above
(MIPS-compatible) Loongson-2F (2008).[7]
AMD Evergreen GPUs (2009) and above
NVidia Fermi GPUs (2010) and above
Intel MIC (2012)
Podobnie instrukcje multimedialne/wektorowe były w prockach konsumenckich lata dekadę temu (np EE PS2). To pokazuje w którą stronę idzie rynek oraz uświadamia że w cenie procesorów Intela nie ma nowatorskich rozwiązań a płaci się za monopol. Ich procki powinny mieć zakres cen 50-400pln max.
swietny art, sporo szczegółów technicznych,
jak zawsze przy kazdej nowej architekturze, minie troche czasu zanim uda się ją wykorzystać w software, ale cieszy wzrost wydajności pojedynczego rdzenia, niezależny od software i tego czy software został skompilowany od nowa.
Hmm, tylko ta energooszczędność może kompletnie położyć OC. Będzie fajny proc do laptopów i małych desktopów (hej producenci GPU - róbcie więcej niskoprofilowych wydajnych kart )
swietny art, sporo szczegółów technicznych,
jak zawsze przy kazdej nowej architekturze, minie troche czasu zanim uda się ją wykorzystać w software, ale cieszy wzrost wydajności pojedynczego rdzenia, niezależny od software i tego czy software został skompilowany od nowa.