Nowe procesory zawsze projektuje się z uwzględnieniem szeregu ograniczeń. Oprócz kwestii technologicznych i finansowych najważniejsze są limity zasilania i wydzielanego ciepła. Nowy układ nie może wymagać dużo więcej mocy, żeby nie trzeba było zmieniać stosowanych dotąd układów zasilania. Nie może też wydzielać zbyt dużo ciepła, żeby nie było problemu z dostosowaniem dotychczasowych systemów chłodzenia do nowego sprzętu. Oczywiście regulatory napięcia na płytach głównych nie muszą być identyczne, bo nowa podstawka i tak wymaga zmiany płyty. Za to nie mogą się zmienić ani zasilacze, bo te większość klientów Intela już ma, ani podstawowe elementy elektroniczne regulatora napięcia na płycie głównej, bo ogromne ich zapasy mają producenci płyt głównych.
Żeby zwiększyć wydajność procesorów, nie zwiększając poboru prądu i wydzielania ciepła, należało zastosować nowe technologie ograniczające marnotrawstwo energii. Spójrzmy zatem, w jaki sposób procesory tracą najwięcej energii. Nie liczymy tu energii koniecznej do przełączenia tranzystora, bo przełączanie jest produktywne i nie da się z niego zrezygnować. Zwrócimy uwagę jedynie na te zjawiska w procesorze, które można zredukować albo całkiem zatrzymać bez szkody dla wydajności. Po pierwsze, lwia część marnowanej energii jest zużywana na rozprowadzenie sygnału zegara taktującego do wszystkich części rdzenia. Mniejszą część stanowi „wyciek” z tranzystora, czyli prąd płynący przez bramkę nawet wtedy, kiedy tranzystor jest wyłączony. Jeszcze mniejszą część energii pochłania dostarczenie sygnału zegarowego do poszczególnych rdzeni. Wymienione procesy zachodzą niezależnie dla każdego z rdzeni, można je zatem zredukować lub zlikwidować dla każdego rdzenia osobno. Dlatego w Nehalemie po pierwsze zastosowano bardziej szczegółowy podział sygnału zegarowego wewnątrz rdzenia. Poszczególne części rdzenia mogą być wyłączane, kiedy nie pracują; można na przykład wyłączyć układ dekodera instrukcji, gdy wykonywanych jest wiele powtórzeń tej samej, już zdekodowanej pętli. Po drugie, wycieku prądu z tranzystorów można uniknąć, odcinając zasilanie. Za pomocą zintegrowanych w układzie krzemowym bramek można całkowicie odłączyć zasilanie każdego rdzenia, kiedy ten nie pracuje. W poprzednich procesorach Intela zasilanie było wspólne dla wszystkich rdzeni, więc nawet gdy tylko jeden z nich pracował, nie można było wyłączyć zasilania i pozostałe rdzenie marnowały prąd.
Pozostałe części procesora, czyli kontroler pamięci, kontroler łącza QPI, jednostka arbitrażu i pamięć podręczna L3, muszą pracować nawet wtedy, gdy tylko jeden rdzeń wykonuje instrukcje. Mają one własne, niezależne od rdzeni zasilanie. Kiedy wszystkie rdzenie są w niskim stanie energetycznym (wyłączone), także reszta procesora obniża swoją aktywność. Dopływ sygnału zegarowego do większości elementów Uncore jest zablokowany. Łącze QPI przechodzi w najniższy stan energetyczny, w którym większość kwadrantów łącza (albo wszystkie) jest wyłączona, a napięcie zasilające jest zmniejszone. Kontroler pamięci podtrzymuje jedynie taką aktywność, jaka jest potrzebna do odświeżania zawartości pamięci. Prawie cały procesor jest całkowicie wyłączony.
Procesami przełączania stanów energetycznych steruje nowy element procesora: PCU (ang. Power Control Unit, jednostka kontroli mocy). Jest to zintegrowany z resztą układu mikrokontroler, połączony z wieloma czujnikami temperatury, napięcia i natężenia w całej strukturze krzemowej.
Dodatkowo PCU może monitorować linie przerwań, co pozwala jej sprzętowo określić stopień wykorzystania mocy obliczeniowej procesora. O przejściu poszczególnych procesorów (rdzeni, jak je widzi system operacyjny) w różne stany energetyczne decyduje system operacyjny, jednak robi to na podstawie stopnia wykorzystania czasu procesora. Niektóre zadania wymagają małej liczby instrukcji, wykonywanych regularnie i bez zwłoki. Wtedy system operacyjny może uznać, że procesor jest mało zajęty, i wprowadzić go w jeden z niższych stanów energetycznych. Kiedy nadchodzi przerwanie, marnuje się czas na przejście do pełnej wydajności, i w ten sposób obniża się wydajność. W takich sytuacjach PCU wykrywa częste, regularne przerwania i może przełączyć procesor w stan energetyczny, który sam wybierze, wbrew rozkazowi SO.
Inną funkcją wspomagającą oszczędzanie energii jest nowa implementacja technologii EIST (ang. Enhanced Intel SpeedStep Technology). EIST znamy już z procesorów Pentium III Mobile. Polega na dynamicznym zmienianiu częstotliwości działania w zależności od zapotrzebowania na wydajność. Do tej pory EIST obniżał mnożnik, kiedy nie była potrzebna maksymalna wydajność. W Nehalemie rozwinięto tę technologię, dodając dodatkowy tryb działania. Rozwiązanie nazwane Intel Turbo Technology zwiększa domyślny mnożnik procesora o 1 (dla wszystkich rdzeni) lub o 2 (dla jednego rdzenia), kiedy potrzebna jest dodatkowa wydajność i pozwalają na to warunki.
Warunki są proste: po pierwsze, temperatura procesora musi być niższa od zadanej granicy; po drugie, moc pobierana w danym momencie przez procesor musi być poniżej TDP (ang. Thermal Design Power, maksymalna dozwolona ilość wydzielanego ciepła); po trzecie, napięcie zasilania musi być stabilne i w przewidzianym zakresie. Pierwszy warunek jest spełniony prawie zawsze, dopóki system chłodzenia działa prawidłowo. Drugi warunek również jest na ogół spełniony, jednak w wypadku podkręconego procesora moc może przekroczyć TDP. Większość płyt głównych powinna mieć jednak możliwość wyłączenia w BIOS-ie limitu mocy. Trzeci warunek na dobrze wykonanej płycie głównej powinien być zawsze spełniony. Stan wysokiej wydajności ze zwiększonym mnożnikiem jest traktowany jako dodatkowy stan energetyczny procesora. System operacyjny powinien zarządzać przejście w tryb Turbo, kiedy spodziewa się zwiększonego obciążenia procesora. Jak już wspomniano, PCU może zignorować albo zmienić rozkaz systemu operacyjnego, dlatego Turbo działa również całkowicie sprzętowo, bez żadnej obsługi ze strony systemu operacyjnego ani oprogramowania. W praktyce system operacyjny zawsze w jakimś stopniu obciąża wszystkie jednostki wykonawcze, a PCU zgadza się na zwiększenie mnożnika o 2 tylko dla jednego rdzenia. To powoduje, że w rzeczywistych warunkach mnożnik prawie nigdy nie przełącza się na o 2 wyższy. Wyjątkiem jest sytuacja, gdy w BIOS-ie wyłączymy wszystkie rdzenie procesora oprócz jednego.
Aby można było regulować zasilanie poszczególnych części procesora, regulację napięcia podzielono na dwie strefy. Napięcie VCORE (napięcie, którym są zasilane rdzenie procesora) dotyczy tylko poszczególnych rdzeni. Pamięć podręczna L3, kontroler QPI i kontroler pamięci są zasilane innym napięciem - VTT. Na poniższym schemacie zaznaczono zasięg poszczególnych napięć:
