artykuły

HotChips 2019: przegląd sprzętowych akceleratorów SI

8
4 września 2019, 15:21 Mateusz Brzostek

Habana Goya

Habana to stosunkowo młoda firma projektująca akceleratory SI i oprogramowanie do nich. Ich pierwszym produktem jest układ o nazwie Goya (na cześć hiszpańskiego malarza), akcelerator wnioskowania. Goya jest już w sprzedaży; głównym odbiorcą są niewymienione duże firmy z branży usług sieciowych, które już od pewnego czasu wykorzystują ten akcelerator w praktyce.

Architektura chipu Goya jest znana tylko w przybliżeniu. Zasoby obliczeniowe to osiem jednostek TPC (Tensor Processing Core), które są maszynami wektorowymi o architekturze VLIW. Razem z rozłożonymi równomiernie obok nich (nie tak jak na diagramie poniżej) jednostkami GEMM zajmują się mnożeniem, dodawaniem i przekształcaniem macierzy i wektorów. Dokładny podział operacji i zestaw instrukcji obu rodzajów jednostek obliczeniowych nie zostały opisane. 

Goya operuje na 8, 16 i 32-bitowych liczbach stałoprzecinkowych i zmiennoprzecinkowych. Precyzja operandów na różnych etapach obliczeń jest dostosowywana przez system oprogramowania; tam, gdzie to nie przynosi negatywnych skutków, można ją zmniejszyć do 8 bitów. Dzięki dostosowanej architekturze i zaawansowanej optymalizacji modeli Goya ma być kilkunastokrotnie szybszy we wnioskowaniu na podstawie sieci ResNet i podobnych niż GPU Tesla T4. System oprogramowania Goya może wnioskować na podstawie sieci dostarczonych w otwartym formacie ONNX – można zatem wykorzystać modele nauczone na dowolnym innym sprzęcie i systemie oprogramowania (prawdopodobnie ta elastyczność była wymaganiem postawionym przez potencjalnych klientów).

Chip Goya jest wykonany w TSMC w procesie technologicznym klasy 16 nm. Korzysta z zewnętrznej pamięci DDR4 z ECC (do 16 GB) i jego budżet energetyczny może być konfigurowany od 100 W do 200W. Akcelerator jest dostępny w formie karty rozszerzeń PCI-E 4.0 ×16.

8