Karty dźwiękowe i zintegrowane układy audio bez tajemnic

Spis treści

Karty dźwiękowe i zintegrowane układy audio bez tajemnic
Karty dźwiękowe i zintegrowane układy audio bez tajemnic część 2
Karty dźwiękowe i zintegrowane układy audio bez tajemnic część 3
Karty dźwiękowe i zintegrowane układy audio bez tajemnic część 4

Na pierwszy rzut oka może się wydawać, że dziś Creative Labs jest monopolistą na rynku kontrolerów dźwiękowych dla komputerów PC. Nic bardziej mylnego! Konkurencja w tym segmencie rynkowym jest nawet większa niż na rynku układów graficznych, a Creative Labs daleko jest od osiągnięcia monopolu. Tymczasem naturalną koleją rzeczy była integracja kart dźwiękowych na płytach głównych, tak jak wcześniej zintegrowano na płytach kontrolery dyskowe czy portów I/O (w komputerach klasy XT/AT/386/486 takie kontrolery miały postać kart rozszerzeń). I chociaż nadal Sound Blaster jest synonimem karty dźwiękowej, to jednak Sound Blasterów (a tymbardziej innych kart muzycznych) sprzedaje się dziś tyle, co kot napłakał. Mimo że dział marketingu Creative Labs robi co może, by przekonać użytkowników do swoich najnowszych dźwiękówek, to nabywcy sięgają po nie coraz mniej chętnie. Nie ma się tu co dziwić, skoro na nowych płytach mamy już zintegrowane naprawdę przyzwoite układy audio. Ale po kolei.

Historia rynku - 1981-1986, era dźwięku pikanego

Czy nazwa IBM PC 5150 coś Wam mówi? W 1981 roku firma IBM wprowadziła komputer oparty na nowym procesorze - Intel 8088 - rozpoczynając tym samym drogę ewolucji komputerów klasy IBM PC, tej z którą do czynienia mamy po dziś dzień. PC 5150 nie był przeznaczony do gier czy oglądania filmów w systemie 5.1. Był relatywnie tanim (w porównaniu do wycenionego na 15 tys. USD poprzednika, IBM 5100) komputerem biurowym, od którego nikt nie wymagał możliwości odtwarzania muzyki. IBM PC 5150 dysponował zatem czymś znacznie prostszym - głośnikiem PC. Dzięki niemu, generując programowo falę prostokątną, komputer mógł wydawać z siebie proste dźwięki, tzw. "piknięcia". PC 5150 dysponował zaledwie jednym kanałem, w którym możliwe było generowanie owych piknięć bez możliwości regulacji głośności. Zdolni programiści, pomimo iż dostali w swoje ręce bardzo prymitywną zabawkę, dążyli do wyciśnięcia z niej znacznie więcej. Udało im się nawet zmusić "PC Speaker" do odtwarzania zapisanych w formie cyfrowej próbek dźwięku.

Ograniczenia związane z mocą obliczeniową komputerów w tamtych czasach stanowiły jednak poważną barierę i odtwarzanie z bardzo niską jakością plików dźwiękowych ograniczało się wyłącznie do króciutkich próbek. Aby móc masowo odtwarzać jakikolwiek "zdigitalizowany" dźwięk, wymagany był procesor Intel 80286, pracujący z zegarem 8 MHz. Sporo czasu musiało jeszcze upłynąć, zanim moc obliczeniową tych procesorów można było uznać za dobrze rozpowszechnioną. Do tego momentu wszelkie próby odtwarzania dźwięku cyfrowego na komputerach, na przykład w grach, nie miały sensu, gdyż mało kto mógł z takiej możliwości korzystać. Skoro jedna ścieżka rozwoju okazała się być zatarasowana, programiści i producenci komputerów postanowili pójść drugą, oznaczoną jako "Route PC Speaker".

Rok 1983 przyniósł ewolucję, która dziś może wydawać się niemal komiczna. Lata osiemdziesiąte ubiegłego wieku to era tzw. "ośmiobitowców osobistych", czyli komputerów firm Commodore i Atari. Ich ogromna popularność była główną przyczyną długo utrzymującego się, poważnego niezrównoważenia rozwoju komputerów PC. Zasypujące rynek gry i programy multimedialne oraz użytkowe dla Commodore 64 czy Atari 65XE skutecznie spychały "pecety" do narożnika, w którym miejsce było tylko dla biurowych maszyn do pisania i kalkulatorów. To właśnie tu przyciśnięty PC próbował raz po raz udowodnić, że on także może być komputerem multimedialnym, a więc czymś więcej niż edytorem tekstu czy generatorem wykresów. W 1982 roku świat obiegła plotka o przygotowaniach komputera multimedialnego, którego IBM zaczął obawiać się zbyt późno. Mowa oczywiście o komputerach Commodore Amiga. Jednostki generujące dźwięk w Amigach, a nawet w starszych C64 były lata świetlne przed tym, co prezentował PC 5150. Zaprezentowany dwa lata po nim IBM PC Junior miał być odpowiedzią na ogromne postępy czynione przez śmiertelnego wroga - Commodore. Jako że w niniejszym artykule zajmujemy się dźwiękiem, nie będziemy wgłębiać się w różnice architektury komputerów.

PC Junior szumnie zapowiadany jako nowy, niedrogi komputer "udomowiony", pod względem dźwięku jednak zawiódł na całej linii. Jedyne co firmie IBM udało się osiągnąć, to przejście na układy generujące firmy Texas Instruments, pozwalające wytwarzać proste dźwięki na trzech kanałach i udostępniające czwarty kanał generowania szumów, z szesnastostopniową regulacją głośności. Moc całej jednostki nadal była zbyt mała, by PC Junior mógł swobodnie odtwarzać pliki muzyczne, a zatem utrzymał się w kręgu komputerów "pikających". Warto dodać, że IBM niedługo po premierze PC Junior wycofał je z rynku, gdyż mało kto był zainteresowany ich kupnem.

Rozwiązania prezentowane przez następne lata (1985-1986) były równie niepopularne, choć ich twórcy chyba nie zdawali sobie sprawy z tego, że czasami nawet ze sporej porażki może wyniknąć coś, co odmieni świat "pecetów". Wśród nich trzeba wymienić dwa urządzenia zewnętrzne, czyli Covox Speech Thing oraz Disney Sound Source. Oba rozwiązania korzystały z portu drukarki (LPT) i nie spotkały się z entuzjastycznym przyjęciem wśród programistów. Oba urządzenia, pomimo iż składały się przede wszystkim z zestawu rezystorów, których odpowiedni układ stanowił prosty przetwornik cyfrowo-analogowy (DAC - Digital-Analog Converter), były bardzo drogie. Ich ceny ustalono na około 70 dolarów, podczas gdy samodzielne zmontowanie ich odpowiedników to koszt zaledwie paru dolarów.

Zaletą Covox Speech Thing i Disney Sound Source było to, że były zdolne przetwarzać do postaci analogowej dźwięk zapisany z rozdzielczością 8 bitów (mono). Rozwiązanie tego typu nie było jednak wytworem świata komputerów PC. Zostało skopiowane z komputerów firmy Commodore. To właśnie te dwa zewnętrzne pudełka sprawiły, że w rzeczywistości PC pojawił się format muzyczny MOD (od "module"), znany z komputerów Commodore Amiga. Niektóre odtwarzacze plików MOD dla systemu MS-DOS umożliwiały wybór urządzenia odtwarzającego - PC Speaker lub Covox podpięty do portu LPT. W porównaniu do tego pierwszego, zewnętrzny DAC zapewniał nieporównywalnie lepszą jakość dźwięku. Do wyjścia analogowego wystarczyło podłączyć dobrej klasy wzmacniacz, aby poczuć dźwięczne werble nadchodzącej rewolucji. PC Speaker wytrzymał to uderzenie i choć lekko skompromitowany, przetrwał. Jego dni były jednak policzone, gdyż na jego życie niebawem miał się porwać pewien rzekomo niezrównoważony psychicznie profesor.

Historia rynku - 1987-1990, pierwsze potyczki

W grudniu 1987 roku Rich Heimlich, CEO Top Star Computer Services - amerykańskiej firmy zajmującej się m.in. konsultingiem i optymalizacją procesów produkcyjnych dla producentów gier - udał się do Quebec w Kanadzie, by zapoznać się z tajemniczym urządzeniem dźwiękowym, opracowanym przez uznawanego za "niekoniecznie normalnego" profesora muzyki - Martina Prevel. W branży komputerowej stan zmysłów owego profesora podważali kolejno ludzie, którym od początku 1987 roku, na przeróżnego rodzaju targach komputerowych, elektroniki czy telekomunikacji wciskał swój produkt, licząc na zainteresowanie. Wedle plotek, Prevel w amoku obdarowywał próbkami swojego prototypowego wyrobu wyłącznie specjalistów od marketingu, dziennikarzy, a nawet sprzątaczki, dostawców żywności i innych przypadkowych ludzi. Nie trafił na nikogo, kto mógłby potraktować go poważnie. To sprawiło, że jego wynalazek najczęściej lądował w pobliskim koszu na śmieci lub gdzieś w domowym komputerze, którego właściciel nawet nie zdawał sobie sprawy z tego, że posiada produkt wart furę pieniędzy i mający niebawem stworzyć fundament dla budowy rynku kart dźwiękowych znanego nam dziś.

Rich Heimlich (Top Star Computer Services) był pierwszym człowiekiem, który potraktował Prevela poważnie. To co zobaczył i usłyszał po przybyciu na spotkanie zrobiło na nim tak ogromne wrażenie, że jeszcze będąc w drodze powrotnej, wydzwaniając w środku nocy, na nogi postawił większość największych partnerów swojej firmy. Następnego dnia pierwszy w kolejce ustawił się jeden z liderów w dziedzinie produkcji gier - Sierra OnLine. W ciągu kilkunastu następnych dni wsparcie dla urządzenia Prevela kolejno gwarantowali następni producenci, wśród których znaleźli się m.in. Codemasters oraz Activision. Niebawem znalazł się producent fizycznych kart dźwiękowych - kanadyjska firma Lyrtech. Ruszyła masowa produkcja nowych urządzeń dźwiękowych oraz wspierających je gier.

Mowa oczywiście o kartach dźwiękowych AdLib. Były to pierwsze masowo produkowane dźwiękowe karty rozszerzeń, całkowicie eliminujące potrzebę wykorzystywania PC Speakera do generowania dźwięku. Opracowana przez Martina Prevela konstrukcja wykorzystywała procesor generowania dźwięku Yamaha YM3812, układy sterujące firmy Motorola oraz przetwornik cyfrowo-analogowy i przedwzmacniacz operacyjny Philips. Zastosowany w układzie firmy Yamaha syntezator FM pozwalał generować jednocześnie dziewięć głosów lub sześć melodyjnych plus pięć głosów uderzeń, imitując wiele prawdziwych instrumentów, na swój "elektroniczny" sposób oczywiście. Jakość wynikowa zmiksowanego materiału była tak dobra, że AdLib błyskawicznie stał się pierwszym standardem programowania dźwięku dla komputerów PC. Producentom gier i nabywcom nie przeszkadzał nawet fakt, iż karty te nie były przystosowane do odtwarzania cyfrowych próbek dźwięku. Jakość generowanego przez nie dźwięku okazała się być tak zaskakująco dobra, że mało kto oczekiwał więcej.

W cieniu rosnącej potęgi AdLib po cichutku kręcił się świeżo upieczony przybysz do USA, Sim Wong Hoo, sprzedawca własnych komputerów multimedialnych z Singapuru. W 1987 roku stworzona przez niego firma Creative Technology weszła na rynek ze swoimi pierwszymi kartami dźwiękowymi - Creative Music System (CMS). Konstrukcja opracowana jeszcze w Singapurze korzystała z dwunastokanałowego generatora fal Philips SAA1099. Sim Wong Hoo starał się zdobyć popularność i uznanie. Pierwszym efektem jego starań był kontrakt na dostarczanie owych kart dla producenta komputerów PC, firmie IBM, czyli nie byle komu. Radość nie trwała jednak długo. Wejście na rynek kart AdLib, w połączeniu z faktem, iż karty CMS stanowiły jedynie zwielokrotnienie PC Speakera (dokładnie x12) sprawiły, że projekt CMS okazał się być całkowicie niezdolny do nawiązania jakiejkolwiek walki ze standardem AdLib. Nie pomogła nawet zmiana nazwy na coś, co bardziej nam się zapewne kojarzy - Game Blaster.

Sprytny Singapurczyk swoją szansę upatrzył w konstrukcji świetnie sprzedających się kart AdLib, a szczególnie w oznaczeniach ich układów scalonych. Na kartach tych wykorzystywano scalaki produkowane przez firmy trzecie, a zatem Sim Wong Hoo doszedł do wniosku, że da się je skopiować.

Jak pomyślał, tak zrobił. Jeszcze w 1988 roku firma Creative Technology (singapurska) rozpoczęła prace nad stworzeniem udoskonalonych kopii kart AdLib. Jednocześnie uznano, że najlepszym rozwiązaniem będzie połączenie zdolności generowania dźwięku układów Yamaha YM3812 z możliwością odtwarzania cyfrowego dźwięku. Z połączenia tych dwóch zamierzeń zrodził się produkt, który niebawem miał zdominować świat - pierwszy Sound Blaster (później określany jako 1.0). Nowe karty Creative Labs (amerykański oddział firmy) według producenta były wyposażone w układy DSP (Digital Signal Processor), dzięki którym możliwe miało być odtwarzanie cyfrowej muzyki. W rzeczywistości Sound Blaster 1.0 nie miał DSP, a kupiony od Intela kontroler MCS51. To umożliwiało kartom odtwarzanie cyfrowego dźwięku (mono), z rozdzielczością 8 bitów przy próbkowaniu nie większym niż 23 kHz. Jeśli chodzi o nagrywanie (np. z mikrofonu), ograniczenie częstotliwości próbkowania było znacznie większe i wynosiło 13 kHz.

Pierwsze karty Sound Blaster trafiły na rynek w listopadzie 1989 roku i dzięki doskonałej strategii Sim Wong Hoo polegającej na przeznaczeniu niemal wszystkich zasobów czasowych na potrzeby wsparcia programowego dla producentów gier i oprogramowania, stały się podstawą nowego standardu, który niebawem miał posadzić standard AdLib na katafalku. Na rynku jedna po drugiej pojawiały się nowe rewizje kart, wymuszające zmiany także w kwestii programowania gier. Rok później Creative Technology atakuje ponownie. Tym razem z dźwiękiem stereo, możliwością nagrywania dźwięku przy próbkowaniu na poziomie 22 kHz, a także dwoma (zamiast jednego) układami Yamaha YM3812, co zapewniało stereofoniczną syntezę FM. Sound Blaster Pro, bo o nim mowa, zaprezentowano w 1991 roku. Wraz z nim pojawił się standard programowania aplikacji i gier DOS, Sound Blaster Pro. Był on ostatnim dzwonkiem alarmowym dla zagrożonej utratą pozycji lidera firmy AdLib Inc.

Historia rynku - 1991-1994, wojna = wszystkie chwyty dozwolone

Rok 1991 był kolejnym przełomowym. W tym właśnie roku nastąpił potężny wybuch ładunku o wdzięcznej nazwie "Konkurencja". Podgryzany od podstawy lider, AdLib, wyraźnie tracił kontrolę i niemal w akcie desperacji szybko opracował następcę swoich pierwszych kart dźwiękowych - AdLib Gold. Nowe karty przerastały Sound Blastery Pro niemal w każdym względzie. Zamiast rozdzielczości odtwarzania i nagrywanie na poziomie 8 bitów, wprowadzono 12 bitów, choć sam kontroler mógł bez problemów odtwarzać dźwięk o rozdzielczości 16 bitów. Częstotliwość próbkowania ograniczoną do 22 kHz podniesiono do 44,1 kHz, oczywiście dwukanałowo (stereo). Zastosowano specjalnie opracowany kontroler z wbudowanym prostym DSP - AdLib Gold Control, wymieniono także syntezator na nowoczesny, dwudziestogłosowy (stereo) Yamaha YMZ263. Jakby tego było mało, AdLib Gold miały specjalne złącze rozszerzeń, do którego podłączyć można było dodatkowy moduł Surround. Zastosowano na nim procesor dźwięku Yamaha YM7128, dzięki któremu możliwe było wygenerowanie sztucznego dźwięku przestrzennego. Układ ten wyposażony został w wewnętrzną pamięć RAM (pojemność nieznana), dzięki której procesor mógł nawet dzięki zapętlonym odbiciom stosować programowalne pogłosy!

Na rynek trafiły zatem bardzo zaawansowane, nowoczesne i zapewniające doskonałą (jak na tamte czasy) jakość dźwięku. "Pewnie gdzieś tkwi haczyk?" - spytacie. Owszem, powiemy więcej - hak, nie haczyk. Nowe karty AdLib Gold były całkowicie niezgodne z rozpowszechnionym już standardem Sound Blaster, co uniemożliwiało odtwarzanie cyfrowych próbek dźwięku w grach. Teoretycznie oczywiście, gdyż w praktyce karty mogły je odtwarzać. Opanowany przez Creative Technology rynek po prostu rozleniwił się i nikomu nie chciało się pisać oddzielnego kodu programów i gier dla AdLib Gold. Pamiętajmy o tym, że w tamtych czasach nie było jeszcze kart dźwiękowych Plug&Play, nie było platformy DirectX, interfejsów DirectSound czy OpenAL. Każda gra, by móc wykorzystać możliwości pojedynczego kontrolera dźwięku, musiała być specjalnie do niego przystosowana.

Firma AdLib nie doceniła siły przebicia Creative Technology. Pół roku później (1992) sytuacja finansowa firmy stała się katastrofalna. 1 maja ogłoszono bankructwo. Co ciekawe, kanadyjski rząd wykupił upadającą AdLib nie kryjąc powodów - niedopuszczenie do przejęcia jej przez Creative Technology. Dwa miesiące później firma została sprzedana niemieckiej grupie firm (konglomeratowi) Binnenalster, a nazwa zmieniona na Adlib Multimedia. Pod nową marką kontynuowano produkcję małej ilości kart AdLib Gold jeszcze przez kilkanaście miesięcy. W marcu 1994 roku słuch po firmie zaginął. Produkcję kart wstrzymano, wszelkie wiążące umowy zerwano, a patenty ktoś kupił i do dziś nikt nie zdołał ustalić, co stało się z legendarnym AdLib. Gdzie trafiły wszystkie patenty i ewentualne projekty AdLib, nie wiadomo. Komuś z pewnością zależało na przeprowadzeniu transakcji bez rozgłosu i bez śladu.

W 1991 roku na scenę wkroczył nowy gracz, z zamiarem przepędzenia wszędobylskiego standardu Sound Blaster tam, gdzie pieprz rośnie. Tuż po premierze pierwszych Sound Blasterów, w małej, kanadyjskiej (tak, kolejny gracz z Kanady) firmie Forte Technologies rozpoczęto opracowywanie nowego standardu. W tym samym czasie inny, następny kanadyjski zawodnik, producent joysticków, poszukiwał nowych obszarów rynku, na których mógłby się dorobić - Advanced Gravis Computer Technology. Tak naprawdę to do dziś nie wiadomo, jak doszło do połączenia sił obu tych firm. Niemniej jednak przez ponad rok wspólnie pracowały nad nowymi kartami dźwiękowymi. Owocem tych prac był Ultrasound, czyli produkt wprost rewolucyjny.

Zaprezentowane latem 1992 roku karty Gravis Ultrasound (GUS) oparto o układy Gravis GF1, wyposażone we własną jednostkę DSP oraz własny syntezator MIDI. Mało tego, Ultrasound oparto o nowatorski system syntezy Wavetable, czyli generowania muzyki z gotowych, cyfrowych próbek dźwiękowych. Na kartach montowano nawet lokalną pamięć RAM. Podstawowa wersja kart sprzedawana była z 256 kB RAM na pokładzie. Nabywca mógł ją rozszerzyć do nawet 1 MB.

W pamięci tej przechowywane były wspomniane wcześniej próbki dźwiękowe, dzięki czemu Ultrasound mógł świetnie współpracować nawet ze słabszymi komputerami. Synteza Wavetable odbywała się poprzez generowanie 32 głosów jednocześnie (stereo) i miksowanie ich przy rozdzielczości 16 bitów i próbkowaniu 44,1 kHz (choć z ograniczoną wówczas liczbą głosów do 14; przy 32 głosach jednocześnie częstotliwość próbkowania spadała do 19,2 kHz). Nie zabrakło oczywiście możliwości odtwarzania cyfrowej muzyki. Wszystko to realizowane było wewnętrznie na karcie (sprzętowo), co w tamtych czasach mogło wydawać się zbyt piękne, by mogło być prawdziwe. Jednakże było jak najbardziej prawdziwe. Nawet jakość dźwięku na analogowym wyjściu karty była na poziomie wcześniej niespotykanym w kartach przeznaczonych dla przeciętnego Kowalskiego. Pełna jakość i wierność odwzorowania na poziomie standardu CD-Audio? Niemożliwe stało się możliwe!

Spoliczkowana i bezradna konkurencja błyskawicznie zaczęła nagłaśniać fakt, iż Gravis Ultrasound nie jest zdolna rejestrować dźwięku z rozdzielczością 16 bitów, tylko ośmiu. Mimo iż producent nigdy nie deklarował, że jest inaczej, to dla konkurencji był to jedyny element, którego można było się uczepić. Ale i na to firma Gravis odpowiedziała błyskawicznie. Na rynek wprowadziła tanią, małą kartę rozszerzającą możliwości oryginalnego Ultrasound, eliminując wspomniany "defekt". Ba, aby dopiec zazdrosnej konkurencji posunięto się nawet dalej, rozszerzając dodatkowo częstotliwość próbkowania nagrywanego dźwięku do 48 kHz, czyli ponad standard CD-Audio.

Większym problemem była jednak zgodność GUS-a z powszechnym już wtedy standardem Sound Blaster. Karty Ultrasound nie miały sprzętowego syntezatora FM i musiały emulować Sound Blastera poprzez ładowanie próbek dźwiękowych udających taki syntezator. Efekt niestety był daleki od ideału, w dodatku emulacja nie działała w każdej grze.

W tym samym czasie do premiery kolejnych kart przygotowała się firma Creative Technology. Dogonić GUS-y było kwestią honoru. Tak oto narodził się legendarny Sound Blaster 16. Do dziś to właśnie ten model z rodziny Sound Blasterów wiele osób bezpodstawnie uważa za pierwsze, w pełni 16-bitowe karty dźwiękowe i dodatkowo za krok milowy w rozwoju tego typu urządzeń. Rzeczywistość była jednak zgoła odmienna. W Sound Blasterach 16 przede wszystkim poczyniono zmiany kosmetyczne, dostosowując je do odtwarzania dźwięku 16 bit / 44,1 kHz w stereo; dodano nowy syntezator FM Yamaha OPL3 oraz złącza dla kart rozszerzających. Wraz z premierą nowych kart firma Creative Technology zapowiedziała uporządkowanie istniejącego bałaganu w standardach Sound Blaster i Sound Blaster Pro (każdy występował w kilku rewizjach, często niezgodnych ze sobą nawzajem). Jak się okazało w praktyce, Sound Blaster 16 był co prawda zgodny z najstarszym standardem SB, ale za to nie potrafił generować dźwięku stereofonicznego w trybie zgodności ze standardem SB Pro!

Na dokładkę, Sound Blaster 16 nie był do końca kartą 16-bitową. Co prawda karta odtwarzała 16-bitowe próbki dźwieku, ale tylko jej przetworniki DAC (cyfrowo-analogowe) były 16-bitowe. Podczas nagrywania jakość dźwięku była porównywalna z próbkami 12-bitowymi, chociaż producent nigdy nie przyznał się do stosowania 12-bitowych przetworników analogowo-cyfrowych (ADC). Na szczęście dla Creative, jej karty bardzo rzadko stosowane były przez dźwiękówców. Ich głównymi odbiorcami byli (i nadal są) gracze, więc jakość nagrywania nie ma tu najważniejszego znaczenia.

W odpowiedzi na karty Gravis Ultrasound, Creative wprowadziła do sprzedaży karty rozszerzające Waveblaster, dzięki którym możliwa była synteza Wavetable. Jakość generowanej muzyki była jednak niezadowalająca, w dodatku użytkownicy Waveblasterów narzekali na różne problemy z użytkowaniem, więc szybko wprowadzono nowy model - Waveblaster II. Tym razem zrobiono krok naprzód, a pozwoliło na to przejęcie firmy E-mu Systems, której układy EMU8000 wykorzystano na nowych modułach. Wzbogacały one karty Sound Blaster 16 o 32-głosową syntezę Wavetable na bardzo dobrym poziomie. W odróżnieniu jednak od GUS-ów, gdzie zastosowano pamięć RAM (co umożliwiało dowolną wymianę palety próbek audio), na kartach Waveblaster II zainstalowano pamięć ROM zawierającą zestaw instrumentów, których nie dało się w żaden sposób wymienić.

Na początku 1993 roku Gravis rozszerza swoją ofertę o karty Ultrasound MAX. W podstawowej wersji karty wyposażano w 512 kB pamięci RAM (rozszerzalna do 1 MB), kontroler CD-ROM, nowy kodek (przetwornik) Crystal CS4231 przetwarzający dźwięk z rozdzielczością 16 bitów, przy próbkowaniu 48 kHz. Niespodzianką okazała się także zawartość płyty CD dołączanej do zestawu. Znaleźć można było na niej program demonstracyjny, przedstawiający tzw. "holograficzny dźwięk 3D", generowany za pośrednictwem zestawu filtrów HRTF (Head-Related Transfer Function). Niestety rynek nie był jeszcze gotów na masowe wykorzystanie ich możliwości. Gravis Ultrasound opanowuje w szaleńczym tempie rozrastającą się "demoscenę", czyli społeczność domorosłych programistów, muzyków i grafików. Pojawiają się tańsze wersje kart (pozbawione pamięci RAM), przeznaczone dla przeciętnego użytkownika. Na listę ścisłych partnerów Gravisa dopisują się nie byle jacy wydawcy i/lub producenci gier - id Software (Quake, Doom) oraz Epic Megagames (Unreal).

W 1994 roku Creative Technology wydaje karty Sound Blaster AWE32 (Advanced Wave Effects 32). Były one przeznaczone bardziej dla muzyków, choć w głównej mierze były połączeniem Sound Blaster 16 i Waveblaster II na jednej płytce. Jedyne co tak naprawdę odróżniało karty to obecność lokalnej pamięci ROM i RAM (512 kB lub 1 MB), służącej tym samym celom, co w kartach Gravis Ultrasound. Najdroższe wersje AWE32 wyposażono dodatkowo w sloty SIMM, dzięki którym pamięć RAM można było rozszerzyć aż do 28 MB. Niewiele zmieniono w analogowym torze dźwięku, co skutkowało podobnym poziomem zaszumienia do tego, który dawał się we znaki w Sound Blaster 16. AWE32, jak się okazało to nadal za mało by z pantałyku zbić popularne GUS-y, a niszę rynkową ze strony Creative Technology cały czas wypełniają karty Sound Blaster 16.

Historia rynku - 1995-1996, AMD i NVIDIA z odsieczą

Na dobre rozpoczyna się era urządzeń Plug&Play, a zaprezentowany w sierpniu 1995 roku Windows 95 wymaga od producentów kart dźwiękowych przystosowania swoich sterowników lub, co lepsze, urządzeń. Już na początku roku producent kart Gravis Ultrasound podejmuje odważny krok, w postaci sprzedaży licencji na produkcję nowych układów Gravis GFA1 firmie AMD. Produkowane w fabrykach największego rywala firmy Intel procesory dźwięku otrzymały nazwę kodową "AMaDeus" oaz handlową - AMD InterWave. Od tej chwili AMD staje się producentem układów Gravisa, które sprzedawane są firmom trzecim. Nie trzeba było długo czekać, by "przed drzwiami" świeżo upieczonego duetu ustawiła się kolejka nabywców. Wśród nich znajdziemy legendy, w postaci na przykład STB Systems (producent m.in. popularnych kart graficznych 3dfx Voodoo oraz Soundrage, z InterWave na pokładzie), Philips (karty z InterWave, bardzo popularne w Azji), Synergy, Dynasonic, ExpertColor, Primax oraz Compaq.

AMD InterWave był unowocześnieniem rewolucyjnego Gravis GF1. Zmieniono kontroler pamięci - zmniejszono opóźnienia wywoływania danych oraz zwiększono zakres adresowania do 16 MB, dodano sprzętową jednostkę syntezatora FM, a syntezator Wavetable przeprojektowano niemal całkowicie, znosząc wszelkie ograniczenia częstotliwości próbkowania, znane z GF1. Teraz InterWave mógł operować całą gamą 32 głosów MIDI, z częstotliwością próbkowania na poziomie 48 kHz. Do sprzedaży trafiły karty wyposażone w pamięć RAM o pojemności 512 kB. Oryginalne karty Advanced Gravis Ultrasound PnP posiadały dwa dodatkowe sloty SIMM, w których można było osadzić po jednym, ośmiomegabajtowym module RAM. Karty produkowane przez innych producentów pozbawione były tej możliwości i choć skierowane były przede wszystkim do graczy, to właśnie one okazywały się być problematyczne, gdyż dla zachowania zgodności DOS, ze standardem GUS Classic (pierwsze karty Gravis) potrzebna była obecność RAM. Dotyczyło to oczywiście tylko kart całkowicie pozbawionych pamięci.

Także w 1995 roku na rynek wchodzi nowy akcelerator grafiki 3D - NVIDIA NV1 oraz jego brat bliźniak, w postaci produkowanego na licencji, przez ST Micro, akceleratora STG2000. W ich wnętrzu znalazło się miejsce dla kontrolera dźwięku oraz syntezatora MIDI. Jednostka ta spełniała wszelkie wymogi typowego użytkownika komputera multimedialnego - pełne 16 bitów, próbkowanie na poziomie 48 kHz, synteza zgodna ze standardem General MIDI. NV1 był procesorem bardzo nowatorskim (połączenie procesora grafiki i dźwięku), choć skazanym na porażkę. Pomijając już kwestie związane z akceleracją grafiki 3D, jedną z przyczyn była bardzo niska jakość dźwięku syntezatora MIDI i niemal całkowity brak zgodności z jakimkolwiek standardem DOS. NVIDIA chciała popchnąć rynek mocno do przodu, jak najszybciej porzucając balast starej ery DOS, skupiając się wyłącznie na platformie Windows 95. Konkurencja w postaci Creative Technology skutecznie wstrzymywała producentów gier, gdyż nie była w pełni gotowa na przyjęcie rękawicy rzuconej przez NVIDIA. Przez niemal dwa lata Creative Technology nie zaprezentowała żadnego nowego produktu, wypełniając rynek jedynie kolejnymi odmianami kart Sound Blaster 16 i AWE32.

Dopiero w listopadzie 1996 roku Creative przebudziła się z letargu, odświeżając swoją ofertę nowymi kartami Sound Blaster AWE64. Nowe karty były zauważalnie krótsze i pozbawione slotów SIMM. Oczywiście standardową pojemność pamięci poszczególnych modeli można było rozszerzać. Sloty SIMM zastąpiono złączami dla specjalnych i niestety drogich modułów pamięci, produkowanych wyłącznie przez Creative Technology. Zmieniono także syntezator MIDI. Zamiast znanego z kart AWE32 układu EMU8000 stosowano syntezatory EMU8011. Oprócz pewnych zmian poprawiających jakość generowanego dźwięku wprowadzono możliwość łączenia syntezy sprzętowej z programową. I tak oto nowe Sound Blastery oferowały polifonię 64-głosową (32 głosy sprzętowe i 32 programowe). Najważniejszy postęp jednak poczyniono w analogowej części toru dźwięku. Sound Blaster AWE64 oferował naprawdę bardzo wysokiej jakości dźwięk.

W tym samym czasie Advanced Gravis Computer Technology wpadła w nie lada tarapaty. Druga połowa 1996 roku dla firmy to ciąg błędów i zaniechań. Niemal całkowity brak marketingu i zanik działań w dziedzinie wspierania producentów gier sprawiały, że coraz trudniej było walczyć z Creative Technology, która w tamtym czasie, w obu dziedzinach była bezkonkurencyjna. Nastąpiło silne tąpnięcie w statystykach sprzedaży - w trzecim kwartale 1996 roku wartość sprzedanych kart (wszystkich modeli) spadła aż o 30%. W ostatnich miesiącach roku firma wycofała się z rynku kart dźwiękowych powracając do swych korzeni - produkcji joystików i gamepadów. W następnym roku została przejęta przez firmę Kensington, producenta myszek, klawiatur i różnego rodzaju akcesoriów komputerowych (np. toreb na notebooki). Na placu boju pozostał tylko jeden poważny gracz - Creative Technology, który powoli przygotowywał się do wejścia w nową erę. Erę gier z grafiką 3D, ale także dźwiękiem przestrzennym. Nieoczekiwanie jednak ktoś lidera ubiegł...

Historia rynku - 1997... Nowa era

W chwili obecnej wybór układów dźwiękowych, które można wykorzystać do stworzenia komputerowego kina domowego, zarówno do filmów, jak i gier, jest niezbyt duży. Nie oznacza to jednak, że układy Creative Labs są jedynymi, które można znaleźć w komputerach. Na rynku pozostało jeszcze paru graczy, trzymających się go jak przysłowiowe "rzepy psiego ogona". W ostatnich latach Creative konsekwentnie pochłaniała kolejnych konkurentów. Pierwszą ofiarą była firma Aureal Semiconductor. Ta pod koniec ubiegłego wieku na rynek wprowadziła dwa rewolucyjne układy dźwiękowe Vortex (1997 i 1998). Oba cieszyły się bardzo dobrymi opiniami posiadaczy opartych nań kart dźwiękowych. Ich największą zaletą była technologia Aureal Semiconductor, opracowana wcześniej dla NASA i przeniesiona na grunt komputerów osobistych. Technologię tą stanowił wspaniale sprawdzający się w praktyce (czytaj: w grach) system pozycjonowania dźwięku - Aureal 3D (A3D). Karty dźwiękowe na układach Vortex produkowała nie tylko sama firma Aureal Semiconductor, ale także takie legendy jak Diamond Multimedia, Videologic (obecnie PURE), czy Genius. Nie licząc tzw. "chińszczyzny", karty z układami Vortex i Vortex 2 zapewniały wysokiej jakości dźwięk, zarówno cyfrowy jak i generowany przez syntezator MIDI. Nie brakowało im także wstecznej zgodności z DOS-owymi standardami SB i SB Pro. Wraz z Vortex 2 dźwięk 3D przeniesiono już na cztery kanały.

W pierwszej połowie 1997 roku na rynek trafiły także jedne z ostatnich kart dźwiękowych dla magistrali ISA. Firma TerraTec, znana z produkcji raczej konstrukcji do zastosowań profesjonalnych, spróbowała swych sił na rynku masowym, z pewnym naciskiem na graczy. Wprowadziła konstrukcje TerraTec AudioSystem EWS64, wyposażone w mocne procesory dźwięku (DSP) DREAM SAM9407. Dla profesjonalistów przeznaczono modele L oraz XL, a dla graczy okrojony między innymi z interfejsów model "S". Dla potrzeb wbudowanego, sprzętowego syntezatora Wavetable karty dysponowały własną, lokalną pamięcią RAM (mogły jej mieć od 2 MB do nawet 64 MB; rozszerzana była modułami SIMM). Przeznaczona dla graczy "eSka" posiadała dwa podwójne przetworniki cyfrowo-analogowe, dzięki czemu podłączyć do niej można było zestaw czterech głośników. By zaspokoić potrzeby graczy, dopiero zapoznających się w tamtym czasie z dźwiękiem 3D, TerraTec oferował dodatkowy system wirtualizacji VSPace, dzięki któremu karty EWS64 symulowały dźwięk przestrzenny. Karty zachowywały zgodność z DOS-owymi standardami SB i SB Pro.

Układ SAM9407 trafił zresztą nie tylko na karty TerraTec. Chyba nawet jeszcze bardziej spopularyzowała go firma Guillemot (właściciel marek Hercules i Thrustmaster), która stosowała go do budowy kart dźwiękowych Maxi Sound 64, swego czasu bardzo popularnych wśród wymagających użytkowników komputerów. SAM9407 znalazł się także na kartach Sound Track 128 koreańskiego producenta Hoontech.

Gdy Creative Labs w 1998 roku wprowadziła na rynek karty Sound Blaster Live!, rozpoczęła się chyba największa w historii rynku PC Audio bitwa na pozwy sądowe. Firma Aureal Semiconductor twierdziła, że karty Live! wykorzystują ich technologie, a Creative Labs dopuszcza się łamania patentów. Creative odpowiedziała własnym pozwem, także o łamanie praw patentowych przez Aureal Semiconductor. Dodatkowo Creative broniła swoich patentów przed uznaniem ich przez sądy za nieważne, czego bezskutecznie domagała się Aureal Semiconductor. W tamtym czasie mieliśmy do czynienia z wielomiesięczną batalią, podczas której co rusz każda ze stron ogłaszała swoje zwycięstwo. Bitwy o patenty ostatecznie wygrała firma Aureal Semiconductor. Jednakże zakończenia owej wojny niestety nie dokonał sądowy wyrok. W 1999 roku firma Aureal wpadła w finansowe tarapaty i pod koniec roku ogłosiła bankructwo. Krótko potem rywal przejął jej resztki za 32 miliony dolarów. Wydarzenie to spowodowało potężne trzęsienie ziemi, bo niemożliwym było, aby tak mocny gracz, jakim bez wątpienia był Aureal, tak po prostu znikł, nie powodując strat dookoła siebie. Wielu producentów kart dźwiękowych, jak np. Diamond Multimedia, Guillemot, Genius, Turtle Beach, Terratec, Videologic, Hercules i inni po przejęciu Aureala przez Creative Labs pozostali bez dostawcy wysokiej jakości, wydajnych układów audio.

Przebudowa rynku i zwieranie szyków nastąpiły wręcz błyskawicznie. Na pomoc Hercules/Guillemot, Videologic i Turtle Beach przybyła firma Cirrus Logic, z układami Crystal CS4630 i CS4624. Cała trójka mocno stanęła naprzeciw pierwszym kartom Sound Blaster Audigy, ale dzięki bardzo mocnej pozycji Creative Labs, to te ostatnie zdominowały rynek. Diamond Multimedia próbowała swoich sił z ESS i jej układami Canyon3D, ale ta, jak wiele innych decyzji tej firmy w tamtym czasie, okazała się totalnym nieporozumieniem. Niewiele później Diamond Multimedia zbankrutowała. Terratec na rynek masowy przeznaczał nowe karty dźwiękowe, oparte na układach firmy C-Media Electronics, z całkiem niezłymi rezultatami. Genius na moment skupił się na układach Forte Media serii FM801 i karty na nich oparte kierował na rynek produktów niskobudżetowych.

Niemal trzy lata temu Creative Labs przejęła kolejnego konkurenta - firmę Sensaura. Ta na swoim koncie miała podobny do Aureal A3D system pozycjonowania dźwięku - Sensaura 3DPA. Korzystało z niego wiele firm, wśród których znajdziemy m.in. C-Media Electronics, NVIDIA, Yamaha, Cirrus Logic czy ESS Technology. Przejęcie firmy Sensaura zamknęło drogę rozwoju architektury NVIDIA Sound Storm, która w ubiegłym roku, z formy zintegrowanej w chipsetach miała trafić na karty PCI. Jeszcze pięć lat temu mieliśmy do wyboru trzy systemy dźwięku przestrzennego: Aureal A3D, QSound Q3D oraz Sensaura 3DPA. Dziś po przejęciu przez Creative Labs firm Aureal Semiconductor i Sensaura na placu boju pozostał już tylko system Q3D (QMSS) firmy QSound Labs i system Creative CMSS-3D, w kartach Sound Blaster X-Fi będący pokłosiem A3D i 3DPA.

QSound Labs na rynku funkcjonuje bardzo długo, bo już 19 lat (od 1988 roku). Swoje pierwsze kroki w branży dźwiękowej założyciele firmy stawiali jeszcze na początku lat osiemdziesiątych ubiegłego wieku. Wtedy opracowywali oni pierwsze systemy dźwięku przestrzennego, przy wykorzystaniu źródeł analogowych. QSound Labs, pomimo iż dziś jest mało znana, miała ogromny wpływ na rozwój dźwięku przestrzennego. Z jej technologii korzystało wiele potężnych korporacji. Wśród nich znajdziemy producentów kart dźwiękowych, układów DSP, chipsetów płyt głównych, konsol do gier, sprzętu Hi-fi, komputerów przenośnych i wielu innych. Na liście partnerów QSound Labs widnieją między innymi: Philips, Cirrus Logic / Crystal Semiconductor, Intel, VIA, Sega, Trident, Samsung, Sony, AIWA, Sharp, Toshiba, Sanyo, Microsoft, IBM, real, ATI, Motorola, Forte Media i Acer. Wśród wymienionych firm powinna znaleźć się jeszcze jedna, ważna pozycja. Ktoś zgadnie jaka? W marcu 1993 roku licencje na wykorzystanie technologii QSound kupił nie kto inny, jak Creative Labs. Karty Sound Blaster 16 i Sound Blaster AWE wykorzystywały rozwiązania QSound Labs - ostatniego rywala Creative Labs, którego jeszcze nie udało się przejąć. Dodatek o nazwie Advanced Signal Processing dla Windows 3.x do dziś można pobrać ze strony internetowej Creative Labs!

Pod koniec 1999 roku (okres, w którym upadła Aureal Semiconductor) na swoje pięć minut załapał się legendarny producent układów graficznych - Trident. Firma ta wprowadziła na rynek bardzo ciekawe układy 4DWave, wykorzystujące technologię QSound Labs Q3D 2.0, obsługujące 64 głosy 3D, co w tamtym czasie było zarezerwowane dla konstrukcji z najwyższej półki cenowej. Karty dźwiękowe na tych układach produkowali m.in. BenCole oraz znany niegdyś z produkcji kart wysokiej jakości koreański HoonTech. Układy Tridenta trafiały jednak w większości do kart niskobudżetowych i niestety, pomimo konkurencyjnych cen, nie były w stanie skutecznie walczyć z kartami Sound Blaster Audigy. Ostatecznie Trident 4DWave osiągnęły sukces, gdy ich architekturę kupiły firmy ALi i SiS. Obie zintegrowały jednostki 4DWave w swoich chipsetach płyt głównych. Porażka na rynku kart dźwiękowych była jednak zbyt dotkliwa, aby kontynuować walkę. Trident ostatecznie się z niej wycofał.

Czy przejęcie najpierw Aureal Semiconductor, a później Sensaura było skutkiem pazerności i chęci "łatwego" pozbycia się konkurencji przez Creative Labs? Z pewnością nie w przypadku tej pierwszej firmy. Aureal Semiconductor stworzyła co prawda dwa świetne układy Vortex, ale wojna, jaką wypowiedziano Creative Labs, wykończyła firmę finansowo. Wojna, której Aureal Semiconductor nie miała szans wygrać z tak silnym przeciwnikiem. Pod koniec 1999 roku firma ta otrzymała jednak inny, bardzo poważny cios.

Wejście na scenę systemu operacyjnego Microsoft Windows 2000 i Millennium Edition zamknęło układom Aureal Vortex i Vortex 2 drogę do dalszych sukcesów. We wrześniu 1999 roku Aureal Semiconductor zapowiedziała premierę nowej generacji układów Vortex 3 i to na nich firma najbardziej się skupiała. Aureal niestety okazała się całkowicie nieprzygotowana na wejście dwóch systemów Microsoftu, z których jeden (Me) pozwalał wykorzystywać nowy model sterowników (Windows Driver Model - WDM), a drugi - Windows 2000 - ich wymagał. Dla posiadaczy kart dźwiękowych z układami Vortex i Vortex 2 przejście na nowy Windows 2000 nie miało najmniejszego sensu. Sterowniki WDM opracowane przez Aureal Semicondutor były bardzo niestabilne i pozbawiały karty niektórych możliwości. Co prawda z biegiem czasu sytuacja ulegała poprawie, lecz na tyle powolnej, że wyprzedzonej przez bankructwo firmy. Historia jednak ma taką dziwną przypadłość - lubi się powtarzać. Tym jednak zajmiemy się w dalszej części artykułu.

Monopol Creative - fakt czy mit?

Nie da się ukryć, że na pytanie o pierwsze skojarzenie z hasłem "karta dźwiękowa" mało kto nie odpowie "Sound Blaster". Czy Creative Labs, po przejęciu swoich dwóch najpoważniejszych wrogów (Aureal Semiconductor i Sensaura) rzeczywiście nie ma żadnej konkurencji na rynku kart dźwiękowych dla graczy, czy miłośników multimediów? A może po prostu, mówiąc wprost, nie mamy bladego pojęcia o tym, że są poza Creative Labs producenci kart, które śmiało mogą konkurować z Sound Blasterami?

Creative Labs ze swojej bardzo mocnej pozycji korzysta jak tylko może. 28 marca 2003 adwokaci kancelarii prawnej Schubert & Reed złożyli w Sądzie wyższej instancji amerykańskiego stanu Kalifornia pozew przeciwko producentowi kart dźwiękowych Sound Blaster. Oskarżyciele zarzucali firmie Creative Labs oszukiwanie nabywców kart Audigy Gamer, Audigy Platinum, Audigy Platinum EX, Audigy ES, Audigy MP3+ oraz Extigy oraz łamanie przepisów dotyczących nieuczciwej konkurencji, obowiązujących w Kalifornii. Według strony pozywającej niezgodne z rzeczywistością były slogany reklamowe oraz zapisy specyfikacji tych kart mówiące o tym, iż produkty te generowały wysokiej jakości dźwięk, o rozdzielczości 24 bitów. Rzeczywistość była taka, że układy EMU10K2 posiadały DSP (cyfrowy procesor dźwięku) w postaci niewiele zmienionej od czasów Sound Blaster Live! (EMU10K1). Oba rozwiązania nie były w stanie przetwarzać dźwięku o parametrach innych niż 48 kHz próbkowania i rozdzielczości 16 bitów. Efekt był taki, że kupując np. kartę Audigy Platinum EX, z dużym napisem "24-bit High Audio Fidelity" na pudełku klient otrzymywał produkt mogący przetwarzać dźwięk z rozdzielczością jedynie 16 bitów (karty Audigy miały 24-bitowe przetworniki DAC, ale sam procesor dźwięku wyprowadzał do przetworników dźwięk 16-bitowy).

Adwokatom Creative Labs udało się jednak doprowadzić do ugody, na mocy której firma zobowiązała się wszystkim posiadaczom wymienionych w pozwie kart dźwiękowych udzielić 25% zniżki na zakup dowolnego produktu z ich internetowego sklepu. Wiązało się to niestety z trzema ograniczeniami. Po pierwsze, kupowany produkt musiał kosztować nie mniej niż 250 dolarów. Po drugie, zniżka maksymalnie mogła wynieść 62,5 dolara i po trzecie dotyczyła tylko obywateli Stanów Zjednoczonych Ameryki. Trzy osoby - przedstawiciele strony pozywającej - otrzymały od 1000 do 3000 dolarów każda.

Problem "24 bitów" rozwiązały dopiero karty Sound Blaster Audigy 2, które otrzymały nowy układ dźwiękowy, zdolny do przetwarzania sygnału audio przy 24-bitowej rozdzielczości i częstotliwości próbkowania 192 kHz przy dwóch kanałach lub 96 kHz w trybie 5.1/6.1.

Przy okazji premiery Sound Blastera Audigy, firma Creative mocno zaczęła korzystać ze współczynnika odstępu sygnału od szumu (Signa-to-Noise Ratio, SNR). Audigy był pierwszą kartą konsumencką, która - według producenta - przekroczyła poziom SNR 100 dB. Kolejne produkty Creative jeszcze wyżej podnosiły tę poprzeczkę.

Pamiętajcie jednak, że wartość SNR nie przekłada się bezpośrednio na jakość dźwięku, a jedynie na to, jak wiele szumu usłyszymy w tle, podczas słuchania muzyki czy grania w gry komputerowe. Na dokładkę podawane przez producentów wartości SNR często mają się nijak do rzeczywistości. Na pudełkach kart Audigy 2 ZS, jak i na stronach internetowych Creative Labs w oczy rzucało się hasło "Sound Blaster Audigy 2 ZS delivers 24-bit ADVANCED HD audio quality playback with incredible 108dB SNR.", co z angielskiego na nasze oznacza ni mniej ni więcej, a "Sound Blaster Audigy 2 ZS zapewnia 24-bitową jakość odtwarzania dźwięku ADVANCED HD z nieprawdopodobną wartością odstępu sygnału od szumu na poziomie 108 dB". Praktycznie rzecz biorąc samo to stwierdzenie jest jak najbardziej prawdziwe. Diabeł oczywiście tkwi w szczegółach.

Osiągnięcie wartości SNR na poziomie 108 dB na Audigy 2 ZS rzeczywiście było prawdopodobne. Twórcy przetworników Cirrus Logic CS4382 stosowanych w kartach Audigy 2 ZS w specjalnej dokumentacji wyraźnie jednak przestrzegają, że "określenie SNR nie powinno być wykorzystywane ze względu na ogólnie panującą nieznajomość jego definicji". W czym problem, spytacie? Oczywiście w marketingu.

Stosowane na kartach Audigy 2 ZS przetworniki CS4382 posiadają pewną istotną cechę, której nieznajomość prowadzi do błędnego odbioru liczb krzyczących do nas z pudełek Audigy 2 ZS. Nawet jeśli mamy świadomość ich znaczenia! CS4382 mianowicie cechuje specjalna funkcja automatycznego wyciszania toru dźwięku po około 0,2 sekundy (przy próbkowaniu 44,1 kHz) od momentu dostarczenia doń ostatnich danych. Wartość 108 dB SNR nie odnosi się zatem w żadnej mierze do jakości czy czystości generowanego dźwięku, gdyż Signal-to-Noise Ratio odnosi się do pomiaru zaszumienia dźwięku gdy - mówiąc oględnie - panuje cisza.

Ten marketingowy trik nie odnosi się oczywiście tylko do kart Sound Blaster Audigy 2 ZS. Do dziś niektórzy producenci kart dźwiękowych nadal w najlepsze zabawiają się powszechną nieświadomością klientów w tej materii.

Taka zatem jest cena popularności. Z jednej strony Creative Labs ze swojej pozycji może stosować różne triki mające na celu przyciągnięcie klientów. Z drugiej strony, jak każdy "dominant" jest bacznie obserwowany. W dalszej części artykułu wykażemy, że konkurencja Creative też nie jest święta i ma co nieco za uszami.

Nie da się ukryć tego, że firma Creative ma ogromną przewagę nad konkurencją na płaszczyźnie produkcji kart dźwiękowych. Jeśli natomiast wziąć pod uwagę cały rynek PC Audio, karty Sound Blaster już dawno temu wyparte zostały przez integry. W sondzie sprzętowej firmy Valve Software wzięło udział ponad 620 tysięcy graczy i choć to właśnie karty Sound Blaster uchodzą za najlepsze do gier, to mimo wszystko wyniki wyglądają następująco:

Realtek AC'97 i HD Audio	38,1%
Analog Devices AC'97 i HD Audio	10,8%
C-Media PCI i integry	5%
NVIDIA nForce Audio (w tym niemal wszystkie z kodekami Realtek)	3%
Sigmatel AC'97 i HD Audio	3,5%
Creative Sound Blaster X-Fi	3,0%
Creative Sound Blaster Audigy 2 ZS	2,3%
Creative Sound Blaster Audigy i SE	1,3%
Creative Sound Blaster Live!	1,1%
VIA AC'97 i HD Audio	1,0%
Inne, nieznane	28,9%

Wyniki sondy są oczywiście niereprezentatywne, choć pozycja lidera w tym rankingu nikogo chyba nie dziwi. Trudno jedynie określić, jakie konstrukcje ujęte są w ostatniej kategorii, choć raczej trudno zakładać, aby wśród nich większość stanowiły karty PCI i tym bardziej, karty Sound Blaster. Jak widać, nawet wśród graczy integry mają poważną przewagę nad produktami firmy Creative. I tak naprawdę to producenci właśnie jednostek zintegrowanych dyktują kierunki rozwoju. Nieprzypadkowo kolejne wersje rozszerzeń Creative EAX Advanced HD potrzebują wielu lat na to, by producenci gier zechcieli użyć ich chociaż w paru bardziej rozpowszechnionych tytułach. Ogromna większość gier nie wychodzi poza ramy EAX 2.0, czyli najwyższą obsługiwaną wersję przez największą część kontrolerów dźwięku na rynku. Jeśli dodamy do tego wszystkiego fakt, iż najważniejsza cecha kontrolerów dźwięku, czyli symulacja dźwięku 3D w grach oraz dźwięk dookolny na słuchawkach zadomowiły się w wielu integrach i kartach konkurencyjnych, firmie Creative coraz trudniej jest walczyć o rynek.

API, API, cztery API! Microsoft

Zanim przejdziemy do spraw sprzętowych, musimy oczywiście zapoznać się choć po trochu z całą tą stertą papierów, specyfikacji, interfejsów, rozszerzeń, funkcji itd. Innymi słowy, ze wszystkim, co napędza nasze dźwiękowe cacka.

Aby aplikacja bądź gra mogła komunikować się z kartą dźwiękową, podobnie jak w przypadku kart graficznych potrzebne jest środowisko programistyczne. Dla ułatwienia pracy programistom, ci stworzyli sobie kilka interfejsów. Dzięki nim nasze programy multimedialne oraz gry mogą wykorzystać wiele specyficznych funkcji naszych "dźwiękówek". To interfejs decyduje o tym, czy dana gra wykorzysta te wspaniałe "eaksy" czy systemy dźwięku przestrzennego. W najbardziej zorientowanym na multimedia i gry (a na pewno najpopularniejszym) środowisku Windows na dzień dzisiejszy funkcjonują cztery poważne interfejsy programistyczne. W średniotelegraficznym skrócie przedstawimy każdy z nich.

DirectSound (API - Application Programming Interface, z ang. Interfejs programowania aplikacji) jest specyfikacją instrukcji i procedur komunikacji pomiędzy kontrolerem dźwięku, jego sterownikiem, systemem operacyjnym a aplikacją. Dzięki niemu programy odtwarzające dźwięki mają bezpośredni dostęp do kontrolera, co w efekcie skutkuje tym, że mogą one przekazywać bufory (próbki) dźwiękowe bezpośrednio do niego, z pominięciem przetwarzania ich przez CPU. Obecnie na rynku masowym nie ma ani rozwiązań zintegrowanych, ani kart dźwiękowych niezgodnych z DirectSound. Jest to absolutnie podstawa praktycznie wszystkich aplikacji multimedialnych oraz gier, w kwestii przetwarzania dźwięku oczywiście. Zaprezentowany po raz pierwszy pod koniec 1996 roku, wraz z premierą DirectX 3.0 szybko został podchwycony przez twórców gier, którzy wcześniej zmuszeni byli do korzystania z systemu DOS jako podstawowej platformy. W tym oczywiście pomocny był także Direct3D, ale to zupełnie inna kwestia.

Aplikacja komunikując się z kontrolerem dźwięku za pośrednictwem DirectSound przesyła próbki dźwięku w dwóch postaciach:

Bufory drugorzędne (Secondary): zależnie od możliwości kontrolera dźwięku mogą być programowe lub sprzętowe. Są wykorzystywane wyłącznie do przechowywania dźwięków, na których nie są dokonywane żadne operacje przetwarzania (np. dodawanie efektów akustycznych). Obecnie dostępne na rynku karty dźwiękowe udostępniają albo 64, albo 128 buforów drugorzędnych. Potocznie zwiemy je "głosami (3D)". To ich ilość reguluje na przykład, ile dźwięków w grze można odtworzyć jednocześnie. Z wyjątkiem NVIDIA Sound Storm, wszystkie kontrolery zintegrowane w chipsetach płyt głównych oferują nie więcej niż 32 bufory tego typu. Procesory NVIDII miały 64 sprzętowe bufory drugorzędne. Bufory te dzielimy na dwa typy, zależnie od tego co zawierają lub jak mają być odtwarzane:
Bufory statyczne: krótkotrwałe dźwięki, mogące stale rezydować w lokalnej pamięci karty dźwiękowej. Dzięki temu mogą one być odtworzone z bardzo małymi opóźnieniami. Jeśli karta dźwiękowa nie dysponuje odpowiednio pojemną pamięcią lokalną lub nie posiada jej wcale, dźwięki mogą być zapisane do pamięci operacyjnej i przechowywane właśnie w niej. Jako bufory statyczne odtwarzane są w grach np. odgłosy strzałów, uderzeń, głosy postaci itd.
Bufory strumieniowe: stosowane w przypadku długotrwałych dźwięków, jak np. muzyka w grach czy z odtwarzaczy multimedialnych. Jako że tego typu strumienie dźwięku mają dużą objętość, są zawsze ładowane do pamięci operacyjnej. Aby jednak nie doprowadzać do zbyt dużych strat wolnych obszarów RAM, są one ładowane w małych fragmentach. Gdy jeden fragment jest odtwarzany, do pamięci ładowany jest następny, w dokładnie tym samym obszarze (bufor jest wypełniany od początku). Buforowanie strumieniowe pozwala zachować spore obszary pamięci operacyjnej wolne dla innych celów. Z drugiej strony wymaga dokładnego dostosowania wielkości buforów i częstotliwości ich "doładowywania" kolejno następującymi fragmentami strumieni dźwiękowych, aby uniknąć przeskoków, trzasków i przerw w odtwarzanych dźwiękach.
Bufor główny (Primary): Tutaj trafiają dźwięki z buforów drugorzędnych. Następnie następuje przekonwertowanie ich zawartości na jeden, wspólny format (próbkowanie, rozdzielczość). Jeśli bufor jest sprzętowy, tutaj następuje także miksowanie buforów drugorzędnych i nakładanie na nie efektów specjalnych. Stąd gotowy strumień dźwięku (Mono, Stereo lub wielokanałowy) trafia do wyjścia dźwięku urządzenia.

DirectSound3D - podobnie jak poprzednik jest środowiskiem programistycznym, mającym jednak inne przeznaczenie i funkcjonalność. Jest pomostem łączącym interfejs renderowania grafiki trójwymiarowej (np. Direct3D) z DirectSound. Rozszerza on możliwości tego ostatniego o pozycjonowanie źródeł dźwięku w wirtualnym środowisku odsłuchowym na podstawie informacji o pozycjach obiektów dostarczanych przez interfejs Direct3D. Udostępnia on filtry HRTF, odpowiadające za przetwarzanie dźwięku tak, aby jak najwierniej odwzorować jego barwę, opóźnienie, dynamikę w środowisku naturalnym. Innymi słowy, filtry HRTF sprawiają, że dźwięk odtwarzany na słuchawkach jest przetworzony tak, aby słuchacz mógł precyzyjnie określić lokalizację jego źródła (w przypadku dźwięku wielokanałowego). Są one stosowane także w przypadku konfiguracji opartej na parze głośników lub zestawach wielokanałowych. Pierwotnie DirectSound3D realizowany był wyłącznie przez CPU, co stanowiło otwarcie drogi dla innego interfejsu. Ten szybko wyrósł na potężną konkurencję dla DS3D i jednocześnie na ogromny orzech do zgryzienia dla Creative Labs. O tym jednak trochę później.

DirectSound pomimo ogromnej popularności, bardzo dobrych opinii programistów i świetnych rezultatów praktycznych został przez firmę Microsoft skreślony, a jego rozwój zatrzymany. Po prawie dwunastu latach postępów w rozwoju DirectSound, podjęto sprawiającą ogromne problemy producentom kart dźwiękowych i gier decyzję. Najnowszy system operacyjny firmy Microsoft (Windows Vista) został całkowicie pozbawiony możliwości sprzętowego przetwarzania dźwięku (na poziomie jądra systemu), a z dziesiątej wersji DirectX, DirectSound i DirectSound3D znikły bez śladu. Są to dwa z niewielu przypadków doskonale funkcjonujących rozwiązań Microsoftu, które wyłącznie ze względów zarobkowych poddano egzekucji. Następcą obu standardów jest Microsoft XACT, czyli dziwaczny twór całkowicie na siłę przeniesiony z konsol Microsoft Xbox 360 na komputery PC.

XACT (XAudio) - nowy interfejs programowania Microsoftu, wchodzący w skład pakietu DirectX 10, zastępujący DirectSound i eliminujący sens istnienia DirectSound3D. Jest także jednym z elementów pakietu Microsoft XNA, pierwotnie przeznaczonego dla konsol Xbox 360. XACT w przeciwieństwie do swoich poprzedników nie pozwala aplikacjom uzyskać bezpośredniego dostępu do karty dźwiękowej. Skutkiem jest konieczność przerzucenia wszystkich operacji przetwarzania dźwięku na CPU. Ponadto względem DirectSound3D, XACT oznacza utratę wielu sprzętowych rozwiązań ("nakładek" na DS3D) jak na przykład Creative EAX, QSound QEM, czy systemów wirtualizacji przestrzennej dźwięku (Aureal A3D, Creative CMSS-3D, QSound QMSS, Sensaura 3DPA). Interfejs ten nie obejmuje wsparcia dla sprzętowych filtrów HRTF oraz rozszerzeń EAX. XACT wstępnie został opracowany dla konsol do gier Microsoft Xbox, jednakże producent podjął decyzje mające na celu zbliżenie do nich platformy Windows Vista. Dlatego też DirectSound i jego trójwymiarowy brat musieli odejść, a "pecetowi" gracze, pod względem przetwarzania dźwięku w grach cofnąć się niemal do czasów MS-DOS.

Nowy interfejs Microsoftu reguluje przetwarzanie przez aplikacje tzw. banków dźwięków (Sound banks). Są to pojedyncze pliki typu Wave zawierające zestawy różnych dźwięków. Podczas pracy aplikacji bank może zostać załadowany do pamięci operacyjnej, a CPU zależnie od potrzeb pobiera z niego fragment zawierający potrzebny dźwięk.

W kwietniu 2007 roku pojawiły się plotki mówiące o tym, że Microsoft rozważa wprowadzenie zmian w jądrze systemowym Windows Vista i przywrócenie DirectSound i DirectSound3D. Dziś wiadomo już, że nie należy oczekiwać żadnych zmian w tej kwestii. Microsoft stawia na swoim i nie zamierza cofnąć się ani o krok. Programiści odpowiedzialni za nowy stos audio Windows Vista i XAudio wydają się być tak zachwyceni swoim wytworem i odporni na krytykę producentów sprzętu, oprogramowania i wreszcie sporej części klientów, że trudno spodziewać się ujawnienia zdolności do popukania się w czoła. Paranoja napędzana przez budzący sporą nieufność system zabezpieczeń multimediów DRM wydaje się być nie do sforsowania. To właśnie on leży u podstaw zawalenia się dorobku dziesięciolecia rynku PC Audio. Aby DRM mógł funkcjonować, przetwarzanie dźwięku musi odbywać się pod ścisłą kontrolą systemu operacyjnego, a więc CPU.

Ostatnią deską ratunku przed XAudio jest otwarty interfejs programowania OpenAL, stworzony pierwotnie przez firmę Loki Software, trudniącą się przenoszeniem gier z platformy Windows na Linux (Loki wydawała linuksowe edycje gier Quake III Arena, Soldier of Fortune, Descent 3, Heretic II, Unreal Tournament i kilku innych). Nowy interfejs miał wspomóc firmę podczas portowania gier na Linuksa. Efekty jednak przeszły wszelkie oczekiwania...

Dokładnie w tym samym czasie, gdy pojawiły się pierwsze doniesienia o tym, że firma Creative Labs rozpocznie sprzedaż swoich procesorów dźwięku innym firmom, które będą dzięki temu mogły produkować własne karty dźwiękowe, w oparciu o układy X-Fi (przynajmniej na obecną chwilę), Microsoft zapowiedział XAudio 2 - interfejs wzbogacony m.in. o nowe filtry HRTF. W ten sposób uzyskamy funkcjonalnie niemal ten sam interfejs, co DirectSound(3D) z 1997 roku, tyle że realizowany przez CPU. Programiści Microsoftu najwyraźniej przestraszyli się wizji spopularyzowania interfejsu OpenAL poprzez wypełnienie rynku kartami dźwiękowymi w pełni sprzętowo z nim zgodnymi. Ogromnym możliwościom OpenAL XAudio 2 nie ma jednak szans zagrozić. W praktyce jednak to Microsoft dyktuje warunki i dni OpenAL już niebawem mogą się okazać policzone.

Symptomatyczne wydają się ostatnie wypowiedzi "przodowników pracy" wśród producentów gier. Zarówno John Carmack (id Software), jak i Gabe Newell (Valve Software) krytykują sposób, w jaki Microsoft manipuluje rynkiem gier za pomocą DirectX 10. Carmack bardzo stanowczo stwierdza, że nie zamierza rezygnować z OpenGL i OpenAL jako podstawowych interfejsów programowania gier id Software. Inny producent gier, Electronic Arts planujący rozszerzyć swoją ofertę gier dla komputerów firmy Apple Computer, także coraz chętniej sięga po OpenAL. W przypadku gier dla Windows panuje pewna dezorientacja. Głośna gra Crysis (Electronic Arts) korzysta bowiem z całkowicie programowego silnika przetwarzania dźwięku FMOD Ex.

API, API, cztery API! OpenAL

OpenAL - interfejs programowania aplikacji stworzony przez Loki Software (wydawcę gier na platformę Linux), a po upadku firmy, w 2002 roku przejęty przez Apple Computer i Creative Labs. Na tle wszystkich dotychczasowych rozwiązań Microsoftu, OpenAL jest najłatwiejszym w implementacji API "dźwiękowym", a jego korzenie sięgają głębiej niż historia EAX czy Aureal A3D. Zasada przetwarzania dźwięku opiera się na trzech prostych elementach: obiektach źródłowych, buforach (próbkach dźwięku) i słuchaczu. Obiekt źródłowy może być rzeczywistym obiektem na trójwymiarowej scenie (np. postacią) i zawiera w sobie pozycję, prędkość i kierunek. Takie same parametry cechują wirtualnego słuchacza. Zaletą OpenAL jest możliwość uzyskania bardzo naturalnego pozycjonowania dźwięku, dokładnie na podstawie budowy graficznej sceny 3D. OpenAL może także służyć jako zamiennik DirectSound, z racji zdolności do buforowania strumieniowego. Można go zatem wykorzystywać np. do słuchania muzyki czy oglądania filmów. Jeśli aplikacja będzie oczywiście do tego przystosowana. Jeśli nie jest, a chcielibyśmy tego, to i na to jest pewne rozwiązanie, ale o tym za chwilę.

Interfejs ten ma także możliwość "przyklejania" doń nakładek wzbogacających go o nowe możliwości. Producent karty dźwiękowej może zatem umożliwić grom korzystanie ze specyficznych cech sprzętowych, które nie są uwzględnione w specyfikacji OpenAL. Tak właśnie na przykład firma Creative Labs zdołała uzyskać sprzętowe wsparcie OpenAL dla rozszerzeń EAX 5.0 dla kart Sound Blaster X-Fi.

O ile programiści firmy Loki Software pracowali nad OpenAL tak, aby pozwalał przenosić gry Windows na platformę linuksową, o tyle dziś interfejs ten sięgnął o wiele dalej. Obecnie OpenAL funkcjonuje na następujących platformach:

Apple Mac OS X
BSD
GNU/Linus (OSS i ALSA)
IRIX
Microsoft Windows Me do Vista
Microsoft Xbox (konsola)
Microsoft Xbox 360 (konsola)
MorphOS
Nintendo GameCube (konsola)
Nintendo Wii (konsola)
Solaris
Sony Playstation 2 (konsola)
Sony Playstation 3 (konsola)

Wśród kart dźwiękowych wsparcie OpenAL nie jest jednak zbyt szerokie. Obecnie OpenAL jest wspierany przez karty Creative Sound Blaster Audigy, X-Fi (dotyczy także modelu Xtreme Audio), Audiotrak X-Plosion i X-Meridian oraz Razer Barracuda AC-1 i ASUS Xonar D2, a także niektóre karty dźwiękowe z układami C-Media CMI 7868/878x. Jeszcze kilka lat temu także NVIDIA produkowała bardzo wydajne jednostki Sound Storm, zgodne z OpenAL. Niestety firma ta wycofała się z planów wejścia na rynek kart dźwiękowych, po przejęciu przez Creative Labs firmy Sensaura - twórcy rozszerzeń 3DPA, z których NVIDIA korzystała. Obecnie na rynku oczywiście są inne karty dźwiękowe obsługujące OpenAL, jednakże żadna z nich nie jest oficjalnie sprzedawana w Polsce. Dotyczy to przede wszystkim konstrukcji opartych na najnowszych układach firmy C-Media (np. karty firmy Sondigo).

A co z grami? Pod tym względem OpenAL wygląda dość przeciętnie. Przez kilka lat lista gier korzystających z OpenAL nie rozrosła się specjalnie imponująco, choć biorąc pod uwagę popularność DirectSound(3D) jest całkiem nieźle, a przyszłość maluje się w całkiem ciekawych barwach:

Albert's Armageddon (FreeBSD, Linux, Mac OS, Windows)
Alien Abduction (Windows)
Alien Flux (Linux, Mac OS, Windows)
America's Army: Operations (Linux, Mac OS, Windows)
Armed Assault (Windows)
A Tale in the Desert II (Linux, Mac OS, Windows)
Battlefield 2 (Windows)
Battlefield 2142 (Windows)
Battle Just Started (Linux, Mac OS, Windows)
Blast Miner (Windows)
Blender 3D (FreeBSD, Irix, Linux, Mac OS, Solaris, Windows)
Bridge Construction Set (Linux, Mac OS, Windows)
Call of Juarez (Windows)
Cold War (Linux, Windows)
Dark Horizons: Lore (Linux, Mac OS, Windows)
D-Bug (Windows)
Doom 3 (Mac OS, Windows)
Dungeons & Dragons Online (Windows)
El Matador (Windows)
Escape From Monkey Island (Mac OS)
E.V.E. Paradox (Linux, Windows)
FlightGear (FreeBSD, Linux, Mac OS, sgi, Solaris, Windows)
Ghost Recon: Advanced Warfighter (Windows)
Gish (Linux, Mac OS, Windows)
Harry Potter and the Chamber of Secrets (Mac OS, Windows)
Heavy Metal: F.A.K.K.2 (Linux)
Hot Potato Online (Linux, Windows)
Jedi Knight: Jedi Academy (Mac OS, Windows)
Jedi Knight 2 (Mac OS, Windows)
Just Cause (Windows)
Kohan (Linux)
Lineage 2 (Windows)
Mage Knight: Apocalypse (Windows)
Marble Blast (Linux, Mac OS, Windows)
Massive Assault (Mac OS)
MegaCorps Online (Linux, Mac OS, Windows)
Minigolf Mania (Windows)
Minions of Mirth (Mac OS, Windows)
Myst Online: Uru Live (Windows)
Novus Aster (Windows)
Orbz (Linux, Mac OS, Windows)
Pariah (Windows)
Penumbra Overture (Windows)
PlaneShift (Linux, Mac OS, Windows)
Postal 2 (Linux, Mac OS, Windows)
Prey (Windows)
Psychonauts (Windows)
Quake 4 (Windows)
RocketBowl (Windows)
Saints and Sinners Bowling (Windows)
Shellshock Nam '67 (Windows)
Skyrocket Screensaver (Linux, Windows)
Soldier of Fortune (Linux)
Soldier of Fortune 2 (Windows)
S.T.A.L.K.E.R. (Windows)
Star Wars Republic Commando (Windows)
Stubbs the Zombie (Mac OS, Windows)
Super Dudester (Linux, Mac OS, Windows)
SuperTux (Linux, Mac OS, Windows)
SWAT 4 (Windows)
Tactile 3D (Windows)
Think Tanks (Linux, Mac OS, Windows)
Tribal Trouble (Linux, Mac OS, Windows)
Trigger (Linux, Mac OS, Windows)
Tribes 2 (Linux)
Tribes: Vengeance (Windows)
UFO-Afterlight (Windows)
Ultratron (Linux, Mac OS, Windows)
Unreal 2 (Windows)
Unreal Tournament 2003 (Linux, Mac OS, Windows)
Unreal Tournament 2004 (Linux, Mac OS, Windows)
Vanguard (Windows)
VegaStrike (Linux, Mac OS, Windows)
Void War (Windows)
Warsow (Linux, Windows)
Wing Commander Saga (Mac OS, Windows)
Wurm Online (Linux, Mac OS, Windows)
X2: The Threat (Linux)
X3: Reunion (Windows)
X-Plane (Linux, Mac OS, Windows)
Zap! (Linux, Mac OS, Windows)

OpenAL: Na co? Po co?

W sytuacji, w jakiej graczy stawia Windows Vista, lista gier korzystających z OpenAL może zacząć wydłużać się w szybszym tempie, choć pewności niestety nie ma. W przypadku najnowszego systemu operacyjnego firmy Microsoft, jak dotąd tylko gry korzystające z OpenAL pozwalają kontrolerom dźwiękowym przejmować możliwie jak najwięcej operacji związanych z przetwarzaniem dźwięku. Poważnym problemem są jednak nadal multimedialne aplikacje, np. odtwarzacze czy oprogramowanie do obróbki audio/wideo. Te praktycznie w 100% oparte są na interfejsie DirectSound. Dlatego też odtwarzanie muzyki np. w Windows Media Player, z włączonym EQ i CMSS-3D lub Dolby Pro Logic IIx może tworzyć zauważalne obciążenie CPU. Obciążenie, którego nie uświadczymy pod kontrolą poprzednika Visty. Tutaj nawet reklamowany jako "najpotężniejszy procesor dźwięku na świecie", czyli Creative X-Fi, z pustego nie naleje.

Ta sama reguła dotyczy gier korzystających z DirectSound i DirectSound3D. Spadki płynności animacji graficznej są oczywistością, gdyż wynikają z dodatkowego obciążenia dla CPU. Niemniej jednak bezpośrednie porównania wydajności gier pod kontrolą Windows Vista i XP nie mają większego sensu. Oba systemy bazują na innych jądrach, a w przypadku Visty zastosowano lekko przebudowane biblioteki DirectX w wersji 9.0, tylko dla zachowania kompatybilności. Dodajmy do tego nowe modele sterowników i fakt, iż wciąż część z nich jest nadal niedopracowanych, niestabilnych lub nie wykorzystuje wielu możliwości czy pełnej mocy urządzeń.

Pomimo upływu wielu miesięcy producent popularnych Sound Blasterów nadal boryka się z poważnymi problemami ograniczającymi funkcjonalność tych kart pod Vistą. Wszystko wskazuje jednak na to, że zarówno Creative Labs, jak i na przykład ASUS nie zamierzają poddać się bez walki.

Producent serii kart Sound Blaster kilka tygodni temu dostarczył sterowniki dla całej rodziny kart dźwiękowych X-Fi, które wreszcie można określić mianem dobrych i sprawnych. Firma uporała się z problemami zgodności ich kart, z konfiguracjami wyposażonymi w 4 GB pamięci RAM oraz system operacyjny Windows Vista 64-bit. Gry korzystające z interfejsu OpenAL oraz kontrolowane przez specjalny wrapper ALchemy przestały zawieszać komputery z winy błędów w sterownikach.

ASUS dla swoich kart serii Xonar już od pewnego czasu oferuje sterowniki zgodne z tajemniczym interfejsem DirectX GX dla Windows Vista. O nim jednak napiszemy przy okazji prezentacji karty ASUS Xonar D2.

Najpoważniejszym problemem Windows Vista obecnie jest całkowity brak możliwości kodowania dźwięku do formatu Dolby Digital (dotyczy to także braku DTS Connect), czy też stosowania systemów wielokanałowych, nieprzewidzianych przez Microsoft (np. 4.1, czy 6.1). Posiadacze kart Sound Blaster serii Audigy mogą mieć także poważne problemy z użytkowaniem wyjścia cyfrowego pod kontrolą Windows Vista w wersji 64-bitowej.

Użytkownicy niektórych kart nadal oczekują na uzyskanie możliwości korzystania z dostarczanych wraz ze sterownikami koderami strumieni Dolby Digital czy DTS. Do niedawna nie można było także mówić o poprawnym funkcjonowaniu systemów wirtualizacji dźwięku wielokanałowego na słuchawki - Creative CMSS-3D, Dolby Headphone, QSound QSurround itp. Microsoft w Windows Vista w ogóle nie przewidział słuchania czegokolwiek przez słuchawki. Czy kiedykolwiek te wszystkie rozwiązania zadziałają pod Vistą tak, jak pod poprzednimi edycjami Windows? Producenci kontrolerów dźwiękowych nie poddają się, choć powoli starają się odzyskać wigor swoich produktów.

Na szczęście niektórzy producenci kart dźwiękowych zdołali już obejść system wewnętrznego przetwarzania dźwięku Windows Vista (tzw. wtyczek APO - Audio Processing Object). W kartach ASUS serii Xonar (D2, D2X, U1), Razer Barracuda AC-1 czy Auzentech X-Meridian 7.1 możemy całkowicie dowolnie konfigurować liczbę kanałów udostępnianych dla aplikacji przez Windows Vista oraz liczbę kanałów przetwarzanych przez DSP kart dźwiękowych lub ich sterowników. W kartach Sound Blaster Audigy i X-Fi zastosowano niedawno temu podobne rozwiązanie, choć użytkownika pozbawiono możliwości ręcznej regulacji. Stawia to te urządzenia niestety w gorszej pozycji niż wymienione wcześniej karty ASUS i Razer, ale więcej na ten temat powiemy później.

Jakie zatem jest wyjście z tej, bądź co bądź, beznadziejnej sytuacji? Najtańszym i najprostszym rozwiązaniem jest oczywiście rezygnacja z instalacji Windows Vista i pozostanie przy Windows XP. Drugim rozwiązaniem, niestety od użytkowników niezbyt zależnym, jest zainteresowanie się programistów interfejsem OpenAL. Dopiero masowe wprowadzenie go do aplikacji multimedialnych jak np. Winamp, Jet Audio, PowerDVD, WinDVD, foobar 2000, Media Player Classic, Zoom Player i wielu, wielu innych pozwoli odzyskać wszystko to, co odebrał nam Microsoft w Windows Vista.

Polityka Microsoftu okazuje się prowadzić do całkowitego chaosu, w którym równolegle funkcjonować będzie wiele rozwiązań w dziedzinie przetwarzania dźwięku, a użytkownik może nawet nie mieć pojęcia, z którego aktualnie korzysta. To akurat ma kolosalne znaczenie, gdyż zastosowanie już w samej grze odpowiednio skonfigurowanych filtrów HRTF dla słuchawek może sprawić, że funkcje takie jak Creative CMSS-3D czy Dolby Headphone będzie trzeba wyłączać za każdym razem, dla konkretnych gier. Jeśli już na pudełku z grą nie będzie informacji na temat funkcjonalności silnika audio gry, to klient nie będzie miał możliwości stwierdzenia, czy z posiadanym kontrolerem dźwięku będzie miał dźwięk 3D na słuchawkach, czy nie. A jeśli tak, to w jaki sposób będzie generowany?

Melomani i audiofile tym bardziej obgryzają paznokcie ze złości. Narzucone w Windows Vista przez Microsoft, sztywne ustawienie częstotliwości próbkowania dźwięku niejednego miłośnika krystalicznie czystego brzmienia może doprowadzić do nerwicy. Chcąc wyeliminować jakiekolwiek zniekształcenia w całym torze przenoszenia dźwięku (zarówno cyfrowym, jak i analogowym), najlepiej zacząć od wyeliminowania potrzeby konwertowania częstotliwości próbkowania dźwięku. Korzystając z Windows Vista, może się to okazać okrutnie trudne.

Jedyną odpowiedzią na ten właśnie problem pozostaje interfejs, dotychczas wykorzystywany przede wszystkim w profesjonalnym oprogramowaniu do rejestrowania i obróbki dźwięku - ASIO, który - podobnie jak OpenAL - pod kontrolą Windows Vista może uzyskiwać bezpośredni dostęp do sterownika i samego urządzenia audio.

Creative ALchemy - remedium na Vistę?

Dla graczy oraz użytkowników nie będących przesadnymi purystami dźwiękowymi, całkowite obejście całego stosu audio Windows Vista okazuje się być możliwe. Najbardziej poszkodowani przez najnowszy system operacyjny firmy Microsoft posiadacze kart dźwiękowych Sound Blaster Audigy i X-Fi mają do dyspozycji narzędzie pozwalające omijać wszelkie ograniczenia. Sprzętowa akceleracja przetwarzania dźwięku w grze Far Cry? A może w mało komu znanym, darmowym odtwarzaczu multimedialnym AIMP2?

Creative Labs ma w swoim arsenale broń "przeciwuwsteczniającą" - ALchemy. Jest to projekt, u którego podstawy leży tzw. wrapper OpenAL. Jest to dodatkowe rozszerzenie aplikacji, podszywające się pod systemowy, emulowany w Windows Vista interfejs DirectSound, przejmujące wszelkie polecenia i kierujące je do interfejsu OpenAL. Ten ostatni stanowi pomost pomiędzy aplikacją a kartą dźwiękową. W ten sposób gry i programy korzystające z interfejsów DirectSound i DirectSound3D pod Windows Vista mogą uzyskiwać dostęp do sprzętu (standardowo Windows Vista taki scenariusz całkowicie wyklucza).

W grach korzystających z rozszerzeń EAX, ale oczywiście nie tylko takich, daje nam to wykorzystanie potencjału tkwiącego w naszych kartach dźwiękowych i przerzucenie zadań takich jak na przykład konwersja częstotliwości próbkowania, stosowanie różnego rodzaju efektów dźwiękowych (pogłosów EAX, wirtualizacji dźwięku 3D i innych) na ich barki. Jednocześnie zyskujemy niemal zerowe obciążenie procesora. Kwestia wydajności jest w tej sytuacji raczej poboczna, gdyż stosujemy metodę coś-za-coś. Omijając wbudowany w Windows Vista stos audio zmniejszamy obciążenie procesora (realizującego np. konwersję częstotliwości próbkowania), ale za to uaktywniamy dostępne poprzez interfejs DirectSound(3D) efekty, których sterowaniem tak czy siak zajmuje się procesor - karta dźwiękowa może je ostatecznie realizować. Zysk to zatem przede wszystkim efekty środowiskowe, tłumienie dźwięków czy sprzętowa wirtualizacja dźwięku 3D na słuchawki.

Sam program ALchemy nie jest jednak specjalnie wygodny w użyciu. W trakcie uruchamiania ALchemy sprawdza, jakie gry mamy zainstalowane w Windows Vista i umieszcza na liście te, które standardowo obsługuje. Zestawienie gier obsługiwanych można znaleźć na specjalnej stronie internetowej http://www.soundblaster.com/alchemy/. Co innego jeśli na dysku twardym mamy grę, której Creative Labs oficjalnie nie wspiera lub taką, która na liście obsługiwanych przez ALchemy jest, ale nie została zainstalowana pod kontrolą aktualnie używanej instalacji Windows Vista (na przykład, gdy przeinstalowaliśmy Windows ale nie grę, gdyż tego nie wymaga). W takich sytuacjach musimy ręcznie podać ścieżki do folderów, w których takie gry się znajdują. Być może w przyszłych wersjach ALchemy pojawi się wreszcie słynny przycisk "Przeglądaj".

Gry to jedno, ale czyż nie byłoby lepiej wykorzystać ALchemy do czegoś, do czego pierwotnie stworzony nie był - aplikacji multimedialnych? OpenAL może nam służyć jako pomost pomiędzy kartą dźwiękową a na przykład popularnym programem Winamp! "Po co niby się w to bawić?" - spytacie! Uruchamiamy Winampa pod kontrolą Windows Vista i na karcie Sound Blaster X-Fi uaktywniamy funkcję CMSS-3D Xpand (stereo do wielu kanałów, w naszym przypadku 5.1), X-Fi Crystalizer i EQ. Oto jak na to reaguje procesor:

W trakcie słuchania muzyki obciążenie CPU może być dość zróżnicowane. Zależnie od konfiguracji, zakres może sięgać od kilku do nawet kilkunastu procent! I to tylko na jedną, dwukanałową "empetrójkę". Moc obliczeniową CPU oraz przepustowość pamięci RAM pochłaniają między innymi procesy zwielokrotniania kanałów (CMSS-3D), programowej konwersji częstotliwości próbkowania (ewentualnie także rozdzielczości). Im szybszy procesor posiadamy, tym mniejszy wpływ będzie miał cały proces na dostępną moc obliczeniową CPU. Można jednak to samo realizować tak:

Dzięki ALchemy wszystkie operacje przetwarzania dźwięku przechodzą na kartę dźwiękową, co skutkuje zmniejszeniem obciążenia CPU niemal do zera! Procedura obsługi ALchemy jest w przypadku programów multimedialnych taka sama, jak w przypadku gier. Wystarczy, że wpiszemy ścieżkę do folderu, w którym znajduje się plik wykonywalny aplikacji i gotowe. Aby upewnić się, czy przekierowanie działa, wystarczy uruchomić Menedżer zadań i w zakładce "Procesy" sprawdzić, czy z chwilą uruchomienia odtwarzania muzyki (lub filmu) użycie CPU oraz pamięci RAM procesu "audiodg.exe" pozostaje niezmienione.

Jedyny problem tkwi w konieczności przełączenia sterowników karty Sound Blaster X-Fi w tryb gier (Game Mode) - nie dotyczy to kart serii Audigy. Jeśli spróbujemy kombinacji "program multimedialny (np. Winamp)" + ALchemy + Tryb Rozrywki (Entertainment Mode), to program może błędnie wskazywać obecność akceleracji sprzętowej, podczas gdy ta nie będzie działać. Na to także jest sposób, ale wymaga on skorzystania z jednego pliku (dsound.dll), z nielegalnej wersji ALchemy dla kart Audigy. Można ją znaleźć w sieci, ale nie podamy Wam, skąd ją ściągnąć ;-)

Integry kontra karty, czyli "Neverending story"

Jeśli mówimy o PC Audio, to jest jeden problem, którego nie sposób rozstrzygnąć. Od lat toczy się batalia pomiędzy producentami chipsetów płyt głównych ze zintegrowanymi kontrolerami dźwięku, a producentami kart rozszerzeń (ISA, PCI, PCI Express). Od czasu gdy w połowie lat dziewięćdziesiątych ubiegłego wieku "Onboard Audio" rozpoczęło swój marsz do zwycięstwa, z rynku kart dźwiękowych jeden po drugim znikali kolejni producenci. Pod koniec 1998 roku na płyty główne trafiła nawet specjalnie przeprojektowana wersja układów Aureal Vortex, jednakże bez większych sukcesów. Później swoich sił próbowała konkurencyjna firma Creative Labs, z kontrolerami Sound Blaster Live! 24-bit, które jeszcze nie tak dawno temu mocno promował znany producent płyt glównych, firma MSI.

Obecnie zintegrowany dźwięk występuje w praktycznie wszystkich komputerach domowych i używanych w biurach. Bardzo trudno bowiem o płytę główną, która nie ma zintegrowanego kontrolera dźwięku. Z czego to wynika? Na pewno nie z tego, że producenci płyt głównych mają taki kaprys. Za taki stan rzeczy odpowiadają przede wszystkim producenci chipsetów. Pomijając rozwiązania serwerowe, nie produkuje się dziś chipsetów pozbawionych zintegrowanych kontrolerów dźwięku. Jeśli zatem producent płyty głównej jest zmuszony do zakupu takiego układu, to automatycznie jest w pewnym sensie zobligowany do umieszczenia na swoim produkcie przetwornika DAC/ADC, co w efekcie daje nam typowe "Onboard audio".

Zintegrowany kontroler dźwięku pod względem funkcjonalności niewiele różni się od karty dźwiękowej. Oczywiście zasób możliwości konkretnych rozwiązań zależy wyłącznie od producenta chipsetu czy przetwornika (tzw. "kodeka"). Karty, jak i integry mogą oferować wirtualizację dźwięku przestrzennego, korekcję pasma (EQ), sprzętowe wsparcie DirectSound i DirectSound3D, rozszerzenia środowiskowe, jak np. EAX i wiele innych możliwości. Z tą jednak różnicą, że w przypadku zintegrowanych na płytach kontrolerów dźwieku efekty typu EAX realizowane są programowo, a karty dźwiękowe przetwarzają te efekty sprzętowo. W przypadku tych ostatnich wpływa to więc na niższe obciążenie procesora, a co za tym idzie, nieco wyższą wydajność w grach.

Kontrolery zintegrowane z kartami w większości przypadków nie mogą konkurować także pod względem jakości generowanego dźwięku. Nawet dość przeciętna karta dźwiękowa zapewni lepszą jakość niż przeciętny "kodek" na płycie głównej. Tutaj jednak nie wolno generalizować, bo zdarzają się wyjątki. Kontrolery zintegrowane na swoją obronę mają trzy kwestie:

Ogromna większość płyt głównych wykorzystuje bardzo tanie i kiepskiej jakości przetworniki firmy Realtek. Niezależnie od modelu, uchodzą one za jakościowo nienajlepsze, choć ostatnie modele (np. ALC889) cechuje zauważalna poprawa brzmienia. Znacznie lepsze układy oferowane przez firmy takie jak IDT (wcześniej pod marką Sigmatel) czy Analog Devices (np. AD1988B) niestety nie są zbyt popularne. Z jednej strony zapewniają znacznie lepsze wrażenia odsłuchowe ("kodeki" Sigmatel przez długi czas stosowane były m.in. na kartach Creative Labs Sound Blaster!), z drugiej natomiast są oczywiście troszkę droższe od układów Realtek.
Koszt zakupu nowej karty dźwiękowej (na co najmniej przyzwoitym poziomie) to obecnie minimum około 150-200 złotych. Koszt kontrolera zintegrowanego na płycie głównej nie przekracza około 10-15 złotych. Jest to ponad dziesięciokrotnie mniej! Wielu zaciekłych przeciwników Onboard Audio uparcie o tym fakcie zapomina. Jeśli zależy nam na możliwie jak najwyższej jakości dźwięku (to już wydatek minimum na poziomie 300-350 złotych), musimy liczyć się ze sporym wydatkiem. Jeśli natomiast zależy nam na jak największych oszczędnościach, to żadna karta dźwiękowa z zakresu poniżej około 100 złotych nie będzie dziś bardziej opłacalna w zakupie niż używanie integry, którą i tak już mamy jako chciany lub niechciany "gratis".
Co by nie mówić, stosowane do dziś kodeki na płytach głównych z pewnością nie mogą równać się z jakością dźwięku większości kart firm Creative Labs, Auzentech czy Audiotrak. Jest to absolutnie niepodważalny fakt i basta. Otwartym pozostaje pytanie: kto, na czym i jak usłyszy różnicę? To już nie jest aż tak jednoznaczne. Dla melomanów czy, wybaczcie zwrot, natarczywych audiofilów wszelka integra nie wchodzi w grę. Ale czy przeciętny Kowalski, niezależnie od tego czy więcej gra, słucha muzyki, ogląda filmy, czy plotkuje na Skype, powinien od razu kupować kartę dźwiękową? Jeśli korzystamy z niedrogich zestawów głośników komputerowych (w zakresie cenowym poniżej około 250-300 złotych), obecnie produkowane integry HD Audio względem kart dźwiękowych tracą niewiele. Pewna część użytkowników może w ogóle nie być w stanie określić różnic.

Dobre karty dźwiękowe swoje pazurki pokazują dopiero przy użyciu naprawdę porządnych głośników. Dlatego też doborem kontrolera dźwięku do głośników sterują te same zasady, co doborem np. karty graficznej do procesora. W tym drugim przypadku nie ma sensu kupować superwydajnej karty graficznej do słabego procesora (lub na odwrót) i liczyć na to, że w grach uzyskamy wysoką wydajność i jeszcze nam się taki zakup opłaci. W takich sytuacjach jedno urządzenie będzie hamować wydajność i skutecznie obniżać wartość użytkową drugiego. Z dźwiękiem jest dokładnie tak samo! Nie ma sensu do integry kupować głośników za 300 złotych lub droższych. Nie ma też sensu kupować karty dźwiękowej za 300 (lub więcej) złotych do głośników (5.1/7.1) za mniej niż 300 złotych lub najtańszych zestawów Stereo.

Co nam bowiem po ogromnym napisie "100+ dB SNR" na pudełku karty dźwiękowej, jeśli wzmacniacz w głośnikach będzie cechował się SNR na poziomie mniejszym niż 100 dB? Tor dźwięku z karty dźwiękowej będzie zaszumiony w bardzo małym stopniu tylko po to, aby zaszumiły go same głośniki. Wielu producentów (zwłaszcza taniej "chińszczyzny") nie podaje poziomu szumów generowanych przez wzmacniacze swoich zestawów głośników. Niemała część zestawów głośników 5.1, nawet kosztujących około 300-400 złotych we własnych wzmacniaczach ma większe zaszumienie toru analogowego niż niejedna, nawet niskich lotów integra!

Podobnie sytuacja wygląda jeśli pod uwagę weźmiemy słuchawki. Droższe konstrukcje oczywiście szybko "wyciągną" z integry jej słabe strony, czyli ewentualny szum lub nienajlepszą dynamikę dźwięku. Tutaj zasada doboru jest taka sama, jak w przypadku głośników. Słuchawki Stereo za mniej niż 100 złotych wcale nie potrzebują karty dźwiękowej sporo droższej od nich samych. Czy to do grania, czy do oglądania filmów, słuchania muzyki, czy wręcz pogaduszek głosowych przez sieć, integra wystarczy w zupełności. Profanacją będzie oczywiście zakup słuchawek za 30 złotych, używanie ich nawet z integrą HD Audio i upajanie się świadomością słuchania muzyki w High Definition.

Oczywiście dokładnych granic opłacalności w obu tych przypadkach nie da się obiektywnie wyznaczyć. Trudno bowiem jednoznacznie stwierdzić, czy np. głośniki Creative Inspire T6100 będą lepiej grały z integrą typu Realtek ALC882, czy z kartą Sound Blaster Audigy 2 ZS. Oczywiście z kartą nie będą grały gorzej. Z organoleptycznym określeniem, czy lepiej i jednocześnie opłacalnie, będzie już problem. Wszystko zależy bowiem od naszych wymagań i upodobań.

Co odróżnia przeciętną kartę dźwiękową od przeciętnego kontrolera zintegrowanego, ale pod względem funkcjonalności? Na dziś dzień stosunkowo niewiele. Funkcjonalność obu rozwiązań zależy przede wszystkim od woli producentów. Tania karta dźwiękowa nie oferuje większych możliwości, niż układ zintegrowany. Teoretycznie nie istnieją żadne techniczne przeszkody, aby kontrolery zintegrowane mogły oferować taki sam bądź wręcz większy wachlarz możliwości. W praktyce jednak o wszystkim decyduje przede wszystkim cena takiego kontrolera dla klienta końcowego. W efekcie kontrolery zintegrowane w chipsetach płyt głównych zapewniają tylko podstawową obróbkę dźwięku, zaś wszelkie dodatkowe efekty (typu efekty środowiskowe EAX, a więc pogłos, echo itp.) realizowane są programowo - przez procesor komputera. Na kartach dźwiękowych znajdziemy natomiast sprzętowe procesory audio, wyposażone w wydajne procesory DSP, zdolne do przetwarzania efektów dodatkowych na poziomie sprzętowym, odciążając przy tym CPU. Ponadto ze względów licencyjnych kontrolery zintegrowane udostępniają rozszerzenia EAX najwyżej do wersji 2.0, podczas gdy niektóre karty dźwiękowe udostepniają efekty EAX Advanced HD. Niestety podziwiać je możemy w nielicznych tytułach (np. F.E.A.R., Prey, Doom 3, Battlefield 2 czy Battlefield 2142).

Karty dźwiękowe i kontrolery zintegrowane łączy sprzętowe wsparcie dwóch najistotniejszych rozwiązań w dziedzinie komputerowego dźwięku: Microsoft DirectSound i DirectSound3D. Istnieją między nimi także inne cechy wspólne: korekcja pasma, symulacja dźwięku wielokanałowego, wirtualizacja dźwięku przestrzennego na słuchawki i inne "ulepszacze" dźwięku.

Najbardziej "sprzętowe" (do typowych zastosowań) karty dźwiękowe, czyli seria Sound Blaster Audigy i X-Fi firmy Creative Labs graczom, melomanom oraz miłośnikom filmów oferują rozwiązania np. takie jak CMSS-3D (Creative Multi Speaker System), X-Fi Crystalizer czy THX Console. CMSS-3D odpowiada za "uprzestrzennianie" dźwięku na słuchawkach oraz zestawach głośników. Crystalizer według producenta ma poprawiać jakość dźwięku, a THX Console pozwala dokładnie dostosować ustawienia kanałów dźwiękowych tak, aby jak najwierniej odwzorować scenę akustyczną w różnych warunkach. Powszechnie panującym (nieprzypadkowym) nieporozumieniem jest przeświadczenie, że w kwestiach takich jak np. dźwięk przestrzenny w grach, czy rozwiązań takich jak X-Fi Crystalizer, karty Sound Blaster są bezkonkurencyjne. Oprócz nich od dawna istnieją ich odpowiedniki. Wśród nich znajdziemy technologie przetwarzania dźwięku m.in. Dolby Laboratories oraz QSound Labs. Przyjrzymy się zatem najważniejszym z punktu widzenia użytkownika "ulepszaczom" dźwięku.

Dźwięk 3D w grach

Jednym z najważniejszych elementów określającym wartość użytkową kontrolera/karty dźwiękowej dla gracza jest to, jak radzi sobie z przetwarzaniem trójwymiarowego dźwięku. Po dziś dzień jest to problem narastający od lat, w wyniku działania dwóch niekorzystnych czynników:

Brak jednolitego, otwartego standardu
Stosowanie systemów przetwarzania w samych grach

Czasy raczkowania pozycjonowania dźwięku w grach sięgają jeszcze początku lat dziewięćdziesiątych ubiegłego wieku. Być może starsi czytelnicy trochę się zdziwią, ale jedną z pierwszych gier, w których zastosowano prymitywne metody uzyskania dźwięku 3D był... Doom! Ta pierwsza, poważna strzelanka FPP korzystała z monofonicznych (jednokanałowych) próbek dźwięków, ale przetwarzała je w systemie stereo. Aby zwiększyć doznania graczy, firma id Software opracowała specjalne algorytmy "modelowania" dźwięków, których podstawowym elementem była lokalizacja źródła. Nie stosowano wtedy żadnych technologii znanych nam dziś, a więc określenie tej metody mianem prymitywnej ma swoje podstawy, mimo że efekty jej działania w tamtych czasach trzeba uznać za zalążek nadchodzącej rewolucji.

W Doom zastosowano sprytną manipulację poprzez rozbijanie monofonicznych próbek dźwięku na dwie nowe (stereo). Trik tkwił w regulowaniu balansu kanałów próbek, które pierwotnie były jednokanałowe. W ten sposób gracz mógł dość "precyzyjnie" określić pozycję przeciwników. Wadą tej metody był brak możliwości zastosowania algorytmów pozwalających na określenie wysokości i odległości, w jakiej znajduje się źródło. Dodatkowo niemożliwym było określenie, kiedy dźwięk dochodził z tyłu. Nie był to zatem taki "prawdziwy" dźwięk trójwmiarowy, a na pewno nie taki, jaki znamy dziś. Tak naprawdę, niezależnie od odczuć gracza, dźwięk w Doom był dwuwymiarowy.

Rozwinięciem technologii zastosowanej w Doom było dodanie filtrowania pasma próbek dźwięków w grze Quake. Poprzez "obcinanie" najwyższych rejestrów emulowano dźwięki dochodzące zza postaci gracza. Niska wydajność procesorów w tamtych czasach zmusiła id Software do delikatnego podejścia do tej kwestii. Skutek był taki, że dźwięki "z tyłu", poza ogólnie niższą jakością, niewiele różniły się od tych, które swoje źródła miały z przodu gracza.

Obecnie dźwięk 3D w grach uzyskiwany jest poprzez odpowiednią manipulację głośnością, balansem, barwą i rewerbacją dźwięków. W efekcie ma to umożliwić słuchaczowi rozróżnienie różnych dźwięków i określenie pozycji ich źródeł. Bardzo ważnym elementem decydującym o skuteczności pozycjonowania dźwięków są filtry HRTF.

Filtry HRTF odpowiadają za filtrowanie fali dźwięku w oparciu o parametry określające jej częstotliwość i lokalizację źródła. Filtrowanie polega na przetworzeniu właściwości dźwięku tak, aby wiernie odwzorować sposób, w jaki ludzkie ucho i mózg wirtualnie lokalizują źródła dźwięków. Trik tkwi w naśladowaniu percepcji słuchowej człowieka, której bardzo ważnymi elementami jest budowa głowy, małżowiny usznej i torsu. Musimy zdać sobie sprawę z tego, że dźwięki, które słyszymy nie docierają tylko "z powietrzem" do wnętrza uszu. Bardzo istotne znaczenie dla naszego słuchu ma tzw. słyszenie kostne. Ludzki mózg posiada zdolność określania lokalizacji źródła dźwięku przede wszystkim właśnie na podstawie analiz zmian barw dźwięku wywoływanych przez układ kostny. Istotnym elementem określającym lokalizację źródła jest także natężenie i opóźnienie dźwięków docierających do pary uszu.

Filtry HRTF w działaniu mają jedną, bardzo istotną wadę. Aby słuchacz mógł naprawdę precyzyjnie określić dokładną lokalizację źródła dźwięku, owo źródło musi być w ruchu. Ludzki mózg potrzebuje choćby drobnego ruchu źródła aby móc przeanalizować zmiany barwy dźwięku i określić jego pozycję. Producenci tanich kontrolerów dźwięku sprytnie ten problem starają się rozmyć. Dostępne zazwyczaj wewnątrz oprogramowania konfiguracyjnego aplikacje demonstrujące możliwości filtrów HRTF (np. w integrach Realtek czy C-Media) domyślnie dokonują tego poprzez odtwarzanie jednego dźwięku będącego cały czas w ruchu (np. dookoła wirtualnego słuchacza). Wystarczy, że ruch wstrzymamy i ten piękny wirtualny świat przysłoni mgła. Lokalizacja źródła dźwięku będzie już znacznie trudniejsza. Jeśli mielibyśmy możliwość użycia własnych dźwięków, pogorszyłoby to wizerunek producentów jeszcze bardziej, gdyż dźwięków, które nam udostępniają podświadomie "uczymy się na pamięć".

Nie zmienia to faktu, że stosowanie filtrów HRTF to obecnie najpopularniejsza metoda na uzyskanie zadowalających rezultatów, przede wszystkim w grach, gdzie rzadko kiedy mamy do czynienia ze stale nieruchomymi źródłami dźwięków.

Pozostało nam jeszcze podjęcie ważnej kwestii, a mianowicie jak to działa w praktyce? Jak wynika z naszych obserwacji, niemal wszyscy użytkownicy komputerów mają błędne pojęcie o tym, jak dźwięk obiektu znajdującego się na wirtualnej scenie w grze jest przenoszony na słuchawki. Powszechnie panującą odpowiedzią jest mniej więcej (w uproszczeniu): Karta dźwiękowa otrzymuje od gry informację nt. dokładnej lokalizacji źródła, a sprzęt filtruje dźwięk odwzorowując ją w naszym odbiorze.

Takie pojmowanie przetwarzania dźwięku dookolnego na słuchawki nie jest w pełni poprawne. Niestety w jego wytworzeniu swój udział mieli i mają producenci kart dźwiękowych. W rzeczywistości wirtualna scena akustyczna dzielona jest na obszary-kanały (zazwyczaj siedem - liczba nawiązuje do zestawów głośników 7.1) - patrz obrazek poniżej. Już na poziomie gry następuje wstępne miksowanie, w trakcie którego każde ze źródeł dźwięku jest przenoszone przez odpowiedni kanał. Mikser karty dźwiękowej nie otrzymuje dokładnej lokalizacji źródła, a jedynie dźwięki już "umiejscowione" w poszczególnych kanałach. Dźwięki te mogą oczywiście przenikać pomiędzy kanałami, jeśli na przykład znajdą się blisko granic pomiędzy nimi. W procesie przenikania nie działają żadne opóźnienia, tylko regulacja głośności.

Jeśli źródło dźwięku znajduje się na przykład na granicy kanałów 2 i 4, ale jednak w obszarze zasięgu kanału 4, to w tym ostatnim będzie odtworzony z naturalną głośnością. W kanale drugim natomiast będzie wyciszony. Im bliżej mu będzie do granicy pomiędzy tymi kanałami, tym mniejsza będzie różnica poziomów głośności.

Karta dźwiękowa, a dokładnie jej mikser otrzymuje zatem do przetworzenia dźwięk w takiej postaci, w jakiej otrzymuje go np. z filmów DVD-Video, z dźwiękiem wielokanałowym - wstępnie przetworzony. Dlatego też efekty takie jak np. Creative CMSS-3D czy Dolby Headphone określamy mianem Post-processing, czyli przetwarzania gotowych materiałów.

Podstawowym interfejsem programowania wspomagającym implementację dźwięku 3D w grach, jak już pisaliśmy wcześniej, jest DirectSound3D firmy Microsoft. Jego zaletą jest możliwość stosowania doń nakładek rozszerzających możliwości o te, które oferują niektóre kontrolery dźwięku. Mogą one rozszerzać możliwości API lub zastępować niektóre z nich. Wśród owych nakładek do dyspozycji mamy:

Creative EAX (Environmental Audio Extensions)
QSound Q3D Interactive
Sensaura 3DPA (3D Positional Audio)

Creative EAX

EAX, wprowadzony wraz z kartami Sound Blaster Live! w 1998 roku, jest de facto standardem, niejako obowiązującym wszystkim producentów kontrolerów dźwięku. Jego nazwę kojarzymy lub dobrze znamy chyba wszyscy. Mało która poważna gra nie korzysta z jego dobrodziejstw. Jego powszechne pojmowanie jest niestety mylne. Przytłaczająca większość typowych graczy przeświadczona jest, że EAX jest standardem dźwięku 3D - pozycjonowania dźwięków. W rzeczywistości EAX wzbogaca jedynie dźwięk o efekty rewerbacji (echa). Środowiskowe rozszerzenia dźwięku (z ang. Environmental Audio Extensions) początkowo zawierały definicje 26 różnych środowisk (np. łazienki, gór, miejskiej ulicy, korytarzy itd.). Każde z tych środowisk to zestaw filtrów odpowiadających za nałożenie na odtwarzane dźwięki echa (pogłosu) takiego, jakie usłyszelibyśmy w naturalnym środowisku. Tak naprawdę EAX z pozycjonowaniem dźwięku niewiele ma wspólnego. Pierwsze wydanie EAX nie obejmowało nawet czegoś takiego jak pozycja słuchacza czy źródła. Te elementy w EAX w ogóle nie istniały.

Druga odsłona (EAX 2.0) wzbogaciła rozszerzenia firmy Creative Labs o możliwość symulowania przeszkód na drodze dźwięku. W ten sposób za pomocą wykluczenia (occlusion) i zasłaniania (obstruction) możliwe było przetworzenie dźwięku tak, aby zachowywał się jak dźwięk dochodzący np. zza ściany czy z innego pomieszczenia. Dodatkowo efekty rewerbacji wzbogacono o możliwość ich programowania, w zależności od odległości dzielącej źródło dźwięku i słuchacza. Dodano także nowy parametr, czyli filtrowanie dźwięku z uwzględnieniem gęstości powietrza (pochłanianie).

Kolejne wersje EAX (od wersji 3.0 nazwane EAX Advanced HD) wprowadzały głównie kosmetyczne zmiany i rozwijały istniejące już funkcje. Pojawiła się możliwość stosowania do czterech efektów środowiskowych jednocześnie (wersja 4.0), wprowadzono Environment Morphing, czyli płynne przechodzenie z jednego efektu rewerbacji do drugiego (wersja 3.0). EAX Advanced HD 3.0 wprowadza także Environment Panning - pozycjonowanie pogłosu w przestrzeni wraz ze źródłem dźwięków, od których pochodzi. Innymi słowy, pogłosy stają się kolejnymi buforami, którymi z poziomu DirectSound3D (lub OpenAL) układ dźwiękowy może manipulować tak samo jak buforami będącymi źródłami dźwięków. Jeszcze prościej? Pogłos "przyklejany" jest do wirtualnych źródeł dźwięków i pozycjonowany w grupach, razem z nimi. Prościej już się nie da :-).

EAX Advanced HD 4.0 był kolejnym krokiem w rozwoju standardu. Względem wersji 3.0 ma dwa ulepszenia. Multi-Environments, czyli możliwość generowania aż czterech środowisk jednocześnie na pierwszy rzut oka wydawał się mało praktycznym dodatkiem. Dopiero gry takie jak na przykład Unreal Tournament 2004 czy Battlefield 2 i inne "strzelanki" pozwalają docenić generowanie kilku efektów środowiskowych jednocześnie. Prosty przykład: jesteśmy w długim holu, czatując na przeciwników. Po obu stronach mamy wejścia do różnych pomieszczeń lub ew. na otwartą przestrzeń. Poruszając się po korytarzu słyszymy odpowiedni pogłos naszych kroków. Jeśli przeciwnicy będą np. na zewnątrz budynku, to odgłosy ich strzałów i kroków będą miały pogłos zupełnie inny. Jeśli będą w jakimś pomieszczeniu, o konkretnych właściwościach akustycznych (np. w szybie wentylacyjnym lub w dużym magazynie czy hangarze), to pogłosy ulegną zmianom.

ExtendedFX to drugie novum w czwartym wydaniu EAX. Jest to zestaw zupełnie nowych filtrów (np. Flanger, Pitch Shitfer, Wah Wah, Automatic Gain Control, Distortion, Vocal Morpher, Ring Modulator i inne). Dzięki nim karty dźwiękowe Sound Blaster Audigy i nowsze mogą w czasie rzeczywistym przekształcać dowolne dźwięki w sposób określony przez programistów (twórców gier). Efekty, jakie można uzyskać to na przykład przekształcanie naturalnego głosu ludzkiego w głos pochodzący z krótkofalówki czy telefonu. Dodatkowo za pomocą filtra Pitch Shifter możliwa jest nawet zmiana nisko brzmiącego głosu męskiego w piskliwy głos dziecka i na odwrót. I to wszystko w czasie rzeczywistym!

Możliwości jest całe multum, choć programiści bardzo rzadko z ExtendedFX korzystają i umieszczają w grach wstępnie przetworzone dźwięki. Dlaczego? Dlatego że dla ułamka ogólnej liczby graczy nie opłaca im się dostarczać w grach dwóch zestawów dźwięków. Ogromna większość kontrolerów dźwięku to integry i karty inne niż Sound Blaster serii Audigy i X-Fi. ExtendedFX jest zatem bardzo ciekawym rozwiązaniem, jednakże pogrzebanym przez zamknięcie (dla siebie) standardu EAX Advanced HD przez firmę Creative Labs i nie sprzedawanie nań licencji innym firmom.

EAX Advanced HD 5.0 dostępny dla kart Sound Blaster X-Fi pod względem technologicznym niesie ze sobą niewiele innowacji. Wprowadzenie obsługi 128 buforów (głosów) to co prawda dwa razy więcej niż w przypadku całej linii Audigy, ale liczba głosów tak naprawdę z numerem przy nazwie EAX Advanced HD nie ma absolutnie nic wspólnego. Obecnie układy C-Media CMI8788, podobnie jak Sound Blaster X-Fi, przetwarzają 128 głosów, a obsługują EAX "zaledwie" w wersji 2.0.

EAX Voice to funkcja przetwarzania dźwięku rejestrowanego ze źródła analogowego (mikrofonu). Nasz głos zamieniany jest na bufor strumieniowy i podobnie jak miało to miejsce w przypadku Environment Panning, jest "przyklejany" do pozycji naszej postaci w grze. W ten sposób dla głosu z mikrofonu stosowany jest efekt środowiskowy aktualnie przypisany do otoczenia gracza. Pamiętajmy, że w ten sposób liczba dostępnych efektów środowiskowych w grze maleje z czterech do trzech. Jeden z nich bowiem będzie przeznaczony dla funkcji EAX Voice.

Kolejną nowością jest PurePath - rozszerzenie umożliwiające programistom przydzielenie wybranym głosom (dźwiękom) konkretnego głośnika tak, aby te były przenoszone tylko przez niego. W głównej mierze Creative Labs kładzie tutaj nacisk na głośnik niskotonowy (subwoofer). Według firmy w grach do głośnika basowego powinny być przenoszone tylko wybrane przez programistów dźwięki tak, aby nie przepuszczać ich np. przez "satelity", które z przyczyn technicznych dźwięki o niskich częstotliwościach przenoszą słabo. Wszystko byłoby nawet w porządku, gdyby nie zastanowić się nad tym przez chwilę. Praktycznie wszystkie wielokanałowe karty dźwiękowe mają wbudowane funkcje LFE Crossover (czasami określane np. jako Bass Management), odpowiadające za odcinanie najniższych częstotliwości z pasma dźwięku i przekazywanie ich do subwoofera. W ten sposób satelitki przekazują środek pasma i częstotliwości najwyższe, a subwoofer zajmuje się basami.

MacroFX to nowość w EAX, ale żadna nowość dla świata komputerów. Technologię tą kilka lat temu opracowała firma Sensaura, a spotkać ją można do dziś praktycznie we wszystkich kartach dźwiękowych opartych na układach firmy C-Media, od modelu CMI 8738 począwszy. MacroFX manipulując parametrami źródeł dźwięków w przestrzeni reguluje przenikanie ich pomiędzy kanałami dla tych buforów, które znajdą się w bardzo małej odległości od pozycji słuchacza. W praktyce MacroFX wzmacnia realizm odczuwania dźwięków z obiektów, na przykład przelatujących wprost koło naszych wirtualnych uszu (np. odgłosy pocisków rakietowych, strzał).

Environment FlexiFX znosi pewne ograniczenia poprzednich edycji EAX. Jak już wcześniej pisaliśmy, wraz z EAX Advanced HD 4.0 do grupy definicji środowiskowych dołączyły nowe efekty DSP (ExtendedFX). Korzystanie z nich wymagało użycia jednego z czterech dostępnych "slotów" na efekty DSP. Pierwsze dwa sloty na stałe zajęte były przez pogłos (chorus) i echo (reverb). Nawet jeśli w danym momencie gry nie były one potrzebne, cały czas zajmowały dwa sloty. FlexiFX umożliwia podmianę ich na inne efekty.

Environment Occlusion - wykluczanie środowiska działa tak samo jak Voice occlusion, o którym pisaliśmy wcześniej. Jeśli obiekt ukryty jest na przykład za ścianą, to dźwięki przezeń generowane będą przefiltrowane tak, aby brzmiały jak dźwięki zza rzeczywistej ściany. Environment occlusion robi dokładnie to samo, ale z efektem środowiskowym. Skutkiem jego działania jest wytłumianie "ścienne" nie tylko głosów postaci, ale także pogłosów i echa. Funkcja ta tak naprawdę powinna była pojawić się już w EAX Advanced HD 3.0 (wraz z Environment Panning).

Następna strona Karty dźwiękowe i zintegrowane układy audio bez tajemnic część 2

Piotr Gontarczyk

Źródło:

Piotr Gontarczyk

Tematy: Creative, Asus, Razer, Audio, Sound Blaster