Dźwięk i obraz
Zarówno wielkie, jak i małe firmy, a także naukowcy mają coraz więcej do powiedzenia w tych dziedzinach dzięki łatwości dostępu do mocy obliczeniowej i wiedzy. Przyjrzyjmy się zatem projektom doskonalonym przez gigantów branży IT i mniejszych graczy. Google to jeden z liderów, którzy pchają do przodu nowoczesną technologię. Swoje rozwiązania na szczęście przeznacza dla konsumentów, dzięki czemu codzienność może stać się łatwiejsza i ciekawsza. Wśród wielkich projektów, które trwają i mają się dobrze, jest między innymi Megenta. W skrócie projekt ten można nazwać sztuczną inteligencją, która uczy się na podstawie próbek audio, a następnie generuje własne dzieła.
Wszystko zaczęło się od muzyki, lecz firma nie zamierza na tym skończyć. W planach jest również kreowanie sztuki wizualnej, czyli wideo. Jak większość przeznaczonych dla konsumentów projektów, Megenta również zasilana jest przez Google’owy zestaw narzędzi TensorFlow. Dystrybuowana natomiast jest jako biblioteka Pythona. Możemy w niej znaleźć narzędzia, które pozwalają na manipulowanie danymi źródłowymi, czyli między innymi obrazami i muzyką.
Projekt rozwija się dość dynamicznie i ma na koncie już niejeden skomponowany utwór. Nie jest to wcale zlepek przypadkowych nut, lecz prawdziwa kompozycja, choć prosta, a instrumentem, który można usłyszeć, może być na przykład pianino.
Projekt powstał nie tylko po to, aby kreować sztukę. Jest to duże przedsięwzięcie i Google liczy na to, że w jego trakcie uda mu się stworzyć inteligentne rozwiązania, które będą dopasowywać muzykę do osoby słuchającej, do nastroju czy też do sytuacji, w której ktoś się znajduje.
Jednym z efektów tego projektu jest między innymi NSynth, czyli algorytm, który tworzy nowe dźwięki poprzez manipulowanie falami akustycznymi instrumentów. Algorytm ten został wykorzystany w fizycznym urządzeniu, co pasjonatom muzyki dało ogromne możliwości komponowania nowych utworów i tworzenia nowych dźwięków.
Oprócz tego projektu są także inne narzędzia, mniejsze, lecz również mające duży wpływ na rynek muzyczny, wiele jest dostępnych za darmo w ramach repozytorium GitHub. Warto szczególnie wyróżnić sztuczną inteligencję, która potrafi generować jazz. Mam na myśli projekt DeepJazz oparty na bibliotekach do głębokiego uczenia Keras oraz Theano. Kilka skomponowanych w ten sposób utworów można usłyszeć pod TYM ADRESEM.
Kreowanie muzyki za pomocą programów komputerowych można sobie wyobrazić, ale z innymi dziedzinami sztuki jest trudniej. Mamy jednak dobrych naukowców, których pasje pozwalają na tworzenie naprawdę ciekawych projektów, takich jak na przykład użycie komputera do namalowania portretu osoby, która tak naprawdę nie istnieje, lecz jest wytworem maszyny.
Mowa tu o technice, która nosi nazwę Generative Adversarial Networks (GAN). Algorytmy tego typu pozwalają na generowanie takich treści, jak wspomniany portret Edmonda de Belamy. Jest to sytuacja, która bardzo mocno wpływa na to, co się dzieje na rynkach technologii światowej. Tak wielki krok do przodu zawdzięczamy zespołowi, któremu przewodniczył Ian Goodfellow. W 2014 roku stworzyli oni pierwszy teoretyczny zapis GAN i projekt zaczął się rozwijać. Można go porównywać do wyników, jakie pozwala osiągnąć transfer stylu, jednak ten system działa na innej zasadzie. Transfer stylu daje powtarzalne wyniki, które są generowane na podstawie danych bazowych (treningowych), natomiast GAN to jeden z tych algorytmów, który uczy się i w końcu samodzielnie może wygenerować nowe obrazy. Oczywiście nie należy przyjmować, że będzie to wytwór wyobraźni maszyny, ponieważ maszyna nie ma wyobraźni. GAN musi zostać nakarmiony przez twórcę danymi, aby mieć podstawy do wygenerowania obrazu. Wątpliwe, aby mógł stworzyć coś, czego wcześniej nie „widział”.

Działanie takich programów jest naprawdę ciekawe, szczególnie dzięki temu, że nie wiadomo, co zostanie stworzone − zawsze jest element zaskoczenia. Jednak nie każdy może sobie pozwolić na to, aby z nich korzystać. A ludzie z natury pragną po prostu tego, co nowe i nietypowe. Dlatego też powstały programy podobne, ale opierające się na nieco innej zasadzie. Pozwalają one na robienie lub edytowanie zdjęć w różnym stylu i wykorzystują transfer stylu. Dziś każdy może przy użyciu aplikacji stworzyć grafikę, która będzie miała cechy konkretnego stylu, nurtu, epoki.
Jednym z projektów, który również zasługuje na wyróżnienie i w którego stworzenie częściowy wkład mieli Polacy, jest Deepart. Jest to program, który na podstawie wgranego obrazu uczy się stylu, w jakim został on namalowany. Rozpoznaje kolory, grubości kresek, ruchy pędzla. Po prostu „uczy się” obrazu. A gdy już go przeanalizuje, może wygenerować zdjęcia w jego stylu. Każdy może sam przekonać się, jak to działa. Wystarczy wejść na stronę twórców projektu − kliknij TUTAJ. Tam w trzech krokach samodzielnie można stworzyć obraz. Wystarczy wgrać zdjęcie, wybrać styl i wygenerować. Jeśli komuś obraz bardzo się spodoba, to może go wydrukować w wysokiej rozdzielczości i ozdobić nim ścianę.
Podobne możliwości w zakresie tworzenia obrazów oraz współpracy między artystą a sztuczną inteligencją oferuje Deep Dream Generator, który jest dostępny pod TYM ADRESEM.

Artyści dostrzegają, co może dać im technologia. Dzięki niej mogą zostać stworzone rzeczy, o których wcześniej można było wyłącznie śnić. Tak też teraz tworzy się za pomocą drukarek 3D dzieła sztuki, które następnie z powodzeniem wystawiane są w galeriach. Dość często do kreowania różnych obrazów, grafik itd. korzysta się z takich urządzeń, jak tablety graficzne, które są specjalnie przystosowane do wykorzystywania w tej dziedzinie. Podobnie będzie ze sztuczną inteligencją.
