Technologie i wydarzenia
Artykuł
Paweł Pilarczyk, Piątek, 19 stycznia 2018, 03:14

Inteligentni asystenci głosowi

Następnym wyróżniającym się trendem na CES 2018 jest wszechobecność inteligentnych asystentów głosowych, takich jak Amazon Alexa, Google Assistant, Microsoft Cortana, Apple Siri i Samsung Bixby. Asystenci głosowi różnią się od zwykłych technik rozpoznawania głosu tym, że wykorzystują algorytmy sztucznej inteligencji i uczenia maszynowego. Nie tylko więc zamieniają głosowe polecenia użytkownika na tekst, ale też analizują następnie ten tekst i starają się wykonywać komendy lub odpowiadać na pytania, nawet jeśli te są zadawane bardzo nieprecyzyjnie. Ponadto kolejne komendy są ze sobą połączone, więc rozmowa z asystentem głosowym nie jest tylko wymianą krótkich komunikatów, ale też coraz bardziej przypomina zwykłą rozmowę między dwojgiem ludzi. Rozmowa może wyglądać na przykład tak:

- Alexa, powiedz mi, jaka jest teraz temperatura w Morzu Czarnym?
- Temperatura Morza Czarnego wynosi teraz 18 stopni.
- A daleko to jest stąd?
- Z Warszawy do Odessy, najbliższej miejscowości, która leży nad Morzem Czarnym, jest 1067 km.
- Ile to jest w milach?
- 1067 km to 663 mile.
- Jak długo bym tam szedł na piechotę?
- Z Warszawy do Odessy można dojść na piechotę w 217 godzin.

Amazon Alexa czy Google Assistant już teraz pozwalają prowadzić takie konwersacje. Co ważne, producenci pozwalają integrować obsługę Alexy czy Assistanta w swoich urządzeniach zupełnie za darmo. Dlatego na CES zaprezentowano mnóstwo głośniczków o przeróżnych kształtach (tzw. smart speaker), które obsługują albo Alexę, albo system Google’a. Według przewidywań analityków w tym roku sprzeda się takich „inteligentnych głośników” dwukrotnie więcej niż w ubiegłym. Nie dziwi to, że producenci wyczuli szansę na potencjalny zarobek i że tak wielu prezentowało swoje „smart speakers” na CES-ie.

Głośnik Mi Smart Speaker

Głośnik Cowin Dida

Głośnik Youmoon

Głośniki Billboard

Ciekawsze są zastosowania inteligentnych asystentów głosowych: od lampek nocnych po... samochody.

LG na swoim stoisku prezentował pralki, lodówki i telewizory, z którymi można rozmawiać – współpracują bowiem z platformą Amazon Alexa.

Z kolei Samsung promuje swój system Bixby, wprowadzony rok temu wraz z Galaxy S8. Bixby działa obecnie w smartfonach S8 i Note8, ale trafi także do telewizorów, lodówek, zmywarek i wielu innych produktów Samsunga. Podczas konferencji prasowej na targach Samsung zapowiedział, że do 2020 roku wszystkie jego produkty będą współpracowały z Bixby (!).

Asystenci głosowi trafią też do samochodów. Producenci najczęściej korzystają z platformy Amazon Alexa. Nissan eksperymentował jeszcze z Cortaną Microsoftu, ale ten zdaje się nieszczególnie zainteresowany rozwijaniem swojej platformy (Microsoft ostatnimi czasy porzucił wiele rewolucyjnych rozwiązań – Kinect i Windows 10 Mobile to jedne z wielu).

W trakcie targów jeździłem prototypem Mercedesa klasy A. Oficjalna prezentacja tego samochodu odbędzie się dopiero za miesiąc w Amsterdamie. Auto wyposażono w zupełnie nowy interfejs użytkownika MBUX (Mercedes-Benz User Experience), także wspomagany przez asystenta głosowego. To platforma w całości stworzona przez Mercedesa i jak zapewniali mnie przedstawiciele firmy, 80 procent funkcji będzie działać bez dostępu do internetu (funkcje rozpoznawania głosu i system sztucznej inteligencji będą przetwarzane już przez komputer pokładowy samochodu – dane nie muszą być wysyłane do internetu). Żeby uruchomić asystenta, nie trzeba nawet wciskać żadnych przycisków na kierownicy. Wystarczy po prostu powiedzieć: „Hej, Mercedes!” (albo po prostu „Mercedes!”), by wybudzić system. Od tej pory będzie on oczekiwał na komendy.

Głosowo można uruchomić dowolną funkcję w samochodzie: światła drogowe, podgrzewanie siedzeń, klimatyzację. Co jednak istotne, system jest „inteligentny”, więc nie trzeba mu wydawać precyzyjnych komend. Do samochodu mówimy w naturalny dla siebie sposób, a komputer odpowiada miłym damskim głosem, że zrozumiał polecenie.

Asystent rozpozna i poprawnie wykona takie komendy, jak: „Włącz podgrzewanie fotela pasażera” (w odpowiedzi usłyszymy: „Włączam podgrzewanie fotela pasażera, drugi stopień”) i „Podnieś temperaturę w samochodzie o dwa stopnie” (komputer odpowie: „Ustawiam temperaturę dla kierowcy i pasażera na 22 stopnie”). Asystent zrozumie także takie mało precyzyjne komendy, jak: „Zimno mi!” (komputer odpowie: „Zwiększam temperaturę o dwa stopnie i włączam podgrzewanie siedzenia kierowcy”) i „Jestem głodny!” (komputer odpowie: „Na ekranie wyświetlam listę restauracji w najbliższej okolicy;  czy masz jakieś preferencje co do jedzenia?”, pobrawszy dynamicznie listę restauracji z platformy Yelp). Kontynuujemy rozmowę: „Zjadłbym coś włoskiego”, a komputer odpowiada: „Wyświetlam listę włoskich restauracji”. Wydajemy następną komendę: „Jedziemy do Trattoria Balsamico”, a komputer na to: „Ustawiam nawigację na restaurację Trattoria Balsamico. Oddalona jest o 2,5 kilometra. Po drodze są roboty drogowe, na miejsce dotrzemy za 7 minut”.

Ocena artykułu:
Ocen: 4
Zaloguj się, by móc oceniać
Artykuły spokrewnione
O autorze
Paweł Pilarczyk
Absolwent Politechniki Warszawskiej, wydziału Elektroniki i Technik Informacyjnych. Od 15 lat pracuje jako dziennikarz.
Ostatnie publikacje:
Facebook
Ostatnio komentowane