Asystent Google dla przeciętnego konsumenta to po prostu możliwość wydawania naturalnym językiem komend głosowych smartfonowi. W rzeczywistości cały cyfrowy ekosystem tej usługi jest znacznie większy i pokrywa w znacznym stopniu coś, co można dziś określić mianem infrastruktury IoT. Jednak zakres dostępnych funkcji i możliwości Asystenta w realizacji różnych działań są ograniczone do czysto biznesowych umów Google'a z partnerami. Rozwój tej usługi zależy też od tego, w jakim stopniu polskojęzyczną wersją Asystenta zainteresują się inne firmy odpowiedzialne za popularne w Polsce usługi cyfrowe. W dniu ogłoszenia dostępności polskiego Asystenta Google poinformowało, że pierwszymi działającymi w Polsce firmami, z którymi można porozmawiać za pośrednictwem uruchomionej przez wyszukiwarkowego potentata usługi, są Play oraz eSky. Z czasem liczba partnerów biznesowych Google'a będzie się zapewne powiększać, co jest o tyle korzystne dla użytkowników, że dzięki temu będą dysponować usługą o większej funkcjonalności. Pamiętajmy jednak, że zarówno dla Google'a, jak i innych firm, które rozważają włączenie swoich rozwiązań i usług w ekosystem cyfrowy Asystenta, istotny jest czynnik biznesowy. Asystent może wydawać się fajny, ale jego funkcjonowanie jest uwarunkowane czynnikami ekonomicznymi − po prostu to musi się opłacać.
Asystent Google a Alexa, Siri i Cortana
Dlaczego Polacy najpierw otrzymali dostęp do zlokalizowanej wersji właśnie Asystenta Google? Odpowiedź jest prosta: Google bardzo dużo wie już o Polsce i Polakach. Oczywiście osoby używające sprzętu Apple już od dłuższego czasu mogą również w Polsce korzystać z Siri, tyle że asystent Apple, po pierwsze, nie rozumie polskiego, a po drugie, jest w naszym kraju wyjątkowo mało przydatny. Brakuje mu wiedzy o otoczeniu. To kluczowy czynnik decydujący o tym, czy w ogóle jest sens wdrażania sztucznej inteligencji w danym rejonie. Doskonale wie o tym Microsoft, który − choć nie mówi tego wprost − nie zamierza wprowadzić Cortany w polskojęzycznej wersji. Dlaczego? Bo miliony internautów w Polsce wolą Google od Binga. Zresztą zdaje sobie z tego sprawę Google, które w oficjalnym komunikacie dotyczącym uruchomienia polskojęzycznego Asystenta wyjaśnia:
„Prace nad przygotowaniem polskiej wersji Asystenta trwały ponad rok i uczestniczyły w nich zespoły z wielu krajów, m.in. Polski, Stanów Zjednoczonych, Londynu czy Szwajcarii. W zamkniętych, zewnętrznych testach produktu wzięło udział ponad 2000 wybranych beta testerów, a zebrane od nich uwagi pozwoliły na dostosowanie i ulepszenie usługi pod kątem specyfiki języka polskiego i zachowań polskich odbiorców".
Aby jakiekolwiek rozwiązanie z zakresu sztucznej inteligencji „rozumiało” użytkownika z określonego kręgu językowego i kulturowego, system musi „wiedzieć” dużo nie tylko o samym języku i jego niuansach, ale również o kulturze danego kraju, zwyczajach mieszkańców, usługach, z jakich korzystają itp. Jak twierdzą przedstawiciele Google'a:
„Asystent Google zyskał też polską osobowość. Zna elementy polskiej kultury i lokalne zwyczaje. Można zapytać go na przykład o informacje związane z polskimi dziełami: kto grał w Zimnej wojnie lub kto napisał Pana Tadeusza, odnieść się do klasyki polskiego filmu i zaśpiewać »OK, Google, łubu dubu, łubu dubu« albo na pytanie o ulubionego muzyka Asystenta usłyszeć, że »Było cymbalistów wielu, ale żaden z nich nie śmiał zagrać przy Jankielu«. Można również poprosić, aby Asystent podzielił się jakąś ciekawostką o Polsce (»Powiedz mi ciekawostkę o Polsce«)".
Zgodzimy się, że sekwencję „łubu dubu, łubu dubu" znają wyłącznie Polacy. Dla obcokrajowca takie zdanie, nawet gdy zna on polski, ale nie poznał naszych zwyczajów i dóbr kultury, będzie mamrotaniem nie do końca świadomego swoich działań człowieka. Fakt, że Asystent rozumie tego typu niuanse, to dowód na to, że Google przyłożyło się do pracy nie tylko w warstwie lingwistycznej.
Asystent Google: co potrafi na smartfonie?
Zacznijmy od tego, że Asystent to usługa powiązana z kontem Google konkretnej osoby, a nie ze sprzętem. Niemniej trudno rozpatrywać działanie tej usługi w kompletnym oderwaniu od sprzętu, tym bardziej że samo Google zdefiniowało pewne wymagania w tym zakresie. Na uruchomienie Asystenta Google w polskiej wersji na swoim smartfonie mogą liczyć osoby mające telefon z systemem Android w wersji nie starszej niż 5 (Lollipop). W Polsce wciąż wiele osób korzysta z urządzeń pracujących jeszcze pod kontrolą Androida KitKat (4.4) i starszych wydań tego systemu − dla nich Asystent pozostanie niedostępny. W przypadku Androida Lollipop i nowszych wydań usługa − o ile jeszcze jest niedostępna − zostanie wkrótce uruchomiona i odbędzie się to całkowicie automatycznie. Zaledwie dzień po premierze usługi w Polsce Google pochwaliło się w oficjalnym komunikacie, że Asystent działa już na 95% smartfonów w Polsce. W nieco innej sytuacji są posiadacze mobilnego sprzętu Apple. Google przygotowało również wydanie Asystenta na platformę iOS, jednak wymaga ono od użytkownika zainstalowania aplikacji Asystent Google ze sklepu App Store.
Jakie możliwości oferuje Asystent Google w wersji polskiej? Osoby, które już mają Asystenta na swoich smartfonach, mogą same go o to zapytać. Zresztą to pierwszy zwrot („Co potrafisz?”), który jest automatycznie przekazywany Asystentowi po jego pierwszym uruchomieniu na smartfonie. Zobaczymy wtedy listę zadań podobną do tej na poniższej ilustracji (kliknięcie powiększy ją).
Jak widać, zakres funkcji realizowanych przez Asystenta nie jest szokujący. Co uważniejsi Czytelnicy z pewnością dostrzegą, że wiele z nich oferowała już dostępna w Polsce od kilku lat usługa Google Now z komendami głosowymi, obecnie zastąpiona właśnie Asystentem. Asystent wnosi jedną dużą różnicę: likwiduje barierę wejścia, udostępniając użytkownikowi interfejs głosowy, a właściwie nie tyle głosowy, co rozumienie języka naturalnego i możliwość prowadzenie dialogu. To ważne, bo za sam interfejs głosowy uznaje się również poprawne reagowanie na wypowiadanie przez użytkownika zdefiniowanych komend, a z tym mamy do czynienia już od kilku lat, czyli od czasu debiutu polskojęzycznej wersji usługi Google Now.
W chwili, gdy to piszemy (krótko po debiucie usługi w naszym kraju), Asystent Google wciąż nie potrafi zrealizować wielu zadań zgodnie z intencją użytkownika. I nie mamy tu na myśli absurdalnych (w kontekście funkcjonalności usługi) zleceń typu „Posprzątaj w kuchni”, których Asystent z oczywistych względów nie może wykonać (no, może nie do końca nie może, bo gdy wyobrazimy sobie powiązanie Asystenta z robotami sprzątającymi i myjącymi podłogę, to... kto wie? Więcej na temat współpracy ze sprzętem w dalszej części artykułu). Chodzi nam raczej o polecenia czy pytania, z którymi Asystent znający − jak zapewnia Google − Polskę, Polaków i naszą kulturę, powinien sobie poradzić. Przykładem niech będzie fraza „Wyświetl mi mapę Mazur”. W odpowiedzi oczekiwaliśmy, że Asystent wyświetli, na przykład w usłudze Mapy Google, znany nam doskonale, pełen jezior region Polski. Tymczasem zobaczyliśmy to:
Zauważmy, że choć reakcja Asystenta nie jest zgodna z intencjami użytkownika, to nie jest całkiem zła. Zaproponowane wyniki wyszukiwania wpisują się w kontekst zapytania. Rezultat można uznać za lepszy od tego, jaki na takie samo zapytanie proponowała usługa Google Now w czasie przeprowadzanych przez nas testów w 2015 roku:
Google Now prezentowało co prawda mapę, ale nie regionu geograficzno-kulturowego znanego nam jako Mazury, lecz okolice podlaskiej wsi Mazury położonej w okolicach Białegostoku (która jest zresztą jedną z kilku osad i wsi o tej nazwie w Polsce; nie pytajcie, czemu wybrał tę właśnie). Trzeba jednak dostrzec, że już wówczas, choć mapa nie odpowiadała intencjom, została uzupełniona o linki bardziej dopasowane do zapytania.
Wracając do Asystenta i przykładu z Mazurami, to potrafi on wyświetlić grafiki z mapami tego regionu, wystarczy po prostu ograniczyć zapytanie do frazy „Mapa Mazur”, a zobaczymy to:
Jak widać, Asystent to jednak maszyna. Im precyzyjniejsze i krótsze polecenia dostanie, tym dokładniejsze mogą być odpowiedzi. A jak wygląda kwestia współpracy polskojęzycznego Asystenta ze sprzętem innym niż smartfon?
Asystent Google, a inne urządzenia
Jak twierdzą przedstawiciele Alphabet Inc., Asystent Google w Polsce początkowo skupia się głównie na smartfonach, które stanowią podstawową platformę działania tej usługi. To logiczne, bo buduje jej zasięg, a przy tym każdy smartfon może dostarczać wielu informacji pozwalających rozwijać możliwości Asystenta. Oprócz tego oficjalne wsparcie usługi oferują także wybrane modele bezprzewodowych słuchawek.
Dzięki temu posiadacze takich słuchawek sparowanych ze smartfonem nie muszą wyciągać z kieszeni urządzenia mobilnego, by na przykład odczytać przychodzącą wiadomość, zmienić głosowo utwór muzyczny odtwarzany przez Spotify, YouTube czy Muzyka Google Play albo podyktować SMS do konkretnej osoby figurującej w bazie kontaktów w smartfonie. Więcej na temat współpracy słuchawek bezprzewodowych z Asystentem Google, konfiguracji Asystenta i słuchawek znajdziecie w materiale opublikowanym w serwisie komputerswiat.pl, tutaj natomiast zajmiemy się kwestią współpracy interesującej nas usługi z innymi urządzeniami.
Na wstępie trzeba zaznaczyć, że obsługa jakichkolwiek innych urządzeń poza wybranymi modelami bezprzewodowych słuchawek przez polskojęzycznego Asystenta Google jest realizowana nieoficjalnie, to znaczy połączenie funkcji Asystenta z konkretnym urządzeniem może się powieść, ale nie musi. Natomiast w przypadku porażki nie ma nawet co kontaktować się z Google, gdyż firma w takim przypadku umywa ręce i jak mantrę powtarza, że w Polsce Asystent działa na razie tylko na smartfonach i wybranych słuchawkach bezprzewodowych.
Stanowczość Google'a w kwestii współpracy polskiego Asystenta z większą liczbą urządzeń ma o tyle uzasadnienie, że póki co ta współpraca wygląda po prostu kiepsko. Teoretycznie Asystent Google powinien potrafić dogadać się z każdym urządzeniem, które można skonfigurować jako element inteligentnego domu w aplikacji Google Home. Z kolei z aplikacją Google Home współpracują m.in.: Google Chromecast, smart żarówki Philips Hue, smart gniazdka i inne komponenty smarthome firmy TP-Link, telewizory z systemem Android TV, kamery IP i komponenty smarthome firmy D-Link, oczywiście głośniki Google Home, roboty odkurzające iRobot Roomba (wybrane modele) i wiele, wiele więcej. Jest jednak dość istotny problem. Nawet po dodaniu konkretnego smart urządzenia do aplikacji Google Home, mimo że sprzęt jest widoczny również w ustawieniach Asystenta Google, liczba rozkazów, które można głosowo przekazać jest bardzo ograniczona albo wręcz nie da się sterować głosowo po polsku danym urządzeniem.
W wielu, również polskich serwisach i blogach technologicznych można znaleźć materiały rozpływające się na temat niezwykle szerokiej współpracy Asystenta z różnorakim usieciowionym sprzętem, jaki możemy mieć w domach. Prawda wygląda jednak tak, że polski, podkreślamy − POLSKI Asystent praktycznie nie współpracuje z niczym poza wspomnianymi wybranymi modelami słuchawek bezprzewodowych.
Spróbowaliśmy na przykład sparować polską wersję usługi z urządzeniem Chromecast Audio podłączonym do domowego wzmacniacza audio oraz z Chromecastem podpiętym pod telewizor. Oba Chromecasty zostały poprawnie rozpoznane przez aplikację Google Home. Po nadaniu obu urządzeniom polskich nazw, które mogłyby być poprawnie rozpoznane przez polskojęzycznego Asystenta, spróbowaliśmy kazać mu odtworzyć wybrany utwór na domowym zestawie audio. Jak widać na środkowym screenie powyżej, udało się to zrealizować. Oczywiście usługa Spotify została wcześniej wybrana jako domyślna do szukania utworów muzycznych w koncie Google, na którym działa Asystent. Znacznie gorzej polski Asystent wypadł w przypadku prób współpracy z Chromecastem podłączonym do telewizora w salonie − po prostu twierdził, że nie rozpoznaje danego urządzenia. Tymczasem Asystent Google uruchomiony na smartfonie bez najmniejszego problemu interpretuje głosowo wydane polecenie i odtwarza konkretny film na Netfliksie, oczywiście usługa ta musi być, podobnie jak Spotify, uprzednio sparowana z kontem Google i Asystentem.
W przypadku wielu pozostałych urządzeń, nawet sygnowanych jako sprzęt współpracujący z Asystentem Google, współpraca ta dotyczy anglojęzycznej edycji usługi Google'a. Polskie polecenia nie będą przekazywane do urządzenia, a anglojęzycznych zrozumiałych dla urządzenia nie zrozumie polskojęzyczny Asystent. Owszem, są od tej reguły wyjątki. Na przykład robota odkurzającego iRobot Roomba udaje się za pomocą Asystenta włączyć i wyłączyć, można nawet polecić mu powrót do stacji dokującej. Oczywiście dotyczy to wyłącznie usieciowionych modeli robotów Roomba i wymaga przypisania urządzeniu zrozumiałej dla Asystenta nazwy, jak „odkurzacz” czy „robot”. Wtedy wystarczy powiedzieć do Asystenta „włącz robot” (ale już nie „włącz robota”), a urządzenie powinno wystartować.
Współpraca z Chromecastem jest fragmentaryczna, z telewizorami Android TV − również. Rozpoznawanych jest zaledwie kilka podstawowych poleceń typu „włącz”. Głośniki Google Home i Google Home Mini, choć teoretycznie można je przecież kupić na przykład na Amazonie, nie współpracują z polskojęzycznym Asystentem. W naszej redakcji próbowaliśmy m.in. powiązać Asystenta z zestawem kamer IP do monitoringu. Niestety, choć same kamery były poprawnie rozpoznawane przez aplikację Google Home, a nawet widoczne w ustawieniach Asystenta, to nie rozumiały żadnego polecenia. Trudno zatem mówić w tym przypadku o współpracy − widoczność urządzenia na ekranie ustawień Asystenta to trochę za mało.
Asystent Google, API i platforma Actions on Google
Wraz z uruchomieniem polskojęzycznej wersji Asystenta, Google wystartowało z platformą Actions on Google, która pozwala firmom zewnętrznym na integrację własnych usług z Asystentem. Odbywa się to poprzez tworzenie tzw. akcji dla Asystenta. Wspominaliśmy wcześniej, że Google uruchomiło polską wersję Asystenta przy współpracy z dwoma firmami: eSky oraz operatorem Play. Co użytkownikom daje taka współpraca? Dzięki integracji Asystenta z usługami Play usługa Google wie, co aktualnie oferuje operator. Na przykład na zapytanie „OK, Google, zapytaj Play, co nowego?” Asystent przekaże zapytanie do Play, w efekcie na ekranie Asystenta jego logo zostanie zastąpione obrazkiem przygotowanym przez Play, co oznacza, że w tym momencie rozmowa jest prowadzona z Play, a nie z usługą Google.
Na początku działało to całkiem nieźle, w smartfonie zobaczyliśmy nowe oferty operatora oraz pytanie, o której z nich chcemy dowiedzieć się więcej. Wybraliśmy jedną z nich − i tu pojawił się problem. Mimo aktywnego połączenia internetowego przez kilka dobrych minut jedyne, co dało się zaobserwować na ekranie telefonu, to migające kropki oznaczające oczekiwanie na odpowiedź. Ostatecznie nie doczekaliśmy się tej odpowiedzi i zrezygnowani anulowaliśmy zapytanie. Sytuacja ta daje jednak pewne wskazówki: w momencie, gdy za realizację polecenia odpowiada firma spoza Google (tu: Play), jakość usługi może wyglądać różnie. To o tyle niebezpieczne dla Asystenta, że większość użytkowników będzie obarczać winą za błąd właśnie Google, a nie konkretną inną firmę.
Ostatecznie udało się porozumieć z botem Play, ale zakres dostępnych funkcji sprowadza się do przekazania krótkiej informacji, a następnie przekierowania na odpowiednią stronę internetową. Z funkcji „rozrywkowych” dostępny jest Quiz Play prowadzony przez bota. Danny'ego (bo tak siebie nazywa bot Play) możemy spytać na przykład o koszty roamingu (przekieruje nas na stronę), możemy też zadać mu inne, równie proste pytania. W przypadku pytań trudniejszych, które okażą się niezrozumiałe dla bota Play, zostaniemy poinformowani, że odpowie na nie pracownik infolinii operatora.
Nieco lepiej (pod względem stabilności połączenia, a nie funkcjonalności usługi) wygląda to w przypadku drugiego partnera − firmy eSky. Gdy powiedzieliśmy Asystentowi Google: „Porozmawiaj z eSky”, zobaczyliśmy odpowiedź: „Jasne, oto eSky”. Ekran Asystenta przełączył się na podprogram eSky, po czym wyświetlone zostało powitanie bota z eSky z pytaniem, gdzie chcemy lecieć. Po wskazaniu miasta docelowego zobaczyliśmy cenowe oferty lotów w wybranych terminach. Po wybraniu lotu zostaliśmy przekierowani na mobilną witrynę eSky, gdzie można dokonać rezerwacji biletu.
Od strony czysto technicznej akcja to odpowiednik klasycznej aplikacji. Zasadniczą różnicą jest jednak sposób interakcji. Zamiast interfejsu graficznego skoncentrowanego na urządzeniu każda akcja wykorzystuje możliwość dwustronnej komunikacji głosowej, którą zapewnia Asystent Google. Warto przy okazji zauważyć, że możliwość tworzenia akcji przez zewnętrzne firmy i podmioty to przewaga Asystenta nad znaną od kilku lat usługą Google Now.
A jakie technologie wykorzystuje Asystent Google? Nie tylko ten polski, lecz ogólnie, bez względu na region, w którym usługa jest aktywna? Odpowiedź sprowadza się do trzech punktów: Google Cloud Platform (tutaj w grę wchodzi przede wszystkim uczenie maszynowe), Dialogflow (techniki odpowiedzialne za rozumienie języka naturalnego i prowadzenie dialogu) oraz zbudowany przez Google'a graf wiedzy, czyli baza wiedzy tworzona dzięki gromadzeniu gigantycznych zasobów informacji z różnych źródeł. Graf wiedzy nie jest czymś nowym − polscy użytkownicy wyszukiwarki Google mogą z niego korzystać od 16 maja 2013 roku. Niemniej to właśnie z tej samej bazy Asystent czerpie informacje przekazywane użytkownikom w odpowiedzi na ich zapytania.
Osoby zainteresowane samodzielnym tworzeniem akcji dla polskojęzycznego Asystenta Google powinny odwiedzić deweloperski serwis Actions on Google.
Podsumowując, nie przejmujmy się tym, że Asystent Google w wersji polskiej potrafi znacznie mniej niż jego zachodnie odpowiedniki. Również my, ludzie, rodzimy się z ograniczonym pakietem możliwości, dopiero odpowiedzialni rodzice i społeczeństwo kształtują nasz światopogląd i uwalniają intelektualny potencjał. Google wielokrotnie podkreślało, że wejście polskojęzycznego Asystenta na nasz rynek to dopiero początek drogi rozwojowej. Produkt jest na tyle dojrzały, że mógł już opuścić laboratorium, ale na tyle młody, że jeszcze wielu rzeczy musi się od nas samych nauczyć.