Oprogramowanie
Artykuł
Krzysztof Wołk, Czwartek, 27 grudnia 2018, 14:01

Znajomość języków obcych, choć tak bardzo potrzebna, nie jest jeszcze na tyle powszechna, by każdy mógł się porozumieć z każdym. Do tego istnieją setki języków, już nie mówiąc o dialektach. Dlatego szukamy nowoczesnych rozwiązań, które pomogą nam porozumieć się w każdym zakątku świata. W odpowiedzi na nasze potrzeby powstają urządzenia i aplikacje, które działają jak natychmiastowi tłumacze.

 

Wielu z Was zapewne słyszało o Tłumaczu Google – stronie internetowej, która automatycznie przekłada ze 100 różnych języków na wybrany. Narzędzie tłumacza dostępne jest nawet w telefonach oraz zegarkach smartwatch.

 

Technika, która to umożliwia, nazywa się tłumaczeniem maszynowym. Zrewolucjonizowała ona świat na tyle, że pozwala ludziom na komunikowanie się, gdy w innym przypadku nie byłoby to możliwe. Obecnie wkracza w świat miniaturowych elektronicznych gadżetów i, co jeszcze ważniejsze, często nie wymaga łączności z siecią, gdyż obliczenia odbywają się w urządzeniu mieszczącym się w dłoni. W niniejszym artykule powiemy nieco więcej o samej technice, jak i dokonamy przeglądu aplikacji oraz urządzeń przenośnych obsługujących funkcje translacji w czasie rzeczywistym.

Wprowadzenie

Przedsiębiorstwa i ośrodki naukowe z całego świata pracują nad tym, aby dzięki nowoczesnej technice nasze życie znacznie się poprawiło. Choć lubimy narzekać na różne rozwiązania, i tak bardzo często z nich korzystamy, ponieważ sprawiają, że niektóre czynności jesteśmy w stanie wykonać znacznie szybciej niż bez ich udziału. Wprawdzie mówi się o niedoskonałości tłumaczeń, szczególnie w bardzo długich tekstach, ale nadal każdego dnia tłumaczy się miliony, a nawet miliardy słów. Czyli choć zdarza się nam narzekać na jakość tego rozwiązania, nie przeszkadza nam to z niego korzystać.

Wiemy przecież, że już od niemal 15 lat uczniowie amerykańskich szkół średnich używają Google Translate, który... tłumaczy im zadania domowe z innego języka, na przykład hiszpańskiego. Czyli nie jest to jakaś nowość, prawda?

Mamy jednak powód, aby o tym teraz mówić, już bowiem od dwóch lat głębokie uczenie maszynowe kompletnie zrewolucjonizowało nasze nastawienie do tłumaczenia maszynowego. Specjaliści od głębokiego nauczania, którzy prawie nie mają pojęcia o przekładzie, tworzą całkiem proste rozwiązania tłumaczenia maszynowego, które biją na głowę najlepsze systemy tłumaczenia skonstruowane przez najlepszych ekspertów zajmujących się statystycznym uczeniem maszynowym.

Technologia stojąca za tym przełomem nazywa się tłumaczeniem z sekwencji na sekwencję (sequence-to-sequence learning). Jest bardzo wydajna i ma wiele zastosowań, nie tylko w przekładzie językowym. Przyjrzymy się jej użyciu w procesie tłumaczenia, ale także powiemy, jak ten sam algorytm może być wykorzystany do napisania czat-bota zarządzanego przez sztuczną inteligencję oraz opisu zdjęcia.

Co możemy zrobić, aby komputer był w stanie przełożyć tekst z języka naturalnego? Najprostszym rozwiązaniem jest oczywiście tłumaczenie po prostu słowo w słowo, czyli zastąpienie wszystkich słów w języku źródłowym słowami w języku docelowym. Oto przykład prostego tłumaczenia z języka hiszpańskiego na angielski:

Zastąpiliśmy każde słowo hiszpańskie odpowiednikiem w języku angielskim. Jest to bardzo proste do przeprowadzenia, ponieważ potrzeba jedynie słownika, aby znaleźć tłumaczenie każdego słowa. Rezultat jednak jest opłakany, bo taki sposób całkowicie pomija kontekst oraz zasady gramatyczne.

Aby udoskonalić przekład, należy dodać zasady rządzące wypowiedzią w danym języku. Możemy na przykład przetłumaczyć często pojawiające się frazy złożone z dwóch wyrazów jako jedną grupę. Możemy też zmienić miejsce rzeczowników czy przymiotników, które w języku hiszpańskim mają odwrotną kolejność niż w angielskim. Możemy też regułowo okodować różne inne zawiłości danej pary języków.

To podziałało! Czyż nie wystarczy więc dodawanie reguł do momentu zyskania znajomości wszystkich dziedzin gramatyki, aby program mógł poprawnie przetłumaczyć każde dane zdanie?

Na takiej właśnie zasadzie działały wczesne systemy tłumaczeniowe oparte na regułach (rule-based). Lingwiści próbowali zaprogramować wszystkie skomplikowane zasady języka jedna po drugiej. Podczas zimnej wojny jedni z najwybitniejszych w swojej dziedzinie stworzyli taki system, aby łatwiej było tłumaczyć informacje uzyskane w wyniku analizy komunikacji rosyjskiej.

Niestety, ten sposób działał tylko w przypadku bardzo prostych tekstów, takich jak prognoza pogody. Programy tego typu nie były w stanie prawidłowo odczytywać prawdziwych dokumentów.

Powodem jest to, że język naturalny nie ma ściśle określonych reguł. Nasze języki są przepełnione wyjątkami, gwarą regionalną czy po prostu zwykłym łamaniem reguł gramatycznych. Na używany przez nas język większy wpływ ma to, kto kogo w przeszłości podbił, niż sztywne zasady zdefiniowane przez jakiś autorytet w dziedzinie gramatyki.

Ocena artykułu:
Ocen: 9
Zaloguj się, by móc oceniać
Dravic (2018.12.27, 16:38)
Ocena: 10

33%
'Niestety sprzęt nie obsługuje języka polskiego' no to przydatne dla polaków urządzenie :E
Edytowane przez autora (2018.12.27, 16:38)
Edytowane przez moderatora (2018.12.27, 16:42): No bez przesady :E
Makavcio2 (2018.12.27, 17:27)
Ocena: -2

0%
Tłumaczenie dokumentów już za niedługo powinno być możliwe, bo to jest tłumaczenie faktów. Tłumaczenie intencji, tłumaczenie sensu wypowiedzi to jak na razie coś, nad czym nawet nie zaczęliśmy pracować, bo tutaj wszystko tak naprawdę odbywa się na mechanice wyrazów, trochę fikuśniejszej statystyce.

MT nie należy się bać. Wręcz przeciwnie, jest to świetna sprawa, ale ma swoje ograniczenia. My, tłumacze, możemy być spokojni o naszą robotę jeszcze długo.

Z drugiej strony, analfabetyzm wtórny staje się coraz powszechniejszy (vide, forum) i za niedługo Google Translate będzie się jawił niczym Baczyński na tle przeciętnego polaka :E Jedna jedyna rzecz w tym kraju się udała, język, a szanowany nie jest w ogóle.
PrimoGhost (2018.12.27, 22:20)
Ocena: 2

0%
Znam tylko słowackiego i Mickiewicza. Niemieckiego się dopiero uczę :p
*Konto usunięte* (2018.12.28, 11:53)
Ocena: 2
Ciekawe jednak od wielu lat nie widze postępu w sposobie tłumaczenia przez wszelkiego typu tłumacze.... no moze o tyle co jest postęp w uczeniu sie tłumaczy statystycznych .
Ciekawe dlaczego ?
Niby to sa takie moce obliczeniowe pojemności sieci neuronowe i inne cuda ale tłumaczenie maszynowe stoi w miejscu.
xolox (2018.12.28, 13:14)
Ocena: -2

0%
stanpogody @ 2018.12.27 19:23  Post: 1181543
1primo trza znac niemiecki

2primo trza znac grecki

3primo mickiewicz i slowacki :P


A Ja Ci mówię że znam Grubego Łysego i Krzysztofa Jarzynę ! i to wystacza !
piobzo (2018.12.28, 14:44)
Ocena: 1

0%
knuts @ 2018.12.28 11:53  Post: 1181634
Ciekawe jednak od wielu lat nie widze postępu w sposobie tłumaczenia przez wszelkiego typu tłumacze.... no moze o tyle co jest postęp w uczeniu sie tłumaczy statystycznych .
Ciekawe dlaczego ?
Niby to sa takie moce obliczeniowe pojemności sieci neuronowe i inne cuda ale tłumaczenie maszynowe stoi w miejscu.

Bo nie dają możliwości poprawić tłumaczenia. Bez tego, każdy tekst aby maszyna się uczyła musi mieć swoją odpowiedź w danym języku. Z tym, może się maszyna uczyć głupot, o ludzi którzy go uczą. Gdyby, tak każdy wrzucałby codziennie książkę, w dwóch językach to tłumaczenia, to pewnie maszyny uczyłyby się szybciej.
Edytowane przez autora (2018.12.28, 14:50)
allmunio (2018.12.28, 14:59)
Ocena: -2

0%
ciekawe czy redakcja używa niemiecko-polskiego :P
kain (2018.12.28, 15:08)

0%
allmunio @ 2018.12.28 14:59  Post: 1181657
ciekawe czy redakcja używa niemiecko-polskiego :P


Nie, nasi niemieccy nadzorcy wszystko nam dyktują...
lolotron (2018.12.28, 15:41)
Ocena: 0

0%
allmunio @ 2018.12.28 14:59  Post: 1181657
ciekawe czy redakcja używa niemiecko-polskiego :P


Pisowskie bajki.
Zaloguj się, by móc komentować
Artykuły spokrewnione
Facebook
Ostatnio komentowane