Dodatkowo program Google nie potrafił tworzyć przetłumaczonych zdań z odpowiednią strukturą w danym języku – dlatego wychodziły zdania typu „Tomek zjeść bułka”. Ponadto translator nie był w stanie wywnioskować z kontekstu, jaki sens powinno mieć tłumaczone zdanie. Nowy program bazuje na technologii o nazwie Neural Machine Translation.

Na przykład w popularnym filmie „Transformers” odbywa się dialog pomiędzy głównym bohaterem – Samem, a Autobotem Optimusem Primem. Niestety spotkanie „wyczaiły” wrogo nastawione Decepticony i chłopak musiał uciekać. Korzystając z Google Translator angielskie „Run Sam, run!” zostało przetłumaczone na „Uruchom Sam, uruchom!”… Właśnie z tego typu „smaczkami” mieliśmy do czynienia ze starą wersją programu.

Teraz firma z Mountain View postawiła na samouczące się komputer – czyli z „angielska” machine learning. Na razie tylko w 8 językach – angielskim, francuskim, niemieckim, hiszpańskim, portugalskim, chińskim (mandaryńskim), japońskim, koreańskim i tureckim. Zdaniem Google te języki to około 35% wszystkich zapytań do Google Translatora.

Google Neural Machine Translation

Ta informacja mogła umknąć większości z nas, chociażby ze względu na świąteczną gorączkę i dominujące w mediach tematy z tym związane.

Od września wszystko zmieniło się o 180 stopni. Google wyposażyło swój system w nowy silnik Google Neural Machine Translation (GNMT). System ten jest „naładowany” wszystkimi nowinkami z zeszłego roku, jeżeli chodzi o machine learning.

Mówiąc najprościej – translator od Google zaczął myśleć. Może teraz poszerzać swoją bazę słów dzięki czerpaniu z tego co wpisują użytkownicy. Zaczyna się uczyć, jak podejmować decyzję – na bazie danych- w jakim kontekście jest tworzone samo zdanie.

Wracając do przykładu z „Transformersów” – jeżeli we wcześniejszym zdaniu padały słowa o ucieczce i zagrożeniu, translator odczyta to i będzie wiedział, że „run” w tym kontekście ma oznaczać ucieczkę, a nie uruchomienie.

Podsumowując – wcześniej im dłuższy tekst wklejaliśmy do translatora, tym gorzej wyglądało tłumaczenie. Teraz jest z goła odwrotnie, przeklejając cały tekst program będzie mógł lepiej zbadać kontekst wypowiedzi i tłumaczyć bardziej efektywnie.

Google wymyśliło swój własny język?

Na początku listopada część ekspertów hucznie ogłaszała, że Google Translate sam wymyślił swój własny język, aby jeszcze lepiej tłumaczyć. Czy komputery zaczęły się uczyć w tak szybkim tempie? Czy w końcu zastąpią nas roboty?!

Sceptyków i przeciwników rozwijania inteligentnych komputerów uspokajamy – nic takiego nie miało miejsca. Translator firmy z Mountain View opracował po prostu pewnego rodzaju uniwersalny język – Google nazywa to interlingua.

Działa to na tej zasadzie – jeżeli program potrafi tłumaczyć z angielskiego na koreański i z angielskiego na japoński, to na podstawie zaczerpniętych danych translator sam jest w stanie opanować tłumaczenie z japońskiego na koreański (na bazie angielskiego). Interlingua nie jest osobnym językiem, a jedynie czymś pomiędzy kilkoma językami.

Pozostaje się tylko cieszyć, gdyż wreszcie będzie można przeczytać coś z chińskich albo koreańskich stron – przeklejając artykuł do translatora i tłumacząc na angielski. Może niedługo doczekamy się również dodania języka polskiego do systemu GNMT?