17 maja 2017, 09:00:infoShare 2017 - AmberExpo, ul. Żaglowa 11, 80-560 Gdańsk, Polska

Mogliście to przegapić! Google Translator stał się mądrzejszy

Google Translator wreszcie przestanie wykonywać tłumaczenia wywołujące salwę śmiechu. Wszystko dzięki machine learning.

Jeszcze do września 2016 roku Google Translator korzystał z określonej bazy słów do wykonywania tłumaczeń. Popularny translator robił po prostu to, co my wszyscy – wykorzystywał swoją „wiedzę” i bazę posiadanych słów, z tym że nie uczył się nowych słówek podczas wykonywanej pracy. Teraz będzie stosował tłumaczenie holistyczne – ma tłumaczyć całe zdanie w locie, a nie pojedyncze słowa.

Dodatkowo program Google nie potrafił tworzyć przetłumaczonych zdań z odpowiednią strukturą w danym języku – dlatego wychodziły zdania typu „Tomek zjeść bułka”. Ponadto translator nie był w stanie wywnioskować z kontekstu, jaki sens powinno mieć tłumaczone zdanie. Nowy program bazuje na technologii o nazwie Neural Machine Translation.

Na przykład w popularnym filmie „Transformers” odbywa się dialog pomiędzy głównym bohaterem – Samem, a Autobotem Optimusem Primem. Niestety spotkanie „wyczaiły” wrogo nastawione Decepticony i chłopak musiał uciekać. Korzystając z Google Translator angielskie „Run Sam, run!” zostało przetłumaczone na „Uruchom Sam, uruchom!”… Właśnie z tego typu „smaczkami” mieliśmy do czynienia ze starą wersją programu.

Teraz firma z Mountain View postawiła na samouczące się komputer – czyli z „angielska” machine learning. Na razie tylko w 8 językach – angielskim, francuskim, niemieckim, hiszpańskim, portugalskim, chińskim (mandaryńskim), japońskim, koreańskim i tureckim. Zdaniem Google te języki to około 35% wszystkich zapytań do Google Translatora.

Google Neural Machine Translation

Ta informacja mogła umknąć większości z nas, chociażby ze względu na świąteczną gorączkę i dominujące w mediach tematy z tym związane.

Od września wszystko zmieniło się o 180 stopni. Google wyposażyło swój system w nowy silnik Google Neural Machine Translation (GNMT). System ten jest „naładowany” wszystkimi nowinkami z zeszłego roku, jeżeli chodzi o machine learning.

Mówiąc najprościej – translator od Google zaczął myśleć. Może teraz poszerzać swoją bazę słów dzięki czerpaniu z tego co wpisują użytkownicy. Zaczyna się uczyć, jak podejmować decyzję – na bazie danych- w jakim kontekście jest tworzone samo zdanie.

Wracając do przykładu z „Transformersów” – jeżeli we wcześniejszym zdaniu padały słowa o ucieczce i zagrożeniu, translator odczyta to i będzie wiedział, że „run” w tym kontekście ma oznaczać ucieczkę, a nie uruchomienie.

Podsumowując – wcześniej im dłuższy tekst wklejaliśmy do translatora, tym gorzej wyglądało tłumaczenie. Teraz jest z goła odwrotnie, przeklejając cały tekst program będzie mógł lepiej zbadać kontekst wypowiedzi i tłumaczyć bardziej efektywnie.

Google wymyśliło swój własny język?

Na początku listopada część ekspertów hucznie ogłaszała, że Google Translate sam wymyślił swój własny język, aby jeszcze lepiej tłumaczyć. Czy komputery zaczęły się uczyć w tak szybkim tempie? Czy w końcu zastąpią nas roboty?!

Sceptyków i przeciwników rozwijania inteligentnych komputerów uspokajamy – nic takiego nie miało miejsca. Translator firmy z Mountain View opracował po prostu pewnego rodzaju uniwersalny język – Google nazywa to interlingua.

Działa to na tej zasadzie – jeżeli program potrafi tłumaczyć z angielskiego na koreański i z angielskiego na japoński, to na podstawie zaczerpniętych danych translator sam jest w stanie opanować tłumaczenie z japońskiego na koreański (na bazie angielskiego). Interlingua nie jest osobnym językiem, a jedynie czymś pomiędzy kilkoma językami.

Pozostaje się tylko cieszyć, gdyż wreszcie będzie można przeczytać coś z chińskich albo koreańskich stron – przeklejając artykuł do translatora i tłumacząc na angielski. Może niedługo doczekamy się również dodania języka polskiego do systemu GNMT?

/Rafał Tomaszewski

Podziel się artykułem
Share on FacebookTweet about this on TwitterShare on Google+Email this to someone

Aktualności

Start-upy

Adyen
Adyen - holenderski startup zajmujący się płatnościami...
TWINO
TWINO
TWINO - firma z sektora FinTech i jedna z najszybciej...
PayU logo.
PayU
PayU - jeden z najstarszych i najlepiej rozpoznawalnych...
Logo iniJOB - serwisu, na którym pracownicy mogą opiniować swoje miejsce pracy i wpływać na jego poprawę.
iniJOB
iniJOB jest miejscem, w którym pracownicy mogą organizować...
Codewise Logo
Codewise
Codewise - polski startup, który oferuje narzędzia...
Coinfirm logo
Coinfirm
Coinfirm - polski startup działający w oparciu o technologię...