Wizja szybkiego tłumaczenia rozmów w czasie rzeczywistym staje się realna i dostępna niemal na wyciągnięcie ręki. Narzędzie, które natychmiast przekłada dialogi, np. gdy jesteśmy na wakacjach czy międzynarodowym biznesowym spotkaniu, to ogromne ułatwienie i kolejny krok w przełamaniu barier językowych. Jakie możliwości już dziś daje technologia automatycznego tłumaczenia? Podsumowujemy jej rozwój i przyglądamy się trendom.
Tłumacz w czasie rzeczywistym – potrzebny od zaraz!
Ludzie od zawsze marzyli o technologii i narzędziu, które pozwoli im swobodnie porozumiewać się w wielu językach. Tłumaczenia maszynowe zaczęły dawać nadzieję na powstanie takiego rozwiązania. Przyśpieszenie jej rozwoju spowodowała sztuczna inteligencja, aż w 2017 r. nastąpił pierwszy krok ku rewolucji. Właśnie wtedy Google zaprezentował słuchawki Pixel Buds, które tłumaczą mowę w czasie rzeczywistym. Jak działają? Słuchawki są połączone ze smartfonem i Google Translatorem. Gdy rozmówca mówi w obcym języku, np. angielskim, oprogramowanie przekłada tekst na język rodzimy użytkownika słuchawek np. szwedzki. Możemy, więc odpowiedzieć po szwedzku, na co smartfon przetłumaczy odpowiedź na angielski.
Taki tłumacz automatyczny wykorzystuje połączenie inteligentnego rozpoznawania mowy i algorytmów Translatora Google, działającego na głębokich sieciach neuronowych. W tym przypadku mowa zamieniana jest na tekst, a tekst na mowę (text-to-speach), co niestety powoduje, że aby odpowiedzieć rozmówcy, czekamy, aż oprogramowanie przetworzy dostarczone dane.
Tłumacz w czasie rzeczywistym wskakuje o poziom wyżej
Gigantowi z Doliny Krzemowej depczą po piętach start-upy, które wiedzą, w jakim kierunku podąża przyszłość branży tłumaczeniowej. Jeden z nich wprowadził na rynek małe urządzenie tłumaczące o nazwie „Langogo Pocket AI Language Translator”. Ten mały translator przypomina z wyglądu dyktafon i mieści się w kieszeni. Daje możliwość porozumienia się w aż 105 językach (a ich liczba ciągle rośnie). Co więcej, by przetłumaczyć mowę, nie musi mieć nawet połączenia z siecią przez Wi-Fi, wystarczy, by urządzenie posiadało kartę SIM lub eSIM.
Langogo został wyposażony w potężny silnik, który umożliwia bardzo dokładne automatyczne tłumaczenia, oparte o algorytmy sztucznej inteligencji. Oprogramowanie integruje bowiem aż 24 zaawansowane systemy tłumaczenia maszynowego, oparte o sieci neuronowe, opracowane przez Google i Microsoft. Dzięki temu przekład nie jest dosłowny i kanciasty, ale wzbogacony także o kontekst wypowiedzi, co pozwala zachować jej sens. Langogo pracuje w dwóch trybach. W pierwszym wystarczy nacisnąć przycisk i powiedzieć coś, np. złożyć zamówienie w restauracji, a urządzenie natychmiast je tłumaczy. W przypadku rozmów lepiej sprawdza się tryb konwersacji, w którym urządzenie „słucha” ludzkiej mowy, usuwając szum z otoczenia i tłumaczy wszystko, co zostało powiedziane na wybrany język.
Kolejny krok w tłumaczeniowej rewolucji
Oczywiście, funkcję tłumaczenia rzeczywistego ma do dyspozycji niemal każdy, kto ma dostęp choćby do Google Translatora czy Asystenta Google. Jak grzyby po deszczu na rynku pojawiaj się także mniej lub bardziej zaawansowane aplikacje, które pomagają w szybkim przekładzie mowy. Choć możliwości tych rozwiązań, a także urządzeń, jak np. Langogo, są imponujące, to Google nie powiedział jeszcze ostatniego słowa.
Koncern od kilku lat pracuje bowiem nad projektem Translatotron. Ten zaawansowany głosowy tłumacz pomija zamianę mowy na tekst, co przyśpiesza tłumaczenie w czasie rzeczywistym. Przeskoczenie etapu text-to-speach to nie jedyna zaleta Translatotrona. Potrafi on zachować charakterystykę głosu, intonacji i fleksji, co sprawia, że rozmowa w wielu językach staje się jeszcze bardziej naturalna, choć nadal jest wspomagana komputerowo. Rozwiązanie nie jest jeszcze dostępne publicznie, jednak docelowo ma stać się częścią Google Translatora. To z pewnością będzie kolejnym znaczącym krokiem ku wielojęzycznej rewolucji.