Internet jako kreator językowych rewolucji?

Coraz większej ilości ludzi zdarza się korzystać z automatycznego tłumacza, jaki oferuje przy swojej wyszukiwarce Google. Z pewnością jest to świetne narzędzie, warto jednak przyjrzeć mu się bliżej, a zwłaszcza metodzie, na jakiej zasadza się jego działanie.
obozy tenisa obozy tenisowe czy obozy gry w tenisa?
Jak wiadomo całą pracę tłumacza w Google translater wykonuje algorytm, a nie żywy człowiek. Dlatego też wykonywana procedura określana jest jako tłumaczenie automatyczne. Ta rozbudowana dziedzina nauki – przez długi czas czysto teoretyczna – zaczęła być wcielana w życie od lat trzydziestych ubiegłego wieku, od zawsze była dziedziną niezwykle trudną. Jednak Google postanowił i tutaj pokazać swoje możliwości. Stworzył zupełnie nową metodę ? własny program ? która mówiąc ogólnie polega na metodach uczenia statystycznego wspartych milardami słów tekstów i tłumaczeń. Krótko mówiąc google stworzył oprogramowanie szukające relacji w różnojęzycznych tekstach i następnie tworzące algrorytmy tłumaczenia na podstawie statystyki.
Oczywiście sami przedstawiciele cyfrowego giganta przyznają, że długa jeszcze droga przed nimi, jednak sam program jest już w publicznym użyciu. Wszystko wydawałoby się wspaniale, ale niestety w przypadku takich języków jak polski, którego bogactwo deklinacji pozwala na prawdziwe szaleństwa składniowe i kontekstowe pojawia się problem. Metody statystyczne sprawiają, że to, co polscy internauci wpisują szukając np. sportowego wyjazdu jest znacznie bogatsze od wyjściowego rezultatu. Przykładowo pisząc: ?obozy tenisowe?, ?obozy tenisa? czy ?obozy gry w tenisa? za każdym razem otrzymamy w tłumaczeniu ?tennis camp? jest to oczywiście słuszne, gdyż przeciwne statystyce tłumaczenie tych twórów na angielski drastycznie zamazywałyby sens wypowiedzi, jednakże pojawia się problem… Takie zawężanie tłumaczenia sprawia, że największą skuteczność zyskuje zdanie pierwotnie najpodobniejsze ? zwłaszcza jeśli tłumaczenia odbywają się w wielu językach, a nie tylko na parze polski ? angielski. Inaczej mówiąc, jedynie ?obozy tenisa? mają szanse powrócić do nas niezniekształcone po wyprawie polski- angielski ? niemiecki ? włoski ? francuski – ?. – flamandzki ? irański ? polski. Tym samym jeśli chcemy zachować treść naszej strony jak najbardziej zrozumiała dla globalnej wioski, automatycznie zaczynamy dopasowywać jej zawartość treściową pod swoisty unicode Google Translator. Można to łatwo zaobserwować patrząc na zmiany wielu stron internetowych ostatnimi czasy. Za wcześnie jest jeszcze aby coś prorokować, ale być może w najbliższym czasie nasz język, inspirowany internetem, czeka poważny proces przystosowawczy wynikający z dostosowywania się piszących do algorytmu? Warto się nad tym zastanowić, gdy następnym razem będziemy składać swoją stronę.

Podobne arty:

Tags: , , , ,

Comments are closed.