S jezika na jezik Besplatni servisi za mašinsko prevođenje na Internetu Prevodilačka profesija, izrazito složena i zahtevna delatnost, pored nerazumevanja (često nedovoljno kultivisane) sredine, kroz svoju dugu istoriju nailazila je na još jednu, jednako nepremostivu prepreku: brzinu, tačnije na hronični nedostatak vremena. Naime, prevodilac je u toku određenog vremenskog intervala u stanju da prevede ograničen broj reči, s obzirom na to da se prevođenje kao mentalna aktivnost, za razliku od fizičkih, ne može ubrzavati po želji.Tu na scenu stupa mašinsko ili automatsko prevođenje. Ideja da bi mašina mogla umesto čoveka da prevodi s jednog jezika na drugi stara je gotovo koliko i sam računar. Brojni neuspesi gotovo da su zaustavili istraživanja na tom polju, ali su interesi, što komercijalni što naučni, iznova vaskrsavali takva stremljenja. Eksplozivni razvoj Interneta, a u poslednje vreme Weba 2.0, doveo je ogroman broj ljudi u dodir sa stranim jezicima, a time izazvao i potrebu za prevođenjem tekstova. Priroda medijuma komunikacije nameće ljudima potrebu da umesto jeftinog i brzog, humanog, kompetentnog, ali nedovoljno dostupnog potraže mašinskog prevodioca, tj. odgovarajući softver/servis na Internetu koji bi taj zadatak mogao da obavi sa zadovoljavajućim stepenom kvaliteta. Što je još zanimljivije, informatička globalizacija nije dovela do jezičke unifikacije uprkos tome što je na prvi pogled engleski jezik lingua franca komunikacije na Internetu. Dovoljno je pogledati samo na koliko su jezika lokalizovani pretraživači poput Googlea, Yahooa ili Binga. Ipak, rezultati prevođenja uz pomoć programske rutine donedavno nisu bili dovoljno dobri ili pak dovoljno pristupačni da bi pobudili adekvatan stepen zanimanja javnosti. Pojava kvalitetnih i sveobuhvatnih automata za mašinsko prevođenje, pre svega Google Translatora, dovela je ovaj računarsko-lingvistički, simbiotski mehanizam u žižu interesovanja kako tzv. širokih masa tako i stručnjaka tih dveju disciplina u čija polja zadire. Komparacija prevoda | U prilogu se nalaze prevodi sa engleskog jezika jednog kratkog odlomka na temu mašinskog prevođenja, pa možete i sami uporediti i proceniti kvalitet ponuđenih rešenja. Tu je i prevod humanog prevodioca, koji jasno ukazuje na sve mane postojećih automata i pristupa mašinskom prevođenju. Ako se još pitate kako to da tako napredna skalamerija kakav je moderni računar toliko kaska za čovekom, odgovor možda možete naći u definiciji prevođenja koju je formulisao češki teoretičar Jirži Levi: „Prevođenje je PROCES ODLUČIVANJA: niz izvesnog broja uzastopnih situacija, poteza kao u igri – situacija koje prevodiocu nameću nužnost da načini izbor između izvesnog (a veoma često tačno odredivog) broja alternativa.” | ORIGINAL – During the twentieth century, MT experienced a meteoric rise, an equally meteoric fall, and a resurgence continuing to the present time. Warren Weaver mentioned the possibility of using computers to translate language in a 1947 memorandum. A mere seven years later, theory was put into practice during the celebrated Georgetown IBM experiment. The „electronic brain,” as it was called in the IBM press release, managed to produce an intelligible translation of 60 sentences from Russian into English using six grammar rules and 250 dictionary entries. Professor Leon Dostert, a Georgetown language scholar, proclaimed, „[in] five, perhaps three years hence, interlingual meaning conversion by electronic process in important functional areas of several languages may well be an accomplished fact.” | Google – Tokom dvadesetog veka, mašinski prevođenje doživela meteorski uspon, jednako meteorski jesen, i oživljavanja nastavlja sadašnjem trenutku. Uarren Ueaver pominju mogućnost korišćenja kompjutera za prevođenje jezika u memorandumu 1947. A tek sedam godina kasnije, bila je stavljena u teoriji prakse tokom slavi Džordžtaun IBM eksperiment. The „elektronski mozak”, kako je nazvana u IBM press release, uspeo proizvesti jedan razumljiv prevod od 60 rečenica iz ruskog na engleski pomoću šest gramatika pravila i 250 rečnik unosa. Profesor Leon Dostert, a Džordžtaun jezik učenjak, proglašen „u pet, možda tri godine otuda, što znači obraćenje međujezične elektroničkom važnih procesa u funkcionalnu područjima više jezika maj kvalitetno biti ostvaren činjenica.” | Intertran – Tokom određeni član twentieth century, mašina prevod iskusan jedan meteorski izlaženje, dobro podjednako meteorski pasti, pa jedan preporođenje trajan za danas. Warren Tkalac navedenim određeni član mogućnost nad pomoću računar za prevesti jezik unutra jedan 1947 beleška. JEDAN puki sedam godina kasniji, teorija je uliti vježba tokom određeni član uvažen Georgetown IBM- eksperiment. Određeni član „electronic mozak i tako je zvan unutra određeni član IBM- izviješće za tisak , izvediv za proizvod dobro razumljiv prevod nad 60 rečenica iz Rus u Engleski jezik pomoću šest gramatika pravilo pa 250 rječnik entries. Leon Dostert , jedan Georgetown jezik školarac, proklamiran „in pet , možda tri godina stoga , jezik posrednik značenje pretvaranje kod elektronički napredak unutra važan upotrebljiv područje nad nekoliko jezik smjeti izvor postojati dobro ostvaren fakt”. | SDL – U dvadeseti vek, OT je iskusni Meteorski uspon, jednako Meteorski jeseni, i ponovnog oživljavanja nastavlja da to vrijeme. Warren Tkač pomenuo mogućnost upotrebe kompjutera prevesti jezik u 1947. godine memorandum. Samo sedam godina kasnije, teorija je put u praksi tokom proslavio univerziteta IBM eksperiment. „elektronskihmozak”, kao što je pozvao na IBM saopštenje za javnost, uspela je da proizvedu je razumljivo prevod 60 kazne sa ruskog na engleski jezik koristi šest Gimnazije pravila i 250 rečnik radova. Profesor Leon dostert, Univerziteta jezik stipendista, proglašena, „[u] pet, možda tri godine zbog toga, interlingual značenje pretvaranje elektronskim procesa u korisni funkcionalne oblasti nekoliko jezika mogao bi da bude urađena je činjenica.” | ČOVEK – Tokom dvadesetog veka mašinsko prevođenje je doživelo meteorski uspon, zatim podjednako meteorski sunovrat, da bi se njegov ponovni uzlet nastavio do današnjeg dana. U memorandumu iz 1947. godine, Voren Viver je naveo mogućnost da se računari koriste za prevođenje. Jedva da je prošlo sedam godina, a teorija je pretočena u praksu tokom poznatog IBM-ovog eksperimenta u Džordžtaunu. „Elektronski mozak”, kako ga je IBM nazvao u izjavi za štampu, uspeo je da prevede na razumljiv način šezdeset rečenica sa ruskog jezika na engleski, uz pomoć šest gramatičkih pravila i 250 rečničkih odrednica. Profesor Leon Dostert, lingvista iz Džordžtauna, proklamovao je da će „kroz pet godina, a možda čak i tri godine, interlingvalno prenošenje značenja elektronskim sredstvima u važnim funkcijskim područjima nekoliko jezika vrlo moguće biti gotova stvar.” |
| | Prevođenje s jednog prirodnog jezika na drugi često se među laicima redukuje na prostu zamenu reč-za-reč. Međutim, traduktologija, nauka o veštini prevođenja, ovu zamenu priznaje kao najniži nivo procesa prenošenja poruka jednog prirodnog jezika na drugi, iznad kog se nalaze bukvalno prevođenje (lišeno specifičnosti pojedinog jezika, poput idiomatskih konstrukcija, što je u Srbiji često korišćena tehnika) i prevođenje smisla, „pravo prevođenje”. Upravo su prevodi koje su proizveli računari dokazali apsurdnost predstave o prevođenju kao procesu proste supstitucije reč-za-reč, jer su prvi modeli automata upravo počivali na ovom principu, pri čemu su reči jednog, izvornog jezika zamenjivane rečima drugog, ciljnog jezika pomoću odgovarajućih opštih rečnika, odnosno specijalizovanih glosara. Iako su pojedini sporadični modeli davali gotovo impresivne rezultate, ovaj princip je mašinsko prevođenje izveo na zao glas i, barem doskora, izazivao podsmeh profesionalnih prevodilaca.Iako su sposobni da određene operacije izvedu neuporedivo brže od čoveka, računari ne poseduju ljudski intelekt, a samim tim ni potencijal za izvođenje formalnih operacija višeg reda. Brojne fleksibilne, a uz to i neizostavne prevodilačke tehnike (poput adaptacije, dodavanja, oduzimanja, permutacije), koje prevod čine, paradoksalno, ujedno i tačnim i jedinstvenim, naprosto prevazilaze mogućnosti računara. Zato su razvijeni određeni različiti pristupi ovoj problematici, od kojih je najpoznatiji statistički metod, koji se u praksi najbolje pokazao, te se i Google Translator zasniva upravo na tom modelu. Za statistički pristup, kao i za ostale moderne modele mašinskog prevođenja, karakteristično je to da osim bazične zamene reč-za-reč koriste i složenije tehnike, pre svega one koje se oslanjaju na velike bilingvalne korpuse, tj. pretražive lingvističke banke tekstova i izraza, kolokacija i idioma u njima, sakupljenih iz različitih izvora. Statistički metod ovim postaje neuporedivo efikasniji i mnogostruko tačniji, jer problem tumačenja smisla prepušta programskoj rutini koja analizira delove teksta prema parametrima utvrđenim analizom dvojezičnih korpusa. Dostupnih internet servisa za mašinsko prevođenje ima mnogo, međutim samo nekoliko njih nudi prevod na srpski i sa srpskog, pri čemu kvalitet prevoda veoma varira, kako između samih servisa tako i u zavisnosti od toga koji tip teksta pokušavamo da prevedemo. Tri giganta pretraživanja Interneta – Google, Yahoo (babelfish.yahoo.com) i Microsoft (www.microsofttranslator.com) nude usluge automatskog prevođenja, ali je samo jedan od njih, svemoćni Google, uvrstio srpski među podržane jezike. Na Webu se među besplatnim servisima sa podrškom za naš jezik mogu još naći automati kompanija InterTran i SDL. Pogledajmo sada kvalitet ponuđenog. Google Translate Na adresi translate.google.com nalazi se trenutno najpopularniji, najpotpuniji i, slobodno se može reći, najkvalitetniji besplatni servis za mašinsko prevođenje. Tipično za Google, početna strana je svedena i nudi okvir u koji možete upisati, odnosno iskopirati tekst ili link, pri čemu će, u slučaju da odaberete drugu soluciju, biti prevedena čitava web strana. Izbor izvornog i ciljnog jezika vrši se putem padajućeg menija ili ponuđenog spiska od četrdesetak svetskih jezika, a postoji i opcija Swap kojom je moguće jednostavno zameniti smer prevođenja. Takođe, moguće je učitati dokument sa sopstvenog računara, što je svakako više nego dobrodošla opcija. Google nudi još sijaset srodnih usluga kao što su, na primer, Translate & Search čijim korišćenjem prevedeni tekst automatski pretvarate u kriterijum za pretraživanje, ili Google Translator Toolkit koji podseća na neke profesionalne alate i služi za tzv. post-editing, profesionalnu obradu sirovog teksta koji daje mašinski prevodilac. Googleov automat donedavno se zasnivao na jednom od najstarijih i najpoznatijih mehanizama za mašinsko prevođenje SYSTRAN, koji i dalje koriste Yahoo i AOL. Međutim, Google je (gle čuda) uspeo da razvije sopstveni mehanizam za mašinsko prevođenje koji je baziran na istraživanjima Franca Jozefa Oha, pobednika DARPA-inog konkursa za brzo mašinsko prevođenje. Statistički metod koji je osovina Googleovog mehanizma počiva na titanskom korpusu tekstova, ni manje ni više nego Ujedinjenih nacija, što zajedno sa Ohovim inovativnim pristupom daje dobitnu kombinaciju kada je u pitanju kvalitet konačnog prevoda. Naravno, nikada se ne sme smetnuti s uma činjenica da od mašinskog prevoda ne treba očekivati čuda: kada su u pitanju tekstovi tehničke ili „opšte” prirode (poput članaka sa Wikipedije), možemo se nadati natprosečno dobrim rezultatima. Međutim, zađemo li makar malo u gustu šumu slobodnijeg, žurnalističkog ili književnog diskursa, sav tradicionalni podsmeh dobija na aktuelnosti – rezultati se kreću od nekoherentnih, preko nerazumljivih, pa do gotovo smešnih. Poređenje prevoda različitih tipova tekstova dobijenih na testiranim servisima možete pogledati u uokvirenom tekstu. InterTran Na stranici www.tranexp.com:2000/Translate/index.shtml nalazi se još jedan automat za mašinsko prevođenje sa podrškom za srpski. U vlasništvu je kompanije InterTran koja prodaje softver za, pogodićete, mašinsko prevođenje. Interfejs je i ovde sveden i jednostavan za korišćenje, sličan Googleovom, mada nešto manje logičan, sa mogućnošću unosa teksta ili hiperlinka. Međutim, nakon što pritisnete dugme Translate, nećete biti baš oduševljeni onim što ćete dobiti. U zavisnosti od tipa teksta, rezultati se kreću od jedva zadovoljavajućih (smisao originala se dâ razlučiti iz „prevoda”) do, nažalost, naprosto neupotrebljivih. Zaista nije potrebna pomoć transformativno-generativne gramatike da bi se došlo do dubljeg značenja prevoda koji dobijate, jer njega očigledno nema. Next! SDL Automated Translation Treći po redu na našoj listi je automat koji nam nudi kompanija SDL, pominjana u prethodnim brojevima „Sveta kompjutera” u vezi sa perjanicom svoje ponude – CAT programom Trados. Međutim, SDL ima u ponudi još proizvoda koji se bave problematikom prevođenja, a jedan od njih je i Enterprise Translation Server, automat za mašinsko prevođenje. Kako bi svetu prikazao snagu svoje vlasničke platforme, SDL na adresi www.freetranslation.com nudi online verziju ETS-a. SDL ne daje nikakve pojedinosti u vezi sa svojim mehanizmom, ali to i ne mora da bude toliko važno. Neuporedivo je važnije to kakve rezultate daje mašinski prevodilac, a oni su negde na pola puta između Googlea i InterTrana, ponegde sasvim uporedivi sa onima koje daje Googleov servis. Kome ovo može da koristi? Poslovična je istina da nijedan prevod nije isti kada su njegovi autori humani prevodioci, a na osnovu ograničenog uzorka automata za mašinsko prevođenja možemo konstatovati isti slučaj. Ono što je bitno i kod jednog i kod drugog jeste kvalitet, a on je u slučaju dobrih prevodilaca nedvosmisleno na strani ljudi. Međutim, nameće se pitanje iskoristivosti ponuđenih automata na Internetu. Bilo da se radi o pojedincima ili kompanijama, postoji jasna upotrebna vrednost koju oni mogu izvući iz ovakvih servisa, ali samo ukoliko ne smetnu s uma da se radi isključivo o vrednosti informativnog karaktera i da se prevodi takvog tipa nikako ne mogu koristiti u bilo kom ozbiljnijem kontekstu. Još ne. Petar ŽIVANIĆ | | |