Како едноставните јазични правила еволуираа во напредни системи за машинско преведување кои можат да конвертираат огромни количини на податоци во милисекунди? Сето тоа е во изработка со децении. Можноста за автоматско машинско преведување одамна е предмет на фасцинација за човештвото. Конечно се материјализираше во 1950-тите. Тогаш беа создадени првите компјутерски системи за машинско преведување.
Потекло на машинскиот превод
Голем дел од овој процес беше започнат од човек за кој многумина од нас дознаа повеќе преку „Играта со имитација“. Алан Туринг, британски информатичар и главниот лик на филмот од 2014 година, истакна дека за правилно учење, компјутерот треба да го имитира човечкиот ум и да работи врз основа на постојани обиди и грешки. Туринг направи обиди да ја искористи оваа технологија за да произведе природен јазик уште во 1949 година. Како дел од својата работа, Туринг го развил сега познатиот Туринг тест. Ја проценува интелигенцијата на машината врз основа на нејзината способност да измами личност да мисли дека зборува со друго човечко суштество (наместо со компјутер). Човечкиот прашалник поставува низа прашања и на човек и на компјутер и се обидува да одлучи кој е човекот, а која машина врз основа на одговорите.
Во 2018 година, Google Duplex успешно закажа состанок со фризер преку телефон. Рецепционерот целосно не знаел дека разговараат со уред со вештачка интелигенција. Некои го сметаат ова за современ тест Туринг тест и покрај тоа што не се потпираат на вистинскиот формат на тестот како што е дизајниран од неговиот истоименик. Она што ова го покажува е напреден развој во машинското учење и разговорната вештачка интелигенција. Работата на Туринг помогна да се постави теренот за развој на машинското преведување.
Превод заснован на правила за владина употреба
За време на Студената војна и американската и руската влада беа особено мотивирани да инвестираат не само во криптографија и декодирање на шифрирање, туку и во системи кои ќе помогнат брзо да се преведат пораките. Во тоа време, беа развиени машини за извршување на првите ограничени преводи базирани на правила. Под правила засновани, подразбираме преводи што се потпираат на вградени лингвистички правила и речници за секој јазичен пар. За да работи правилно, во компјутерот требаше да се внесе целосниот речник и граматика на многу јазици. Ова го продолжи процесот што веќе одзема многу време. Раните преводи што тие ги направија навистина беа прилично „машински“, без соодветна синтакса или граматичка исправност. Овие машини исто така не беа ништо како персоналните компјутери што ги користиме денес. Тие беа со големина на мали камиони и не се користеа за деловни или лични апликации.
Благодарение на подемот на интернетот, потребата за меѓународна комуникација се зголеми со невидена брзина. Глобалните брендови одеднаш се соочија со предизвикот за дистрибуција и маркетинг на производи во многу целни области и им требаше брз начин да ги забрзаат напорите за превод. Во 1992 година беше создадена првата јавна услуга за машинско преведување. Тоа беше превод на онлајн форум од англиски на германски. Набргу потоа, во 1995 година, беше воведен Babel Fish Altavista — систем кој автоматски може да преведува текст на неколку јазици. Програмата беше слободно достапна на интернет и донесе машински превод до масите. Овие програми користеа статистички машински превод. Овој метод го преведува изворниот материјал врз основа на најчестите претходни преводи кои биле претходно направени. Овие програми не беа без свои недостатоци. Слабоста е што може да преведе фраза само ако постои во постоечките референтни текстови. Дополнително, преведените реченици честопати беа бесмислени бидејќи програмата не можеше да се справи со многу нејаснотии на контекстот.
Во 2020 година, најсовремениот невронски машински превод можеше веднаш да преведува текстови со 60-90% точност, што значи дека треба да се направи уште доста уредување и обезбедување квалитет за да се помине стариот Тјуринг тест со оваа програма.
Преведувачката индустрија продолжува да се соочува со нови предизвици: зголемената важност на гласовниот превод, брзата анализа на податоците и надминувањето на комуникациската бариера за над 6.000 јазици што се користат ширум светот.