Компютърните лингвисти работят усилено по програми за хора с увреждания
Компютърните лингвисти работят усилено по програми за хора с увреждания / снимка: sxc.hu
Компютърните лингвисти работят усилено по програми за хора с увреждания
63741
Компютърните лингвисти работят усилено по програми за хора с увреждания
  • Компютърните лингвисти работят усилено по програми за хора с увреждания

Все по-популярни стават системите за гласов контрол над осветление, асансьори, електроуреди. В научно-фантастичните филми например отдавна показаха охранителни системи със сензори за разпознаване на ретината. Това е наука, наречена компютърна лингвистика.

Дарик разговаря с един от най-изявените учени в световната компютърна лингвистика - проф. Хинрих Шютце. Той е ръководител на Центъра за обработка на информация и език към Университета в Мюнхен. Проф. Шютце е и председател на 51-вата Годишна среща на Асоциацията за компютърна лингвистика, която през 2013 г. ще се проведе за първи път в София. Столицата ни е домакин на форума между 4 и 9 август.


Проф. Шютце, кои са компютърно-лингвистичните приложения, които всички ние познаваме и използваме всеки ден, но не си даваме сметка, че това е компютърна лингвистика?

На първо място бих поставил интернет търсачките, които всеки ден милиони хора по целия свят използват. Казвам го, защото си спомням когато се появиха първите такива търсачки. Те бяха наистина доста зле развити. Те изпълняваха изключително прости заявки и се търсеше единствено по ключови думи. Причината да са на толкова добро и високо ниво днес е компютърната лингвистика. 20 или дори може би 50% от работата на една търсачка е базирана на компютърна лингвистика. Мисля, че това е едно от нещата, които почти всеки от нас използва всеки ден, нещо, което е повлияло на начина ни на живот. Едно от приложенията, което бих дал за пример е SIRI. Тук отново не говорим изцяло, 100% за компютърна лингвистика. Бихме могли да спорим до колко SIRI е разработка на компютърната лингвистика, но отново е около 50%. Машинният превод също е нещо, което бих поставил в тази категория. Приложението Google Translate е изцяло машинен преводач.  Всички знаем, че и той не работи перфектно. Хора от нашата гилдия дори наричат работата му същински превод, защото той превежда думите буквално. Там не се търси абсолютно точния превод, там се хваща смисъла на преведения текст. Това обаче е доста полезно. Ще ви дам пример. Когато аз наемам служители в моя институт, много от тях не говорят немски език. А документацията и регистрите, които трябва да попълват, често са именно на немски език. И те могат да правят всичко това сами  и да си вършат работата, използвайки инструменти като Google Translate. Мисля, че това е нещо много впечатляващо. То е нещо, което не е съществувало преди 5 или 10 години. Мисля, че това е едно от нещата, с които компютърната лингвистика е докоснала живота на много хора по целия свят.

Възможно ли е програмите за машинен превод да станат толкова добри, че след време да нямаме нужда от хора, които да превеждат? Смятате ли, че е възможно човечеството да преодолее езиковите бариери - да отидем в чужда държава и да можем свободно да общуваме с хората там само посредством машинен превод?

О, не! Не мисля, че ще е възможно някога това да се случи. Защото не става дума само за езиковите бариери. Тук говорим също и за културните бариери. Не мисля, че е възможно, ако не познаваш културата на мястото, където отиваш, да можеш да комуникираш с хората. Просто нямаме общи културни разбирания, общи разбирания за света. Това не може да се направи с машинен превод, независимо колко добър е той. В това отношение мисля, че винаги ще са необходими хора. И това е нещо много хубаво. Знам, че в бъдеще ще направим още много открития и разработки, за да се усъвършенстват машинните преводи. Не знам колко време ще отнеме, може дори и да е след 100 години. Сигурен съм обаче, че ще можем да правим перфектно някои неща. Ще можем да превеждаме  доста неща автоматично - упътвания или дори може би закони. Тези неща са напълно възножни. Не мисля обаче, че ще може да превеждаме автоматично литература или поезия - тези неща са на културно равнище, машините не биха ни били полезни тук.

Компютърната лингвистика и разработките в приложенията, до които се достига благодарение на нея, може ли да бъде полезна за хората с увреждания например? Това означава механизирането на домовете, като гласови командъри и други?

Да, вече се правят такива програми за гласово разпознаване, които отново не работят перфектно, поне засега. Но наистина мисля, че те помагат изключително много на хората със специални потребности. Гласовите командъри се развиват все повече и могат да изпълняват повече и по-разнообразни команди. Това е полезно за хората с нарушено зрение например. Група от наши учени-изследователи разработва в момента програми с хора, които са парализирани и не могат да се движат изобщо. И само чрез мигване на окото или издадени звуци те ще бъдат способни да използват компютър и да комуникират по този начин. Това е един съвсем новаторски подход и ниша на изследователска дейност. Вече сме направили два уъркшопа с такива разработки и се подготвяме за още един, който ще се състои тук, в София по време на 51-вата Годишна среща на Асоциацията по компютърна лингвистика от 4 до 9 август.

Какви са Вашите очаквания от развитието на компютърната лингвистика в бъдещето? Кои са областите, които искате да се развиват, и кои са областите, които смятате, че ще се развият по-бързо заради потребностите на бизнеса и потребителите?

Истината и фактите са, че фундаменталните открития в нашата област, които в повечето случаи са дългосрочни разработки, обикновенно се осъществяват чрез държавно финансиране. Бизнесът се включва, когато вече има някаква разработка, която е в процес на развитие. Бизнесът се интересува от един готов вече реализиран продукт или ако продуктът може да бъде завършен в близките една-две години. Така той си осигурява краткосрочни ползи на своите инвестиции. Лично аз бих искал в сферата на изследване да се работи повече в дълбочина, тъй като в момента повечето приложения използват повърхностно знанията, които имаме, а не толкова истинското значение на думите и фразите. Отново ще дам пример с машинния превод. Там се търсят съотватствия между думи и фрази от един език в друг - правилните еквиваленти. Би трябвало да се работи в посока на вникване в контекста на думите и това, което стои зад тях. Трябва да се развива разбирането на езика за езика. Разбира се, важно е да има финансиране от държавата, така както и от бизнеса. Не бива те да са в конфликт, трябва да работим заедно.

Има ли глад за млади специалисти в областта на компютърната лингвистика? Интересуват ли се младите хора от тази наука?

Да, мисля, че има, защото специалността се разширява и има нужда от нови специалисти. Икономиката, базирана на познанието, е приоритет на бъдещите общества, така че обработката на естествения език и като цяло обработката на данни е аспект, който се развива ежедневно. Затова има и голямо място за млади хора с идеи в тази област.

Какво ще може да видим на 51-вата Годишна среща на Асоциацията по лингвистика, която ще се проведе за първи път в София? Подготвяте 11 уъркшопа, какво може да очакваме?

Уъркшоповете наистина са един чудесен начин за студентите и докторантите да се запознаят с нашата наука. Тази година ще има един специален уъркшоп - само за студенти и докторанти. Там те ще могат да представят собствените си разработки, както и да развиват идеите си. Това е добре, защото по този начин те ще могат да създават контакти, да се запознаят със специалисти в областта. Конференцията ще е отворена за всеки, който се интересува и иска да види и научи нещо ново. Ще има и обучения, на които също ще демонстрираме пред учениците и студентите нови програми и теми.