НОВИНИ ОТ БЪДЕЩЕТО: Кога компютрите ще разбират нашите говорими езици?

София, 22 април 2015 г. – В Деня на Земята, участници в олимпийските отбори на България по природни науки представиха бъдещето – това, което се случва днес, благодарение на науката. Отборите поканиха представители на медиите у нас на специална среща, за да представят накратко себе си и своята дейност с любопитни новини от света на науката, филм и демострация. Целта на срещата бе да бъде създаден Олипмийски пресклуб – кръг от приятели на образованието и науката. Основна роля на клуба ще бъде да информира обществеността за дейността, постиженията и успехите на олимпийските ни отбори по природни науки, донесли на България стотици медали от най-престижните научни състезания за младежи в света.


На срещата всеки от отборите представи своята новина от бъдещето, на която всички ще станем свидетели съвсем скоро, благодарение на областта, в която съответният отбор се състезава. Отборът по математическа лингвистика ни разкри, че съвсем скоро ще говорим на един език с всички машини:

Кога компютрите ще започнат да разбират нашите говорими езици?

Общуването с компютри винаги е било предизвикателство за доста хора. Една от основните причини е, че компютрите не разбират (или поне далеч не напълно) нашите говорими езици. Тези езици се наричат “естествени езици”. За разлика от тях компютрите разбират “програмните езици”, а хората, които превеждат на тях, наричаме програмисти.

Ако погледнем назад за последните 50-60 години общуването с компютри се е променило значително. Първите електронноизчислителни машини са можели да работят само с език, състоящ се от нули и единици. Не е трудно да си представим колко сложно и несвойствено е за човек да пише програми на такъв език.

За щастие новите програмни езици далеч не са толкова странни. В тях присъстват оператори и променливи, които са доста по-малък брой в сравнение с думите в някои естествен език, но все пак те са разбираеми и близки за програмистите. Най-често се използват директни заемки на думи от английския като най-широко разпространен език в ИТ индустрията по цял свят.

Все още остава трудно обаче с компютрите да се комуникира на естествени езици. Въпреки че има съобщения, които компютърът извежда и са написани на естествен език, те почти винаги са просто изход от програмата и не са разбрани от самата машина. Още по-ясно се виждат проблемите, когато се очаква от компютрите да разберат естествените езици. За момента е почти немислимо да кажем на лаптопа си например “Отвори ми файла със задачите от миналата година от състезанието в Русе”. Вместо това използваме клавиатура и мишка, да са постигнем този резултат.

Всъщност обаче компютърната лингвистика се е захванала много сериозно с този проблем. Хиляди учени от цял свят работят за разрешаването му и първите резултати вече са налице.

Вече почти всички търсещи машини (напр. Google) имат и опция да се зададат критериите (думите, по които да търси) и с глас. Не сте го забелязали? Когато отворите основната страница в края на полето, в което обикновено пишем думите, има бутонче с изобразен на него микрофон. След като го натиснете ще може да кажете това, което искате търсачката да ви намери. Да, наистина работи! При това работи и на български език учудващо добре. Компютърът разпознава вашия говор и го разбира. Началото на десетилетна борба за комуникация с машини на естествен език е поставено!

Тук е мястото да отбележим два основни проблема, които са възпрепятствали този процес да се случи по-бързо. Първият е, че езиците са много различни в целия свят. Математиката е една и съща във всяка държава, същото важи за химията, физиката и т.н. Но езикът, на който хората говорят, не е. Това означава, че компютрите трябва да започнат да разбират не един, а всички естествени езици. А те са много и различни. Имат различни граматики, използват различни звуци, някои (както българският) имат по доста форми на думите, а в Азия повечето езици имат и тонове (нещо, което е трудно да повярваме, но е истина).

Друг проблем от близкото минало беше, че е необходима много голяма процесорна мощ и огромна база данни, за да може компютърът да анализира човешка реч и да разпознае думите в нея. Но в наши дни това не е проблем. Не толкова защото процесорите са станали по-мощни или компютрите имат повече памет. Ключовото е, че тъй като в момента почти всички компютри имат връзка с интернет, то този анализ не се извършва на устройството пред вас, а на големи и мощни компютри, разположени някъде по света. От вашата машина по интернет до тези изчислителни центрове се изпраща звуков запис на вашата реч, там се обработва и разшиврова, след което към вашия компютър се връща в разбираем за него формат.

Именно по подобен начин работи и едно от най-разпространените приложения в тази област. Това е гласовият асистент на вашия мобилен телефон. Отдавна вече е възможно и лесно голяма част от функциите на телефона да ги управлявате с глас: да се обадите на някой телефон от указателя, да изпратите кратко съобщение, имейл, да сложите напомняне в календара, да кажете коя песен искате да чуете и други. Да, това наистина работи и се използва от много хора. За съжаление все още няма възможност за употреба на български език, но да се надяваме, че скоро и това ще е реалност.

Ние, които се занимаваме с математическа и компютърна лингвистика, сме сигурни, че в съвсем скоро време гласовото управление на компютри, телефони и други устройства ще придобие много по-голямо разпространение. Ще започнем да говорим не само на телефона, а също и на автомобила си, на домакинските уреди, на асансьорите и какво ли още не. Това ще стане част от ежедневието ни и ние въобще няма да го забелязваме и ще свикнем да живеем с него. Да се надяваме, че тостерът няма да ни подслушва какво си говорим, когато се приберем късно вечер!