Преди няколко години беше актуализиран въпросът за замяната на кирилицата в нашата страна с латиница. Поводът беше изказването на австрийския учен българист Ото Кронщайнер, който заяви, че за да се надяваме на някакво членство в Евросъюза, трябва да приемем официално латиницата. Това предложение разбуни страстите и бе мощно отхвърлено. Напълно безпочвени се оказаха и твърденията на загрижени западни евроинтегратори преди години, че щем не щем, ще се откажем от кирилицата, защото няма да можем да пишем имейли и да ползваме свободно интернет. Днес отново се актуализира въпросът за писането на латиница. Но вече не с идеята тя да замени кирилицата, а за да я "превежда" унифицирано.
За представяне на буквите и други печатни знаци в компютрите се използва така нареченото кодиране. Много често обаче се появяват затруднения при писане. Голяма част от хората споделят, че искат да пишат повече на кирилица, защото латиницата е неудобна за писане и ги изморява. Някои дори считат, че има дискриминация на кирилица спрямо латиница. Неудобствата се появяват най-вече при писането на SMS или при търсенето на алтернативи за писане на букви като И ударено. Въпросът наистина е спорен и предизвиква дискусии. Поради тази причина учени от БАН са разработили проект, чрез който се предлага нов вариант за транслитерация между кирилица и латиница в българския език. Техните идеи са изложени в специален сайт, който предлага интересни виждания по разни проблеми. В какво се състои самата инициатива!
Идеята е на Института по математика и информатика към БАН заедно с Института по български език и литература. Проектът е финансиран от Министерството на образованието и науката и е с цел да се улесни използването на български език в интернет.
Да отбележим, че съществуват две възможности за кодиране на български език на латиница. При единия начин се използва приетият от Министерския съвет стандарт за кодиране на имена, въпреки че той не отговаря за изискванията за краткост. Втората възможност е това кодиране да остане само за имената, а за комуникация да се използва по-кратък вариант.
Идеята е да се въведе стандарт за транслитерация между кирилица и латиница, да се установи такъв за фонетична клавиатура и да се реши проблемът с И ударено.
Защо е необходимо това? Защото при писане възникват различни технически проблеми.
За по-кратък вариант се предлага кодирането на 30-те букви на кирилицата да се осъществява чрез 26-те букви на латиница, като всяка буква си има съответствие на латиница. Изключение правят само Ю, Я, Щ и Ь - те се кодират като: ЙУ, ЙА, ШТ и Й. Ето как ще се кодират останалите букви:
а- а e- e k-k п- p ф- f щ- wt
б- b ж- x л- l p- r x- h ъ- у
в- v з- z м- m c- s ц- с ь- j
г- g и- i н- n т- t ч- q ю- ju
д- d й- j o- o у- u ш- w я- ja
Този вариант е кратък и лесен за научаване (повечето български букви се предават с една латинска). Грешка може да се получи само при двойните букви и при Ъ. Могат да се получат дори забавни игри при декодирането на думите - например при декодирането на Схема се получава Шема.
Интересно се получава и при кодирането на Й,Ь и И, защото за тях се използва само една буква - J. Но и тук има разрешение - когато е отделна дума, се използва И ударено.
Друга грешка може да се допусне и от това, че Й, Ь и И се кодират от една и съща буква - J. Но и тук е лесно - когато е отделна дума, И е ударено, а когато е следвано от О и пред него има съгласна, е Ь, а в останалите случаи е Й.
За обратна транслитерация - за кодиране чрез кирилица на дума, написана на латиница, се препоръчва използването на същата таблица, но думата да се огражда с апострофи.
"Аз си инсталирах Шиндошс 98".
Не, това не е закачка! Означава съвсем тривиалното съобщение " Аз си инсталирах Windows 98".
Как стои въпросът с SMS- ите? Много хора недоволстват поради проблемите, свързани с изпращането на SMS на кирилица. Не само че трябва да се изразявате с непривични за вашия език букви, ами ако имате възможност да пишете съобщения на кирилица, то дължината им ще е два пъти по-малка заради ограничения брой байтове. Буквите на кирилица се кодират с два байта, а на латиница само с един - т.е за същите пари, които се плащат за изпращане на SMS на латиница, хората получават два пъти по-къс SMS на кирилица.
Според специалистите трябва да се направи поправка на закона за далекосъобщенията. Предложението е - ако един GSM оператор използва кодиране, при което SMS-ите на кирилица са два пъти по- малки от тези на латиница, той е длъжен да компенсира клиентите си с намаление на цената на SMS- ите на кирилица ( да речем с 10%)
Другият проблем е, че много от GSM-апаратите нямат функция за кирилица. Предложението на учените за решаване на този въпрос е да се промени кодирането на SMS-ите. Всъщност това е почти невъзможно, защото много трудно би се променил целият софтуер на GSM операторите. Затова предложението касае само софтуера на GSM-апаратите.
Например, когато се напише SMS на кирилица - първо да се кодира на латиница съобразно стандарта за обратимо кодиране, и след това да се изпрати от GSM-апарата. Накрая на съобщението да се добавя специален Unicode символ, който ще показва, че съобщението е на кодирана кирилица, а не на латиница. По този начин, ако сте ограничени до 100 символа на латиница, то ограничението става 98 на кирилица - тоест губите само два байта за Unicode символа. При буквите Щ, Ю и Я, които се кодират двубуквено, ограничението става 85-95. Това, разбира се, зависи от броя на тези букви в самото съобщение. Така дължината на SMS-ите се увеличава с около 60% и хората ще могат спокойно да пишат на кирилица. Ако съобщението се получава на латиница, то получателят ще може да го прочете, макар да му се наложи да го декодира. По този начин всички SMS-и са кодирани еднакво и без правописни грешки.
Могат да се получат интересни неща при изпращането на съобщения или при използване на чата. Там има различни варианти за едни и същи букви. Например:
trqbva - вместо trjabva (ще се прочете "трчбва") или shte - ще звучи като "схте". Също се използва да речем kioravite вместо kjoravite.
На някой може да му се стори, че приемането на стандарти за транслитерация е път към официализирането на две азбуки за българския език - кирилица и латиница, както е например в Сърбия и Черна Гора. От Института по български език към БАН обаче са категорични, че това няма нищо общо с целите на техния проект. Според Петя Костадинова, научен секретар на БАН, при настъпилия хаос при транслитерирането между кирилица и латиница е съвсем нормално да се търси общ стандарт. Този процес се съпътства и от това, че целият свят в момента е съсредоточен върху английската латиница, защото английският език се налага като международен. Както например се е използвала френската латиница по време на Третото българско царство.
КАРЕ 1
Проблемът с фонетичната клавиатура
Въпросът с фонетичната клавиатура също предизвиква горещи дискусии. За много хора е неудобство, че няма такава и за GSМ- апаратите. Поради тази причина учените предлагат фонетичната клавиатура да се приеме като държавен стандарт, заедно с БДС и освен за компютрите да се приеме фонетична клавиатура и за GSM-апаратите. Нейният принцип ще се състои в следното - 26-те букви от кирилицата да се избират по същия начин като 26-те букви от латиницата. За 22 от тези букви съответствието е същото, както при наложения до момента стандарт. Ето какво се предлага за другите букви: фиг 2
По този начин всяка буква ще бъде на клавиша на съответната си буква от латиницата. Изключение ще са само буквите Ю,Я ,Щ, Ь и И ударено. Интересното тук е как Ь и И ще са на един и същ клавиш. В повечето случаи тези букви се използват като малки. Затова на този клавиш ще отговаря ь( малко), а когато се натисне SHIFT, ще се появява И ударено вместо Ь( голямо). При натискане на клавиша Caps Lock тези букви ще се използват като големи. Виждаме, че авторите предлагат да се добавят и символите за евро и номер, които се поставят над цифрите 6 и 3. Друго предложение е да се направи изменение и на БДС клавиатурата да се добави И ударено и знаците за евро и долар. И ударено може да стои на клавиша с Ь, а знаците за евро и долар да се поставят на местата на символите I и V.
КАРЕ 2:
Проблемът с И ударено
Определено това е проблем в българския език и създава редица неудобства при писане. Причината е, че когато се наложи да използваме тази буква, се чудим с какво да я заменим. Предложението е да се въведе клавиш с тази буква, който да се използва и при БДС. Също така да се приеме, че когато по технически причини не може да се напише И ударено, да се пише на негово място Й. И накрая - да се коригират всички кирилизирани шрифтове така, че да включват малка и главна буква И ударено.
Въпросът е прекалено сериозен, за да може да бъде решен само от два института в БАН.
Ако бяхме 1990 г., щях да се съглася веднага, но през 2005, 15 години след началото на Интернета у нас, това е доста закъсняла стъпка. В момента в методиевицата (български език, но с latinski букви) е вече навлязла толкова много в бита, че уреждането й тепърва със стандарт е на практика невъзможно. Нека помислим малко - в момента има много знаци, които заместват успешно буквите - напр. sh=6 (ш), ch=tsch=4 (ч), ia=ja=q (я), zh=j (ж) и хората се справят успешно.
Съществуват и няколко автоматични преводи - напр. http://prevod.bol.bg, където се използват и знаци като ^ за "ч", или [ за щ...
Дано успеят в БАН, но шансовете този стандарт да започне да се използва не са много големи...