Някои предложения за транслитерация
от Димитър Скордев

      Настоящите бележки са свързани с една инициатива в БАН за въвеждане на стандарти за транслитерация между кирилица и латиница и за фонетична клавиатура. Една от главните причини за тази инициатива са някои несъвършенства на действащия в момента стандарт за транслитериране на български имена (информация за него може да се намери например в един въпросник, изработен в рамките на споменатата инициатива). При избора на този стандарт се е целяло улесняване главно на англоезичните чужденци при произнасянето на български имена (отначало са се имали пред вид даже само географски имена), а някои съображения, имащи значение за самите българи, са останали на по-заден план. Ето защо въпросната система за преобразуване от кирилица в латиница, макар и общо взето приемлива в качеството на българско-английска транскрипция, не е според мен добра като транслитерация от кирилица към латиница.

      Несъвършенствата на стандарта в споменатата насока се проявяват най-вече при използването му за транслитериране на произволни думи от българския език - нещо, от което засега все още се нуждаят доста българи, за да могат да си служат със своя роден език при използване на електронна поща, SMS или чат. Най-сериозният проблем е, че двете често срещани български букви А и Ъ се заместват с една и съща латинска буква. В резултат на това много думи от българския език, като да речем важен, въжен, ласкав, лъскав, мажат, мъжът, мачът, мъчат, мравка, мръвка, пак, пък, плах, плъх, прав, пръв, след транслитерация се превръщат в буквени низове, недопускащи еднозначно възстановяване на първоначалната дума (понякога може да се случи даже и контекстът да не позволява такова възстановяване - например ако имаме работа с някое от изреченията "Край селото има въжен мост", "Той се оказа прав, но не беше пръв" или "В чинията ми пък има мравка"). Всъщност проблемът възниква в немалко случаи дори и да се ограничим с прилагането на стандарта само към личните имена на българските граждани (така както той се използва сега в документите за самоличност) - съставил съм списък на около 450 фамилни имена, срещащи се в България, които поради съвпадането на кодовете на А и Ъ също не биха могли да се възстановят еднозначно по резултата от тяхното транслитериранe. Макар и в значително по-малка степен, имаме този проблем и за някои имена на наши населени места: Бата, Бъта, Кран, Крън, Марчево, Мърчево, Плазище, Плъзище, Панчево, Пънчево, Расово, Ръсово.

      Отбелязаният сериозен недостатък на разглежданата система за транслитерация създава пречки за автоматизацията на обратното преобразуване - от транслитерирания текст към неговия първообраз. Разбира се в случаите, когато даже и контекстът не помага за възстановяване на първоначалната дума, няма надежда положението да се спаси и чрез използване на "интелигентен" софтуер. В останалите случаи пък (които вероятно са по-чести) отчитането на контекста не е никак лесна за програмиране задача и едва ли тя ще бъде решена задоволително в близко бъдеще (привеждам пример за това колко е далече от въпросната цел една от наличните програми, съдържаща наченки на такова отчитане).

      Освен че не позволява някои думи да бъдат различени една от друга, споменатият недостатък не позволява и в ред случаи да се различават една от друга правилно и погрешно написани думи. Например след транслитерация по стандарта правилното написване гарван, декар, дълъг, камък, капак, кокал, нокът, тигър, удар, четат става неразличимо от погрешното гарвън, декър, дълаг, камак, къпак, кокъл, нокат, тигар, удър, четът. Фактически за транслитерирането от кирилица на латиница няма нужда изобщо човек да знае дали на дадено място в дадена дума стои А или Ъ - която и от двете букви да стои там, резултатът ще бъде един и същ. Лесно е да се съобрази какви плачевни последици може да има това за правописната грамотност на немалко представители на младото поколение, на които в днешно време значителна част от писмената дейност протича на транслитериран български език. Тази опасност всъщност ми се струва най-важната причина, поради която час по-скоро би трябвало да се предложи някаква алтернатива, която да се използва в изброените по-горе случаи, и тя да се доведе до знанието на обществото.

      Отбелязаният проблем може да бъде преодолян по голям брой различни начини. Един от тях е да се приеме първоначалното предложение на инициаторите, отклоняващо се от стандарта при шест от българските букви (а именно за Ж, Ц, Ч, Ш, Щ и Ъ). То предвиждаше следното кодиране на буквите от българската азбука:

А
Б
В
Г
Д
Е
Ж
З
И
Й
К
Л
М
Н
О
П
Р
С
Т
У
Ф
Х
Ц
Ч
Ш
Щ
Ъ
Ь
Ю
Я
A
B
V
G
D
E
J
Z
I
Y
K
L
M
N
O
P
R
S
T
U
F
H
C
Q
W
Wt
X
Y
Yu
Ya

През април 2003 г. в един по-ранен вариант на настоящия материал бе препоръчана модификация на въпросното предложение (вторият от описаните по-долу два варианта) и от 9.05.2003 г. насам тя може да бъде намерена там, където преди това стоеше първоначалното предложение. Тя обаче се отклонява от стандарта за 10 от българските букви, поради което може би представляват известен интерес съображенията за нейното препоръчване. Затова по-надолу изложението следва близко онова от ранните варианти на настоящия материал и започва със следната критична бележка относно първоначалното предложение на инициаторите. При него българската гласна Ъ се кодира с латинската съгласна X - нещо, за което самите автори на предложението признават, че нямат особено убедителни аргументи. Такъв един код на буквата Ъ би бил неприемлив поне от естетическа гледна точка, защото би създавал странно изглеждащи натрупвания на латински съгласни (например думата фъстъкът при транслитериране би се превърнала в осембуквения низ fxstxkxt, съставен само от съгласни).

      Тук предлагам два варианта на по-приемлив според мене начин за решаване на проблема. Първият от тях е да се премине към една друга таблица за транслитериране, която фактически се използва от част от хората, общуващи чрез Интернет, включително и от мен самия. Тя е следната, като естествено се подразбира, че важи и това, което се получава чрез замяна на главните букви с малки (тази уговорка ще е в сила и за следващите по-надолу други таблици):

А
Б
В
Г
Д
Е
Ж
З
И
Й
К
Л
М
Н
О
П
Р
С
Т
У
Ф
Х
Ц
Ч
Ш
Щ
Ъ
Ь
Ю
Я
A
B
V
G
D
E
Zh
Z
I
J
K
L
M
N
O
P
R
S
T
U
F
H
C
Ch
Sh
Sht
Y
J
Ju
Ja

Горната таблица е заложена например в конвертиращата програма на Вал Тодоров (написана през 1996 г.), като в свой коментар за програмата нейният автор нарича въпросната таблица конвенция на западните слависти (от документа, съдържащ коментара, съм направил копие, в което са отстранени някои прекодирания, извършени от mail-програма, но евентуално ще трябва при разглеждането му кодирането на браузъра да се настройва за кирилица). И при този подход буквите, за които има отклонение от стандарта, са шест (те са Й, Ц, Ъ, Ь, Ю и Я), обаче мисля, че са налице предимства от гледна точка на естественост и на съгласуваност със сега използваната фонетична подредба на клавиатурата. Вторият вариант, който имам пред вид, прави още четири отклонения от стандарта чрез възприемане на кодирането на Ч, Ш и Щ от споменатото по-горе предложение на инициаторите, както и на кодиране на Ж чрез X (а не чрез J, както е в въпросното предложение). Той може да бъде представен чрез следната таблица:

А
Б
В
Г
Д
Е
Ж
З
И
Й
К
Л
М
Н
О
П
Р
С
Т
У
Ф
Х
Ц
Ч
Ш
Щ
Ъ
Ь
Ю
Я
A
B
V
G
D
E
X
Z
I
J
K
L
M
N
O
P
R
S
T
U
F
H
C
Q
W
Wt
Y
J
Ju
Ja

      Ще изложа своите доводи в полза на първия от вариантите. Както отбелязват инициаторите в своето предложение, при фонетичната подредба на клавиатурата буквата Ъ е на онзи клавиш, с който се набира латинската буква Y, а и много хора сега кодират Ъ с тази латинска буква. Всъщност това не е случайно, защото ако искаме да кодираме буквата Ъ с гласна буква от латинската азбука, ние нямаме друг избор освен Y при положение, че останалите латински гласни букви вече са заети за кодиране на българските гласни А, Е, И, О и У (при един по-задълбочен подход, както посочи ст.н.с. д-р Любомир Иванов, току-що изказаното твърдение се нуждае от известно прецизиране - давам го в забележка 2 по-долу). Вероятно аналогични съображения (заедно с някои фонетични) са играли роля, за да се приеме и кодирането на Ы с Y при транслитерирането на руски текстове. Изборът на Y за кодирането на българското Ъ би могъл евентуално да се мотивира и с положението при някои западнославянски езици. В чешки и полски (които, както е известно, си служат с латинската азбука) буквата Y сега се чете по същия начин както буквата I, но, доколкото зная, някога се е произнасяла по начин, който има известно сходство със сегашното произношение на руското Ы (остатък от това положение навярно е обстоятелството, че в чешкия език определени съгласни се произнасят с омекотяване, ако след тях стои буквата I, но такова омекотяване липсва в случая на Y след тях). В съответствие с гореказаното намирам за много естествено при транслитерация на български текстове кодирането на буквата Ъ да става с Y.

      Разбира се, ако се ограничим само с гореспоменатото отклонение от стандарта, ще възникне друга неприятност - буквата Ъ ще се кодира по същия начин както буквите Й и Ь. Може би всъщност тази неприятност не е толкова голяма, колкото изглежда на пръв поглед, защото едва ли могат да се намерят две реално съществуващи български думи, които по стандарта да се транслитерират в различни низове, а пък след отклонението от него, за което стана дума, тяхната транслитерация да дава един и същ резултат. Все пак като че ли е по-добре да избегнем въпросната неприятност. Можем да направим това, като се условим да кодираме всяка от буквите Й и Ь с буквата J - това няма да доведе до нова колизия, защото J не се използва в съществуващия стандарт. Нещо повече, по този начин ние ще постигнем съгласуваност с фонетичната подредба на клавиатурата за още една буква, а именно за Й. Вярно е наистина, че, заменяйки Y с J при кодирането на Й, ние ще се откажем от онова съответствие между буква и звук, което е налице в английския и във френския език, но от друга страна пък ще приемем съответствието, което е налице в чешкия и в полския.

      Бихме могли да се ограничим само с изброените дотук отклонения от стандарта - макар и да е все още с доста несъвършенства, така полученият начин на транслитериране би превъзхождал стандартния по отношение на обратимостта не само в случая на буквите А и Ъ, но и в някои други случаи. Например имената Майа и Мая (споменати в предложението на инициаторите), които при спазване на стандарта се транслитерират еднакво, сега ще се преобразуват съответно в Maja и Maya. Този пример обаче може да бъде повод и за едно възражение - по стандарта буквите Ю и Я се кодират както еднакво звучащите с тях двубуквени последователности Йу и Йа, а след изменението, за което стана дума, нещата вече няма да стоят така и читаемостта на транслитерирания текст донякъде ще се затрудни въпреки подобрението по отношение на обратимостта. Ако сметнем това възражение за основателно, бихме могли да се откажем от току-що илюстрираното допълнително подобрение на обратимостта и да направим още следното изменение: да се условим да кодираме буквите Ю и Я съответно с Ju и Ja (това е в съгласие с правописа на славянските езици с латинска азбука и на немския език).

      Има още едно отклонение от стандарта, което може да се оцени без особени резерви като подобрение, а именно (както e и в предложението на инициаторите) - буквата Ц да се кодира с латинската буква C вместо с изискваното от стандарта Ts. Освен че така е по-кратко, постига се съгласуваност с фонетичната подредба на клавиатурата и за буквата Ц. Вярно е наистина, че след тази промяна резултатът от транслитерацията на името Ицхак би могъл да се прочете и като Ичак, но това, което би се получило при спазване на стандарта, може да се прочете даже по два погрешни начина - като Итшак и като Итсхак. Освен това при транслитерирането на двете думи оценка и отсенка сега вече ще се получават различни неща.

      С това всичките шест букви, за които първият вариант се отклонява от стандарта, вече са разгледани със съответни доводи в полза на кодирането им по "конвенцията на западните слависти". Предложените кодове на тези букви са дадени в следната таблица:

Й
Ц
Ъ
Ь
Ю
Я
J
C
Y
J
Ju
Ja

И така, първият вариант на предложението, което правя, е за въпросните шест букви да се приеме кодирането от тази таблица, а всички други букви от нашата азбука да продължат да се кодират според съществуващия стандарт. Вторият вариант е аналогичен, но с изменение на кодирането още на буквите Ж, Ч, Ш и Щ така, както е посочено в следното разширение на горната таблица (показващо за кои букви ще имаме различие със стандарта в този случай):

Ж
Й
Ц
Ч
Ш
Щ
Ъ
Ь
Ю
Я
X
J
C
Q
W
Wt
Y
J
Ju
Ja

Посочените в тази таблица кодове на Ч, Ш и Щ са заимствани от предложението на инициаторите, а кодирането на Ж с X може да бъде донякъде оправдано с иаличието на известна графична прилика (както е направено в споменатото предложение във връзка с кодирането на буквите Ч и Ш). Към всеки от двата предложени варианта могат да се направят някои допълнения с цел да се осигури пълна обратимост, но с тях се занимавам отделно.

      Който и от вариантите да се приеме, предлагам за имената на българските граждани да важи първият, но само като препоръчителен. При тези имена свободно да се допускат също кодирането от сега действащия стандарт и други транслитерации, осигуряващи приемлив прочит на транслитерираното име от определени категории чужденци.

      Забележка 1. Ако се приеме първият вариант, бих предложил българските букви В и Ж да си разменят местата при фонетичната подредба на клавиатурата и по този начин да се постигне съгласуваност на транслитерацията и подредбата за още една буква (при сегашното положение става така, че в някакъв процент от случаите аз набирам Ж вместо В при писане на кирилица с използване на фонетичната подредба и W вместо V при транслитериране). При приемане на първия вариант и на тази промяна ще имаме съгласуваност на транслитерационното кодиране с клавиатурната подредба за всички букви от българската азбука с изключение на Ь и на онези, чиито кодове съдържат повече от една буква (т.е. на буквите Ж, Ч, Ш, Щ, Ю и Я). В случай, че се приеме вторият вариант, изглежда ще е добре да се направят следните промени във фонетичната подредба: буквите В, Ж, Ч и Ш да отидат на клавишите за кодиращите ги при този вариант латински букви V, X, Q и W, буквата Ь да отиде на клавиша със знаците { и [ (чрез който понастоящем се набира Ш), а буквата Я - на клавиша със знаците ~ и ` (чрез който понастоящем се набира Ч), като евентуално би могло и да се разменят посочените клавиши за Ь и Я. Тези промени във фонетичната подредба биха осигурили нейната съгласуваност с транслитерационното кодиране за всички букви от българската азбука с изключение на Щ, Ь, Ю и Я. Разбира се, към който и вариант да се ориентираме, предлаганите промени трябва да влязат в предложението за стандарт (всъщност, ако съдим по поддържаните от Microsoft клавиатурни подредби за Windows за някои езици, не изглежда абсурдно и евентуалното наличие на два различни стандарта за фонетична подредба, отговарящи на двата варианта).

      Забележка 2. В свой коментар за един предишен вариант на тези бележки г-н Любомир Иванов отбелязва, че в английския език буквата Y няма пълноправен статут на гласна, а пък в уелската латиница буквата W е гласна. Това показва недостатъчната прецизност на моето твърдение "ако искаме да кодираме буквата Ъ с гласна буква от латинската азбука, ние нямаме друг избор освен Y при положение, че останалите латински гласни букви вече са заети за кодиране на българските гласни А, Е, И, О и У" (а именно - не съм уточнил като азбука на кой език разглеждам латиницата). Приемам с благодарност критиката и предлагам уточнението да бъде, че в този пункт се имат пред вид в пълна степен чешкият и полският език, а английският - само дотолкова, доколкото ползва буквата Y като гласна (това е налице в случаите, когато Y не е в непосредствено съседство с гласна). Понеже българският език е славянски, разумно е според мен да се съобразяваме понякога с начина на използване на латиницата не само в английския език, но и в другите славянски езици (от друга страна едва ли е подходящо някакво съобразяване с толкова слабо известен у нас начин на употреба на латиницата като уелския). Всъщност "конвенцията на западните слависти", която е първият от предложените тук варианти, за някои букви следва славянски образец, а за други - английски. Мисля, че това я прави едно доста добре балансирано компромисно решение на въпроса за българско-латинската транслитерация.

      Забележка 3. Като предимства на втория вариант могат да се посочат по-малкото проблеми във връзка с обратната транслитерация и по-кратките кодове на четири от буквите (краткостта е особено важна при комуникацията чрез SMS). Проблем за приемането на този вариант може да бъде необходимостта хората, които сега ползват транслитерация, да трябва да променят навиците си за повече букви. Изкуственият избор на кодовете за Ж, Ч и Ш също е недостатък. С него обаче бихме могли да се примирим, ако гледаме на транслитерацията като на кодиране, до което прибягваме само тогава, когато ни заставят обстоятелствата. Той може да се разглежда даже и като предимство от гледна точка на това, че навярно би премахнал евентуалното изкушение да се пледира за тотална замяна на кирилицата в България с латиница посредством официално приетата транслитерация, докато за първия вариант положението би могло да се окаже по-друго. И наистина, доста е невероятно някой ден да се появи брой на Dyrxaven vestnik с нормативен акт, в който се споменават градове Knexa, Pewtera, Qirpan и Wumen, но не е чак толкова неправдоподобно такова нещо да се случи с Dyrzhaven vestnik, Knezha, Peshtera, Chirpan, Shumen.

      Забележка 4 (добавена на 15.02.2005 г.). Неотдавна научих за едно предложение на инж. Тодор Райчев Михов, направено на 30.05.2002 г. и състоящо се от две части: "Подобряване на българската азбука" и "Нова транслитерация на българската азбука с латински букви". В първата част на това предложение се обсъжда възможността за евентуално отпадане на буквите Щ, Ь, Ю и Я. За оставащите след такова отпадане 26 букви се предлага във втората част транслитерация с латински букви и се оказва, че описаният по-нагоре в настоящия документ втори вариант съвпада напълно с нея за въпросните 26 букви. Понеже споменатият втори вариант датира от пролетта на 2003 г., явно инж. Михов има приоритет по отношение например на идеята буквата Ж да се транслитерира с латинската буква X. Също така, когато по-горе съм посочил, че във втория вариант транслитерацията на Ч и на Ш е заимствана от първоначалното предложение на инициаторите, трябвало е да отбележа, ако знаех за предложението на инж. Михов, че същият начин за транслитериране на тези две букви е налице във въпросното по-ранно предложение. Редно би било да спомена и още една транслитерация, съдържаща се във втората част на предложението на инж. Михов и отнасяща се до цялата българска азбука. Описаният по-горе втори вариант се отличава от нея само за буквите Ж и Ь (при споменатата друга транслитерация инж. Михов им съпоставя съответно ZX и YX).

      Забележка 5. Във връзка с казаното в предходната забележка държа да отбележа, че лично аз не намирам за приемливо отпадането на букви от българската азбука  -  поне заради това, че тези букви ги има например в хиляди отпечатани български книги и книгите биха станали трудно читаеми за доста от българите, получили своята грамотност след редуцирането на азбуката.

Дата на предходната версия: 13.04.2005
Дата на настоящата версия: 1.03.2011