Някои обратими версии на предложените транслитерации
от Димитър Скордев

      В един материал, озаглавен "Някои предложения за транслитерация", се обсъждат два варианта на предложение за транслитерация от българска кирилица към латиница. Тези два варианта, които тук ще означаваме с α и β, могат да се опишат посредством следната таблица (при уславянето, че важи и онова, в което би се превърнала тя след повсеместна замяна на главните букви с малки, и че коя да е дума се транслитерира чрез замяна на нейните букви със съответните им низове): 

 
А
Б
В
Г
Д
Е
Ж
З
И
Й
К
Л
М
Н
О
П
Р
С
Т
У
Ф
Х
Ц
Ч
Ш
Щ
Ъ
Ь
Ю
Я
α
A
B
V
G
D
E
Zh
Z
I
J
K
L
M
N
O
P
R
S
T
U
F
H
C
Ch
Sh
Sht
Y
J
Ju
Ja
β
A
B
V
G
D
E
X
Z
I
J
K
L
M
N
O
P
R
S
T
U
F
H
C
Q
W
Wt
Y
J
Ju
Ja
И при двата варианта не е налице обратимост поради следните причини:  а) двете различни български букви Й и Ь се кодират с една и съща латинска;  б) кодът на буквата Ю съвпада с резултата от транслитерацията на всеки от двубуквените низове  Йу  и  Ьу ,  а кодът на буквата Я  -  с резултата от транслитерацията на всеки от двубуквените низове  Йа  и  Ьа ;  в) кодът на буквата Щ съвпада с резултата от транслитерацията на двубуквения низ  Шт .  При варианта α обратимостта се нарушава още и поради това, че кодовете на буквите Ж, Ч, Ш и Щ съвпадат съответно с резултатите от транслитерацията на низовете  Зх ,  Цх ,  Сх  и  Схт .

      Една модификация на варианта β, която е направена от Димитър Д. Добрев и при която е налице обратимост, е описана накратко в документ, озаглавен "Предложение за транслитерация". Модифицирания по този начин вариант β ще наричаме по-нататък вариант D. Всъщност във варианта D се приема за българската азбука, че тя съдържа още една буква освен тридесетте, включени в горната таблица. Тази буква е наречена ударено И, но според лингвистите би било по-правилно да се нарича И с надреден знак с вид на ударение (вж. стр. 115 от "Нов правописен речник на българския език", издаден от БАН през 2002 г.). Понеже тя се използва само при писането на някои местоимения, ще я наричаме за по-кратко местоименно И. Тук ще опишем друга обратима версия на варианта β, която ще означаваме с β' и която би могла в известен смисъл да се разглежда като леко опростена версия на варианта D. Ще опишем и една обратима модифицирана версия α' на варианта α. Казано най-общо, при вариантите α' и β' се допуска в определени случаи кодът на една буква да съдържа допълнителен знак в началото си, който да сигнализира за отлика на конкретната употреба на въпросния код от някоя друга възможна негова употреба или да го отделя от кода на предходната буква.  В качеството на такъв знак вземаме знака  /  (наклонена черта) и приемаме за код на местоименното И низа  /I  (пак при уславяне, че важи и онова, което би се получило чрез замяна на главните букви с малки). Заедно с това приемаме следните отклонения от кодирането при вариантите α и β, определено чрез таблицата, като точките 1 - 4 се отнасят както за варианта α', така и за варианта β', а точка 5 е само за варианта α' (разбира се приемаме също и всичко, което би се получило от споменатите няколко точки при замяна на главните букви с малки пред и след изразите "се кодира с" или "се кодират съответно с"), като освен това се уговаряме, щото всеки от евентуално наличните в подлежащия на транслитериране текст знаци  /  да се заменя с  //  при транслитерирането (би могло това уславяне да се замени с по-сложно, според което знакът  /  се удвоява само в точно описан малък брой случаи, а в останалите се запазва без изменение):
      1. Буквата Й се кодира с /J  в случаите, когато е непосредствено след съгласна буква.
      2. Буквата Ь се кодира с /J  в случаите, когато не е непосредствено след съгласна буква.
      3. Буквите А и У се кодират съответно с /A  и /U  в случаите, когато са непосредствено след някоя от буквите Й и Ь или от съответните им малки букви.
      4. Буквата Т се кодира с /T  в случаите, когато е непосредствено след буквата Ш или съответната й малка буква.
      5. Буквата Х се кодира с /H  в случаите, когато е непосредствено след някоя от буквите З, Ц, С или от съответните им малки букви.

      Пример.  Таблицата по-долу показва как ще се транслитерират при вариантите α', β' и D няколко думи, които са с нееднозначно възстановяване по техните транслитерации поне при варианта α. 

       изход  Ицхак  Майа  пасха  Попйорданов  Таштепе
α'
 iz/hod   Ic/hak   Maj/a   pas/ha   Pop/jordanov   Tash/tepe 
β'
 izhod  Ichak  Maj/a  pasha  Pop/jordanov  Taw/tepe
D
 izhod  Ichak  Maj|a  pasha  Popj#ordanov  Taw|tepe
Вижда се, че транслитерациите при варианта β',  като изключим онази на името  Попйорданов ,  могат да се получат от тези при варианта D чрез замяна на знака | със знака /. Това се дължи на факта, че при варианта D общо взето (само с няколко изключения) важат точки 3 и 4, но със знака  |  вместо знака  /  (причината, поради която тук сме предпочели наклонената черта, е в това, че знакът  |  не принадлежи на основното множество от знаци, поддържани от GSM-апаратите; по същата причина в една предишна версия на настоящия материал бяхме използвали звездичка в случаите по-горе, където сега  -  заради предимството, че се набира по-лесно  -  използваме наклонена черта). По-сложно са решени обаче при варианта D проблемите по отношение на обратимостта, породени от еднаквото кодиране на Й и Ь (допълнително утежнени при този вариант от кодиране чрез същата латинска буква още и на местоименното И).

      Забележка 1.  Вариантите α' и β' остават обратими, ако ги допълним по следния начин с възможност за кодиране на коя да е ударена буква (като правим разлика между местоименно и ударено И в случаите, когато това е възможно и уместно): за да напишем кода на произволна такава буква, пишем първо кода, който би имала на това място буквата, ако беше без ударение, а след него поставяме низа /'  -  все едно, че коя да е ударена буква се тълкува като двубуквен низ, съставен от съответната неударена буква и друг знак с код /' (тълкуваме точките 1 - 5 по-горе като отнасящи се само за букви без ударения). Например буквата ю с ударение винаги ще има код  ju/' , а буквата у с ударение ще бъде с код  /u/' ,  когато е непосредствено след някоя от буквите Й и Ь или от съответните им малки букви, и ще има код  u/'  в останалите случаи (следователно, ако не е непосредствено след съгласна, двубуквеният низ, съставен от й и ударено у, ще се транслитерира като  j/u/' , а чудноватият двубуквен низ, съставен от ударено й и ударено у, ще се транслитерира като  j/'u/'  в същия случай). Разбира се едва ли би имало пречки някаква подобна възможност за кодиране на ударените букви да се добави и към варианта D.

      Забележка 2.  Вариантът D позволява обратимо транслитериране и на текстове, които могат да съдържат латински букви. За целта пасажите от текста, които са на латиница, се пренасят в транслитерирания текст, заградени с по един апостроф в началото и в края им, като обаче всички апострофи, които са били налице в оригиналния текст (независимо къде), се удвояват при транслитерирането. Няма пречки и във вариантите α' и β' да се предвиди същият начин на действие или подобен на него.

      Забележка 3.  Всеки от вариантите α' и β' може лесно да се допълни така, че да е приложим и за транслитерация от руска кирилица към латиница. Буквите от руската азбука, които липсват в българската, са три: Ё, Ы и Э (първата от тях нерядко се заменя с Е, но все пак е добре да се погрижим и за нейното кодиране). Една проста и сравнително естествена възможност за кодирането на тези три букви е следната, която може до известна степен да се мотивира с произношението им: 

Ё
Ы
Э
/O
/Y
/E
(други обратими начини за транслитерирация от руска кирилица към латиница са били предложени от В. А. Успенски през 1967 и 1996 г.  -  описани са например на страници 408-409 и 541 от книгата му "Труды по нематематике"). Всъщност за по-удобното транслитериране на текстове, в които преобладава руският език, би било уместно да се разменят кодовете на буквите  Ы  и  Ъ,  за да може по-често срещаната от двете да е с по-кратък код (разбира се въпросът за честотата на срещането им се отнася главно до съответните малки букви - случаите на употребата им като главни са много редки).

      Забележка 4.  Вместо да тръгваме от транслитерационна система, която не е обратима, а след това да я коригираме, бихме могли да мислим и за директно построяване на обратими транслитерационни системи. Такива са например системите α'' и β'', определени чрез таблицата по-долу при уславянето, направено във връзка с таблицата за системите α и β, и при уговорка за удвояване на знака  /  както във вариантите им α' и β'. 

 
А
Б
В
Г
Д
Е
Ж
З
И
Й
К
Л
М
Н
О
П
Р
С
Т
У
Ф
Х
Ц
Ч
Ш
Щ
Ъ
Ь
Ю
Я
α''
A
B
V
G
D
E
/Z
Z
I
J
K
L
M
N
O
P
R
S
T
U
F
H
C
/C
/S
/T
Y
/J
/U
/A
β''
A
B
V
G
D
E
X
Z
I
J
K
L
M
N
O
P
R
S
T
U
F
H
C
Q
W
/W
Y
/J
/U
/A
Транслитерационната система  β''  би могла да се пригоди за случая на руска кирилица с помощта на допълването, посочено в предходната забележка, и изменението, споменато в последното й изречение.

Дата на предходната версия: 14.12.2005
Дата на настоящата версия: 10.05.2006