Всеки избор на клавиатурна подредба може да се разглежда като избор на обратимо кодиране на буквите от дадена азбука и на някои други символи чрез определени обекти от специален вид.
Пример 1. Ако една компютърна клавиатура и една инсталирана на нея българска подредба са от типа на масово използваните в България, можем да разгледаме релацията R между символи, дефинирана по следния начин: α R β точно тогава, когато при ненатиснат клавиш Caps-Lock символът α се набира при активност на въпросната българска подредба по същия начин, по който се набира символът β при активност на американско-английска подредба (например ако споменатата българска подредба е БДС, то ? R @ , 2 R 2 , И R R , и R r , § R } , ; R ] , Ч R " , ч R ' , Б R ? , б R / ). Така дефинираната релация е едно взаимно еднозначно съответствие между множеството на символите, които могат да се набират при активност на българската подредба, и множеството на онези, които могат да се набират при активност на американско-английската. Можем да я разглеждаме като обратимо кодиране на първия вид символи чрез символи от втория вид, което всъщност описва един начин за набиране на символите от първия вид при активност на българската подредба (за някои от тях има и друг начин, който изисква клавишът Caps-Lock да е бил натиснат, но от този друг начин тук няма да се интересуваме).
Пример 2. Когато един мобилен телефон (поне от известните на автора видове) позволява да се изпращат SMS на кирилица, след привеждането на уреда в подходящ режим на работа буквите на наличната кирилица и известен брой други символи могат да се набират чрез натискане на съответни клавиши съответен брой пъти. Например буквата А се набира чрез еднократно натискане на клавиша, означен с 2, а буквата Б – чрез двукратно натискане на същия (за простота няма да правим разлика между главни и малки букви). Ще дефинираме една релация R между символи, които могат да се набират, и наредени двойки от означение на клавиш и положително цяло число, като приемем, че α R (β,k) точно тогава, когато символът α се набира чрез k-кратно натискане на клавиша, означен с β (ще имаме например съотношенията А R (2,1) и Б R (2,2) ). Релацията R е едно взаимно еднозначно съответствие между множеството на символите, които могат да се набират, и подходящо крайно множество от двойки от описания вид. И в този случай можем да разглеждаме релацията R като обратимо кодиране, описващо как се набират буквите от кирилицата и другите символи при въпросния режим на работа.
Като имаме кодирането на буквите и другите знаци, отговарящо на дадена клавиатурна подредба, набирането на текст с нейно използване е в известен смисъл кодиране на текста чрез замяна на всеки символ от него с неговия код. Понеже това кодиране ще трябва да се осъществява ръчно от потребителя, въпросите за удобството на осъществяването играят важна роля. В настоящия документ са отразени някои разглеждания в тази насока, направени от автора главно през 2006 г. във връзка с предстоящо тогава приемане на стандарт за българските подредби, използвани на клавиатурите на компютрите и на мобилните телефони. При тези разглеждания вниманието на автора беше насочено към кодирането на буквите от кирилицата и не се обсъждаха варианти на кодирането на останалите символи. За да се опише кодирането на буквите, ще бъде достатъчно да се опише кодирането на главните букви, тъй като ще става дума за подредби, при които изборът дали набраната буква да бъде главна или малка се постига чрез превключване на регистъра (с евентуално натискане на клавиша Shift в условията на пример 1 и по подходящ подобен начин в условията на пример 2).
Част от резултатите на споменатите по-горе разглеждания са намерили място в документа [6]. При изработването на предложение за промяна на стандарта обаче са натежали и други съображения, изложени във въпросния документ, като част от тях са извън компетентността на настоящия автор (освен това той достигна до някои от заключенията си във връзка с подредбите за мобилни телефони тогава, когато по процедурни причини неговото мнение вече не можеше да се вземе пред вид). Сред решенията, залегнали във въпросното предложение (вж. [5]), има такива, които са различни от най-предпочитаните от автора, макар и да не са в противоречие с духа на неговите резултати.
При обсъждане на този въпрос е добре да се вземат пред вид две съществуващи реалности, които имат характер на стандарт – едната в резултат на постановления на Министерския съвет, а другата в резултат на масова практика. Това са от една страна транслитерацията, която се използва в българските документи за самоличност, и от друга страна фонетичните клавиатурни подредби, поддържани например от софтуер на инж. Генади Атанасов, на Датекс и на АКТ Софт. При въпросната транслитерация на всяка българска буква отговаря непразен низ от най-много три латински букви, който ще наричаме транслитерационен код на буквата (вариант на тази транслитерация, отличаващ се от нея само по използването на диакритичен знак в кода на „ер голям“, е предложен в [7]). При споменатите фонетични подредби пък на всяка българска буква отговаря ASCII символ от седембитовия диапазон, чрез клавиша за който символ се набира буквата при режим „кирилица“ на клавиатурата и който символ ще наричаме клавиатурен код на буквата. Транслитерационните и клавиатурните кодове на главните български букви са показани съответно на втория и на третия ред от таблицата по-долу, а кодовете на малките букви се получават от кодовете на главните по очевиден начин (при транслитерационните кодове се прави замяна на главните букви в тях с малки, а пък клавиатурните кодове се заменят със символите, набирани чрез същите клавиши в режим „латиница“, но при ненатиснат клавиш Shift). Както стана дума в увода, ние ще се ограничим по-нататък само с главните букви.
Сравнението между двата вида кодове показва тяхното съвпадане за 19 български букви и различие за останалите. Различието разбира се е неизбежно за седемте български букви Ж, Ц, Ч, Ш, Щ, Ю и Я, чиито транслитерационни кодове имат дължини, по-големи от 1. Понеже различните български букви трябва да имат различни клавиатурни кодове, неизбежно е също да имаме различие за поне една от буквите А и Ъ и за поне една от буквите Й и Ь. Поради тази причина наличните различия за буквите Ъ, Й и Ь също не са особено смущаващи. Доста по-неприятно е обаче различието за буквата В, която освен това се среща и значително по-често в българските текстове. С оглед на по-лесното запомняне и използване на клавиатурните кодове твърде желателно би било при приемане на официален стандарт за фонетична клавиатурна подредба това различие да се отстрани, като новият клавиатурен код на В бъде V (разбира се това би повлякло след себе си промяната на поне още един клавиатурен код – този на буквата Ж). Такова леко изменение вероятно би било оптималното за голяма част от хората, които вече са свикнали да използват фонетична клавиатурна подредба при писане на кирилица. Приемането на стандарт обаче трябва да се прави с поглед не само към сегашното положение, но и към бъдещето. В случая би трябвало удобството за бъдещите ползватели на стандарта да има приоритет пред удобството му за нас самите и ние би трябвало да се примирим с някои малки затруднения, които бихме имали след въвеждането му. Поради това целесъобразно е освен гореспоменатото изменение да се направят и още няколко, които да бъдат за доброто на бъдещите ползватели. Направеното в [5] предложение за стандартизиране на фонетична клавиатурна подредба е именно в такъв дух (ще означаваме описаната в това предложение фонетичната подредба с юЧШЕРТЪ – по буквите, набирани с клавишите в горния ляв край).
Целта на тази бележка е да покажем, че няколко естествено звучащи изисквания, които ще формулираме след малко, влекат с неизбежност клавиатурните кодове на българските букви да бъдат в почти всички случаи онези, които са в предложението от [5]. По-точно, те влекат това за 24 букви, за други четири някои естествени допълнителни съображения също довеждат до такъв резултат, а само за две букви (и то най-рядко използваните в български текстове) стигаме до заключение, отклоняващо се от предложението. Изискванията са следните:
Изискването 3 определя еднозначно за 22 от българските букви кои трябва да бъдат клавиатурните им кодове, а именно, те трябва да бъдат показаните в следната таблица:
Пред вид на това, че буквите Ь и Ю са най-рядко използваните букви от българската азбука (вж. приложение 1), резултатът, който получихме, не отхвърля, а по-скоро подкрепя предложението от [5], ако го сравняваме с евентуални други чувствително по-консервативни предложения (още повече, че значението на използваните тук изисквания не бива да се абсолютизира – например някои допълнителни изисквания за ергономичност биха могли да натежат в полза на точното осъществяване на предложението от [5]). Все пак този резултат показва, че може би е имало известно основание и за модификация на въпросното предложение, състояща се в размяна на клавиатурните кодове на Ь и Ю. Tакава модификация, не намалявайки броя на буквите със съвпадащи клавиатурни и транслитерационни кодове, би намалила с единица броя на онези, чиито нови клавиатурни кодове ще се различават от сегашните, при това без да влоши хигиенно-ергономичната оценка на подредбата от гледна точка на натоварването на пръстите (вж. приложение 2).
Всъщност в изискванията 2 и 4 могат да се направят такива изменения, отнасящи се до буквата Ь, че ако направените по-горе разсъждения се модифицират в съответствие с тези изменения, да се стига точно до онези клавиатурни кодове, които са в предложението от [5]. Основание за такива изменения би могло да бъде обстоятелството, че Ь се използва в българските текстове многократно по-рядко от коя да е друга българска буква (вкл. и от Ю) и че небуквеният клавиш за |, чрез който понастоящем се набира Ю, има твърде неприятната особеност да бъде поставян на различни места в разните модели клавиатури, разпространени в България. Поради това за бъдещите ползватели на стандарта най-подходящ клавиатурен код на Ь сред сега използваните клавиатурни кодове на български букви вероятно би бил именно символът |. Измененията, за които стана дума, усилват изискването 2, като фиксират в него този избор на клавиатурния код на буквата Ь, а от друга страна те отслабват изискването 4, като не я включват в него. Изменените формулировки на изискванията 2 и 4 изглеждат така:
2°. | Буквите Щ, Ю, Я и Ь да имат небуквени клавиатурни кодове, като клавиатурният код на Ь бъде |. | ||
4°. | Клавиатурните кодове на българските букви с нееднобуквени транслитерационни кодове да се изберат така, че да бъде минимален броят на онези измежду тях, за които новият клавиатурен код се различава от сегашния. |
За да видим какви биха били клавиатурните кодове на българските букви при спазване на изискванията 1, 2°, 3 и 4°, можем да разсъждаваме по начин, подобен на онзи за случая на изискванията 1 - 4. Изискването 3 по същия начин определя кои да бъдат клавиатурните кодове на 22-те български букви, посочени във втората от горните две таблици. Оттук и от изискванията 1 и 2° следва, че за клавиатурни кодове на буквите Ж, Ц, Ч и Ш можем да избираме само измежду латинските букви C, Q, W и X, а за клавиатурни кодове на буквите Щ, Ю и Я – само измежду символите ~, { и }. При това положение изискването 4° определя еднозначно, че клавиатурните кодове на Ц и Щ трябва да бъдат досегашните, както е и в предложението от [5]. Единствената свобода, която ни остава, е следната: за клавиатурни кодове на буквите Ж, Ч и Ш да избираме измежду буквите Q, W и X, а за клавиатурни кодове на Ю и Я – измежду символите ~ и {. Като използваме същите мнемонични съображения за графична прилика както по-рано и съображението, че е добре буквата Я да се набира по-лесно от буквата Ю поради много по-честото срещане на първата в сравнение с втората, стигаме точно до клавиатурните кодове, които съпоставя на българските букви предложението от [5].
След включването на предложената нова фонетична подредба в българския държавен стандарт, което е станало през декември 2006 г., нарастнаха шансовете тя да получи софтуерно поддържане на ниво операционна система и например в новата версия на Windows има възможност и за фонетична българска подредба, а не само за подредбата БДС, както беше досега. С оглед на по-лесното преминаване към новата фонетична подредба смятам обаче за целесъобразно да има преходен период, през който тя и старата да бъдат равнопоставени от гледна точка на софтуерна поддръжка, като и двете получат софтуерно поддържане на ниво операционна система (както се вижда от страницата [12] на сайта на Microsoft, такова положение не би било прецедент за системата Windows – за някои езици тя поддържа даже значително повече от три клавиатурни подредби). Това е особено важно заради често срещания случай, когато на един и същ компютър се редуват да работят няколко души – тогава би трябвало всеки от тях да може да избира с коя от трите подредби (нова фонетична, стара фонетична и БДС) да работи и превключването от една към друга да става лесно. Ако само новата подредба бъде поддържана на ниво операционна система, а за старата се използват външни програми, има опасност на някои от въпросните компютри да не може да се ползва поддържаната на системно ниво нова фонетична подредба или използването й да бъде силно затруднено. Това би могло да се случи например поради пречки, породени от софтуерен продукт за поддръжка на старата, правещ нежелателни промени в операционната система. Според сведения от инж. Генади Атанасов [1], дадени през 2002 г., поне тогава някои кирилизиращи продукти, които правят такива промени (и то необратими), са били широко използвани с произтичащи от това неприятни последици. Най-вероятният резултат при подобна ситуация ще бъде това, че единствената фонетична подредба, използвана на такъв компютър, ще бъде старата – нещо, което безусловно ще вреди на разпространението на новата (например чрез увеличаване на броя на хората, на които ще им се наложи да свикнат със старата подредба и след това няма да имат желание да свикват и с новата). Може би по-разумно щеше да бъде да се включат в българския държавен стандарт както новата фонетична подредба, така и старата.
Засега набирането на български букви чрез клавиатурата на мобилен телефон, който има такава възможност, става обикновено посредством азбучна подредба подобно на набирането на буквите от латинската азбука. А именно, ако A е думата, съставена от последователните букви на българската азбука или на някоя съдържаща я друга кирилска азбука (например руската), то на осемте клавиша с номера от 2 до 9 се съпоставят последователни части от A и със всеки от тези клавиши могат да се набират буквите от съответната му част от A. По-точно, първата буква от тази част се набира с еднократно натискане на клавиша, втората – с двукратно и т.н. Очевидно такова разделяне на думата A на части може да се направи по голям брой различни начини.
На мобилните телефони в България обикновено буквите от кирилицата не са написани на клавишите за разлика от положението в Русия, където изписването на кирилицата върху клавишите е широко разпространено и даже позволява отклонения от азбучния принцип на подредба при някои модели телефони (вж. например изображенията към [8]). Когато буквите от кирилицата не са написани на клавишите, твърде желателно е подредбата да може да се запомня лесно. В случая на азбучна подредба, с който се занимаваме тук, един възможен начин за запомняне е да се запомни броят на буквите във всяка една от осемте части, на които е разделена думата A (към този начин е ориентирана и системата за означаване на азбучните подредби, използувана от Димитър Добрев – при нея например двете руски азбучни подредби, за които ще стане дума след малко, се означават с 4-4-4-4-4-4-4-4 и 4-4-4-3-3-4-5-5). Такова запомняне е най-лесно, когато частите са еднакво дълги. Разделяне на думата A на осем еднакво дълги части обаче е възможно само при дължина на A, кратна на 8, и затова е невъзможно, когато A е съставена от буквите на българската азбука. За руската азбука (без буквата Ё, която при ползване на мобилен телефон обикновено се заменя с Е) споменатата възможност за лесно запомняне се осъществява при разделянето на съответната дума A на следните части:
Забележка. Има все пак мобилни телефони с руска кирилица, при които е налице и буквата Ё. На автора е известен апарат „Siemens ME 45“ с втората от горните две подредби, но с добавено Ё между Е и Ж (на този апарат впрочем след буквата З на същия клавиш е добавена и украинската буква Є).
Всъщност дори и да помним дължините на частите, на които се разделя A при дадена азбучна подредба, използването на подредбата остава неудобно, особено за буквите, които са далече от двата края на азбуката. Например набирането на буквата П ще изисква да речем да изброяваме последователно буквите от азбуката, докато достигнем до П, като същевременно мислим за начина на набирането им, или пък, ако помним, че П е шестнадесетата буква на азбуката, да направим съответни пресмятания. Може би ще е по-удобно да се запомни думата, съставена от първите букви на осемте части, т.е. думата АДИМРФШЬ в случая на първата от споменатите две подредби или думата АДИМПТЦЫ в случая на втората (разбира се важното е да се запомнят седемте букви след първата, понеже тя със сигурност е А). Нека да речем е налице първата подредба и сме запомнили съответната осембуквена дума. Тогава ще можем да използваме, че П е след М, но преди Р, и значи е в частта, започваща с М – това вероятно би ни позволило по-бързо да съобразим как да наберем буквата. Разбира се тези грижи стават излишни, когато буквите от кирилицата са изписани на клавишите, но пък горните съображения биха могли да се вземат пред вид при надписването на клавишите – вместо да се пишат всички букви от кирилицата, които могат да се набират с даден клавиш, би могло при азбучна подредба да се пише само първата от тях или, по-добре, да се изписват буквите, когато са не повече от три, а в противен случай да се пишат само първата и последната с тире между тях.
Понеже всички български букви са налице и в руската азбука, български текстове могат да се набират на мобилен телефон с руска клавиатурна подредба, но има някои неудобства. Едното от тях е, че някои букви ще се набират с повече натискания на съответния клавиш, отколкото ако чисто руските букви Ы и Э ги нямаше. Например при първата руска азбучна подредба наличието на буквата Э прави така, че за набирането на всяка от буквите Ю и Я да е необходимо клавишът, означен с 9, се натиска един път повече, отколкото ако я нямаше. Подобно но още по-лошо е положението при втората от руските азбучни подредби.
Добре би било горната качествена преценка да се уточни с помощта на някаква количествена оценка. В [3] Димитър Добрев предлага за оценяването на коя да е българска подредба на клавиатурата на мобилен телефон да се използва средният брой натискания на клавиш за набирането на българска буква, т.е. числото
Пресметнатите от Добрев трудоемкости дават повод на Антон Зиновиев да разгледа няколко оптимизационни задачи във връзка с трудоемкост на азбучни български подредби. В [4] той съобщава за следните получени от него резултати, базиращи се на публикуваните в [9] честоти на българските букви:
Авторът на настоящия документ е наклонен да не дава голямо тегло на съображението за трудното надписване, като има пред вид възможността да се посочват само първата и последната буква. Например при подредбата от т. 1 би могло да се използва следното надписване за кирилицата:
2 а-г | 3 д-з | 4 ийк | 5 лм | 6 ноп | 7 рс | 8 т-ц | 9 ч-я |
Намирането на азбучната българска подредба, която е с най-малка трудоемкост, подтикна настоящия автор да потърси измежду всички български подредби (вкл. неазбучните) такава, която да е с най-малката възможна трудоемкост. Вземайки за основа даденото в [9] подреждане на българските букви по низходящ ред на честотите им (вж. приложение 1), лесно можем да видим, че така поставената задача има (8!)4 / 2 решения (този брой е едно 19-цифрено число). Кое да е от решенията се получава, като за всяка от първите осем букви от въпросното подреждане приемем да се набира с еднократно натискане на някой от клавишите, означени с 2, 3 и т.н. до 9, за всяка от следващите осем – с двукратно натискане на някой от същите клавиши, за всяка от по-следващите осем – с трикратно и за всяка от последните шест – с четирикратно натискане на някой измежду споменатите клавиши. Ако извършим съпоставянето на клавиши по реда на буквите в използваното подреждане, ще получим следната подредба:
2 авъщ | 3 елбш | 4 идуф | 5 опчй | 6 нкгю | 7 тмжь | 8 рзц | 9 сях |
Когато приемането на стандарта беше все още предстоящо, но процедурата по приемането му беше в силно напреднал стадий, авторът направи някои изследвания и разсъждения за изясняване на определени допълнителни въпроси относно азбучните подредби с минимална трудоемкост. Направеното е отразено накратко в приложение 3. Пред вид на това, че през декември 2006 г. като стандартна азбучна българска подредба е била приета подредбата Motorola, която не е сред въпросните подредби, споменатите изследвания и разсъждения могат да представляват в настоящия момент главно теоретичен интерес.
В рубриката „Честота на буквите в теkстове на български и английски език“ на статията [9] от Б. Стефанов и В. Бирданова са дадени следните резултати (в проценти) от проучвания на авторите за честотата на буквите в някои български текстове (описани по видове, но не посочени изрично):
А 11,60 Е 9,21 К 2,99 П 3,05 Ф 0,37 Щ 0,43 Б 1,65 Ж 0,77 Л 3,57 Р 5,42 Х 0,67 Ъ 1,71 В 4,71 З 2,36 М 2,68 С 5,02 Ц 0,75 Ь 0,01 Г 1,19 И 8,82 Н 8,09 Т 7,38 Ч 1,44 Ю 0,11 Д 3,11 Й 0,32 О 8,75 У 1,54 Ш 0,42 Я 1,86
Забележка 1. В по-подробните сведения е посочено за буквите Ь и Ю, че те са се срещнали съответно 37 и 380 пъти сред преброените 352975 букви; това позволява да получим за честотите на Ь и Ю по-точните стойности 0,0105% и 0,108%.
В статията е дадено и произтичащото от горната таблица подреждане на буквите в низходящ ред на честотата им, а именно
Стефанов и Бирданова цитират статията [10] на Б. Пенков и съавтори, публикувана през 1962 г., и дават сведения за посоченото в нея подреждане на българските букви по низходящ ред на честотата им в един откъс от романа „Под игото“. В тези сведения обаче е налице грешка, отнасяща се до буквата „ер малък“ – поставена е на мястото непосредствено след „ер голям“, докато всъщност във въпросната статия честотите на двете букви са сумирани и няма данни за тези честоти поотделно. Всъщност от публикуваните в [10] данни се получават следните честоти в проценти на буквите в изследвания от нейните автори откъс (съдържащ 131050 букви и интервали между думи):
А 12,99 Е 9,22 К 3,76 П 3,03 Ф 0,12 Щ 0,61 Б 1,82 Ж 0,61 Л 3,03 Р 4,61 Х 0,85 Ъ+Ь 1,94 В 4,25 З 2,18 М 2,43 С 4,49 Ц 0,49 Г 1,70 И 8,37 Н 6,43 Т 7,16 Ч 1,33 Ю 0,12 Д 3,64 Й 0,73 О 9,22 У 1,70 Ш 1,09 Я 2,06
В днешно време извършването на подобни изследвания е лесна задача благодарение на изобилието на обширни български текстове в електронен вид (вкл. романа „Под игото“). Тя може да се решава с помощта на прости програми, написани на някой от разпространените езици за програмиране. За съжаление в статията [10] няма сведения за кой именно откъс от романа се отнасят публикуваните данни и поради това тя не дава възможност да се реши със съвременни средства точно същата задача. Затова пък може, като се използва електронното издание [2] на романа, да се намерят честотите на буквите в целия него. Разбира се редно е при изследването да се ограничим със същинския текст на романа, като за целта пренебрегнем например многократно срещащите се добавки от вида „Обратно към: [Под игото][Иван Вазов][СЛОВОТО]“ и „WEB програмиране - Пламен Барух“. Получават се следните резултати, към които ще добавим още, че общият брой на българските букви в същинския текст се оказа 577952, както и че „ударено“ И, ударено А и ударено О са броени като различни от неударените и се срещат с честоти съответно около 0,065%, 0,0026% и 0,0005%:
А 12,52 Е 9,09 К 3,76 П 2,80 Ф 0,17 Щ 0,64 Б 1,81 Ж 0,73 Л 3,15 Р 4,50 Х 0,91 Ъ 1,88 В 4,38 З 2,28 М 2,51 С 4,60 Ц 0,52 Ь 0,01 Г 1,84 И 8,04 Н 6,15 Т 7,10 Ч 1,53 Ю 0,13 Д 3,63 Й 0,85 О 9,21 У 1,77 Ш 1,25 Я 2,20
Забележка 2. Тъй като в текста [2] вместо „ударено“ И се използва Й, преценени са като „ударено“ И онези малки Й, които нито се предхождат непосредствено, нито се следват непосредствено от буква.
Забележка 3. В [2] вместо български ударени А и О се използват латински, но при броенето на буквите и те бяха тълкувани като български. Като български бяха тълкувани и някои латински букви, появили се тук-там в текста вместо българските, набирани със същия клавиш при фонетична клавиатурна подредба (и в повечето случаи изглеждащи по същия начин).
Вероятно резултатите на Стефанов и Бирданова по-добре отговарят на положението в днешния писмен български език, понеже са получени въз основа на разнообразни по-нови текстове. Да обърнем обаче внимание, че все пак тези автори са търсили само общия брой на участията на Й без да ги делят на „истински“ и такива, които заместват „ударено“ И. Всъщност такова деление няма и да е от значение при въпросите за клавиатурните подредби, докато продължава използването на Й вместо „ударено“ И.
Забележка 4 (добавена на 6 декември 2007 г. и допълнена на 7 декември 2007 г.). За честотите на българските букви могат да се извлекат данни от списъка BTB-FreqList, който дава сведения за честотите на около сто хиляди най-често срещани думи и е достъпен посредством линка Available Resources на страницата на проекта Bulgarian Tree Bank. Понеже въпросният списък се базира на корпус от текстове, много по-голям от използвания от Стефанов и Бирданова, получените по този начин данни навярно са доста по-представителни. Те са следните (при пресмятането на процентите са взети пред вид само тридесетте посочени букви, макар че в над две хиляди думи от списъка участва още знакът „-“, а пък няколко пъти се срещат и руски букви, нефигуриращи в българската азбука):
А 12,419 Е 8,907 К 3,349 П 2,914 Ф 0,322 Щ 0,674 Б 1,611 Ж 0,717 Л 3,234 Р 5,104 Х 0,565 Ъ 1,704 В 4,500 З 2,217 М 2,483 С 5,142 Ц 0,689 Ь 0,024 Г 1,454 И 9,060 Н 7,210 Т 7,678 Ч 1,276 Ю 0,132 Д 3,553 Й 0,508 О 8,898 У 1,326 Ш 0,518 Я 1,814
При така наречената десетопръстна система, наричана още сляпа или осезателна (touch typing, вж. [11]), на всеки от основните клавиши на компютърната клавиатура се съпоставя някой от пръстите на ръцете, по-точно – някой от осемте пръста, различни от палците (да наречем тези пръсти активни). Съпоставянето се прави така, че всеки клавиш да може да се натиска удобно със съответния му пръст (казва се, че клавишът е в зоната на действие на този пръст). Обичайните съпоставяния са две и се различават само за някои от клавишите, с които се набират цифри, като нецифровите клавиши в лявата и в дясната част на същия ред попадат в зоните на действие на съответните малки пръсти. Разпределението по зони на клавишите от по-долните редове личи от следното изображение, заимствано от [9]:
В рубриката „Натоварване на пръстите в зависимост от клавиатурната подредба“ авторите на статията [9] предлагат при всяка клавиатурна подредба като мярка за натоварването на кой да е от активните пръсти да се използва сборът от честотите на онези букви, чиито клавиши са в зоната на този пръст (например при подредбата QWERTY натоварването на малкия пръст на лявата ръка да се измерва чрез сбора от честотите на буквите Q, A и Z). Предлагат също като мярка за натоварването на дадена от двете ръце да се използва сборът от мерките за натоварване на нейните активни пръсти. Приема се, че е добре по-натоварена да бъде по-силната от двете ръце (която обикновено е дясната), а пък измежду пръстите на всяка една от ръцете по-натоварени да бъдат показалците и средните пръсти. Използвайки честотите, определени в рубриката „Честота на буквите в теkстове на български и английски език“, авторите пресмятат мерките за натоварването на всеки един от осемте активни пръста и на всяка от двете ръце за случаите на подредбата БДС, на фонетичната подредба ЯВЕРТЪ и на подредбата QWERTY. Даваме таблицата с въпросните мерки, допълнена със съответните числа за двете фонетични подредби юЧШЕРТЪ и ьЧШЕРТЪ, обсъждани в текста „С кои клавиши да се набират българските букви при фонетична подредба на компютърната клавиатура?“.
Зона | Подредба | |||||
Ръка | Пръст | Б Д С | ЯВЕРТЪ | юЧШЕРТЪ | ьЧШЕРТЪ | QWERTY |
Лява | малък | 0,12 | 17,26 | 15,51 | 15,41 | 7,75 |
безименен | 3,72 | 9,74 | 6,21 | 6,21 | 9,08 | |
среден | 22,52 | 13,07 | 13,07 | 13,07 | 18,95 | |
показалец | 19,13 | 16,78 | 20,72 | 20,72 | 22,50 | |
о б щ о | 45,49 | 56,85 | 55,51 | 55,41 | 58,28 | |
Дясна | малък | 8,88 | 4,01 | 5,35 | 5,45 | 2,74 |
безименен | 11,39 | 12,32 | 12,32 | 12,32 | 13,75 | |
среден | 18,53 | 11,81 | 11,81 | 11,81 | 7,28 | |
показалец | 15,71 | 15,01 | 15,01 | 15,01 | 17,95 | |
о б щ о | 54,51 | 43,15 | 44,49 | 44,59 | 41,72 |
От таблицата се вижда, че подредбите юЧШЕРТЪ и ьЧШЕРТЪ преодоляват недостатъка на подредбата ЯВЕРТЪ малкият пръст на лявата ръка да бъде по-натоварен от нейния показалец. Те намаляват натоварването на безименния и малкия й пръст, а в известна степен и натоварването на ръката като цяло. При дясната ръка натоварването на малкия пръст нараства, но продължава да е значително по-малко от натоварванията на другите три нейни активни пръста, които натоварвания остават същите. Макар натоварването на лявата ръка да продължава да е по-голямо от това на дясната, разликата между двете натоварвания е малко по-малка отколкото при подредбата ЯВЕРТЪ. Сумарно може да се каже, че замяната на подредбата ЯВЕРТЪ с която и да е от подредбите юЧШЕРТЪ и ьЧШЕРТЪ подобрява ергономичността по отношение на натоварването на пръстите и ръцете. Сравнявайки пък една с друга последните две подредби, забелязваме леко предимство на втората пред първата в това отношение. Друго (според нас по-съществено) предимство на втората пред първата е по-малкият с единица брой на клавишите, за които има различие с ЯВЕРТЪ. Трудният въпрос е дали тези две предимства могат да компенсират недостатъка буквата Ю, а не съвсем рядко срещащата се Ь, да е на клавиш, който е на различни места при различните клавиатури.
По-долу следват извадки от някои електронни писма, които авторът е изпращал на Антон Зиновиев и на Димитър Добрев през периода от 15 до 25 ноември 2006 г. (част от извадките се придружават от поясняващи ги забележки). В доста от писмата се подкрепя стандартизирането на намерената от Зиновиев подредба с минимална трудоемкост сред подредбите с до четири букви на клавиш. Използвани са предложените от Добрев означения на азбучните подредби чрез изреждане (разделени с тирета) на броевете на буквите върху последователните клавиши с номера от 2 до 9 (понякога тиретата се пропускат). При тези означения подредбата с минимална трудоемкост се записва като 4-4-4-2-4-4-4-4, а подредбата Motorola – като 4-4-4-4-4-4-4-2. Писмата са писани преди авторът да стигне до идеята да се препоръчва на потребителите запомняне на азбучната подредба чрез запомняне на съответната осембуквена дума в случаите, когато липсват надписи за кирилицата.
Случай бр. букви подредба ср. бр. натиск. ------------------------------------------------------ речник 81006 44334444 2.069 вестник 80967 44424444 1.968 научнопоп. т. 73196 44334444 1.973 научен текст 117806 44334444 1.986 вх. поща '06 154314 44442444 1.971 изх. поща '06 130269 44424444 1.976 вх. поща '05 158181 44442444 1.920 изх. поща '05 130095 44424444 2.016 вх. поща '04 5800 44424444 1.973 изх. поща '04 53608 44424444 1.974 вх. поща '03 74826 44424444 1.984 изх. поща '03 49217 44334444 1.988 "Под игото" 577911 44334444 1.999
оптимална 44424444 речник 2.069 2.076 научнопоп. т. 1.973 1.981 научен текст 1.986 1.988 изх. поща '03 1.988 1.991 "Под игото" 1.999 2.007Изключването на входящата поща от тази и миналата година е съвсем оправдано, защото се оказва, че там има в изобилие писма, които са били с кодиране utf-8, а моята Eudora ги е записала в „маймунски“ вид с огромен брой участия на българско Р.