праведность и мир электронные материалы журнала домашняя / БИБЛИОТЕКА / ПРОРАММЫ / ЦС ЯЗЫК / церковнославянская азбука
Я́ко апо́столом единонра́внии
и слове́нских стран учи́телие,
ЦЕРКОВНОСЛАВЯНСКАЯ АЗБУКА КОДИРОВАНИЕ ДЛЯ ИСПОЛЬЗОВАНИЯ В ЭЛЕКТРОННЫХ ДОКУМЕНТАХ Версия CU v1.3 Составление таблицы кодирования азбуки церковнославянского языка для использования в текстах электронных документов и на этой основе создание электронных программ шрифтов и раскладки клавиатуры разработаны в исполнении повеления Христа Спасителя: «Идите и научите все народы…», в продолжении труда святых равноапостольных Кирилла и Мефодия просветителей словенских, в процессе развития и сохранения культурного наследия Святой Православной Руси, в полученном от прародителей и родителей почтении и любви ко Христу и Богу, Церкви и Отечеству. |
Фото 1. Фрагмент Евангелия. Москва, Синодальная типография, XIX в., мини формат. ОписаниеКодирование азбуки ЦС языка, а также соответствующего разработанного автором данной статьи шрифта и раскладки клавиатуры для набора текста соответствует The Unicode Standard, Version 9.0. http://www.unicode.org. Юникод (Unicode) – один из ряда стандартов кодирования символов, где каждому символу присваивается индивидуальный код, одинаково распознаваемый различными вычислительными системами, использующими этот стандарт. Азбука, а также соответствующий шрифт и раскладка клавиатуры располагаются в следующих областях символов юникод стандарта, табл. 1. Basic Latin. Latin-1 Supplement. Latin Extended-A. Spacing Modifier Letters. Combining Diacritical Marks. Cyrillic. Cyrillic Extended-A. Cyrillic Extended-B. Supplemental Punctuation. General Punctuation. Miscellaneous Symbols. Miscellaneous Symbols and Pictographs. Информацию о шрифте ЦС языка «Панти» (Panteley v.1.6); о раскладке клавиатуры ЦС языка «Церковнославянский» kbl-cu.v1.6; по фонетической азбуке ЦС языка смотреть на странице разработки: http://sancti.ru/patr/soft/font/slavonic.htm.
Таблица 1. Фото (вверху) и текст (внизу). Образец текста с заданным шрифтом Panteley v.1.6 Если образец букв шрифта снизу отличается от его фото сверху
(несоответствие длины строк может незначительно изменяться в различных
браузерах, что не является проблемой), то для дальнейшего чтения страницы с
полным отображением информации необходимо: Каждая буква алфавита (табл. 2), знак пунктуации (табл. 3), надстрочный знак (табл. 4) и буква под титлом (табл. 5) церковнославянского языка имеют свой уникод (набор цифр и букв), в соответствии с которым кодируется шрифт и компьютерная раскладка, предназначенная для набора текста на ЦС языке. В другие системы кодирования юникод, в том числе, и ЦС языка, автоматически конвертируется специальными входящими в шрифты или программы таблицами. В ниже представленных таблицах показано соотношение символов церковнославянского языка, их кода, звучания, названия, букв современного алфавита русского языка и наименования соответствующих клавиш раскладки русского языка «Русская» или их сочетаний (схема 1). Следует отметить, что представленные ниже таблицы включают не все знаки, используемые в ЦС языке. Часть из отсутствующих в данном обзоре знаков можно просмотреть через Таблицу символов операционной системы компьютера или текстового редактора в шрифте Panty, отсутствующие там иные необходимо программировать в шрифт из таблиц Юникода. Отсутствующие в Юникоде знаки можно добавлять, подавая заявку в консорциум Юникода или программировать в системе фонетической азбуки*. Для понимания структуры таблиц рассмотрим, например, ЦС букву «а» (табл. 2), которая имеет шифр уникода – U+0430, называется «а҆зъ», соответствует букве русского языка «а», под титлом «а҃» обозначает число 1, набирается путем нажатия на клавишу «а», соответствующую раскладке русского языка «Русская» (схема 1). Для набора заглавной «А» с шифром уникода – U+0410 используется комбинация клавиш Shift + «А». В раскладке в качестве дополнительной используются также правая клавиша AltGr или её аналог справа Alt + Ctrl, в зависимости от программного обеспечения компьютера. А так же используется сочетание клавиш AltGr и Shift. |
Символ |
Уникод |
Число ЦС |
Чтение |
Название буквы ЦС |
Соответств. буква рус. языка |
Клавиши раскладки «Русская» |
А а |
0410 0430 |
1 |
[а] |
аз |
А а |
А а |
Б б |
0411 0431 |
[б] |
бу́ки |
Б б |
Б б |
|
В в |
0412 0432 |
2 |
[в] |
ве́ди |
В в |
В в |
Г г |
0413 0433 |
3 |
[г] |
глаго́ль |
Г г |
Г г |
Д д |
0414 0434 |
4 |
[д] |
добро́ |
Д д |
Д д |
Е е |
0415 0435 |
5 |
[е] |
есть |
Е е |
Е е |
Є є |
0404 0454 |
[е] |
есть широкое (якорное) |
Не исп.
|
Э э
|
|
Ж ж |
0416 0436 |
[ж'] |
живе́те |
Ж ж |
Ж ж |
|
Ѕ ѕ |
0405 0455 |
6 |
[дз'] |
зело́ |
Не исп. |
Shift+2 2 |
З з |
0417 0437 |
7 |
[з] |
земля́ |
З з |
З з |
И и |
0418 0438 |
8 |
[и] |
и́же (8-ричное) |
|
И и |
Й й |
04180306 |
[й] |
иже краткое комбинированное |
|
И + AltGr+«и» |
|
Ӏ̈ ӏ̈ |
04c0 0308 |
10 |
[и] |
иже (10-ричное) комбинированное |
Не исп. |
Й + AltGr+«й» |
К к |
041A 043A |
20 |
[к] |
ка́ко |
К к |
К к |
Ћ ћ |
040B 045B |
гервь |
Не исп. |
Shift AltGr+в а |
||
Л л |
041B 043B |
30 |
[л] |
лю́ди |
Л л |
Л л |
М м |
041C 043C |
40 |
[м] |
мысле́те |
М м |
М м |
Н н |
041D 043D |
50 |
[н] |
наш |
Н н |
Н н |
О о |
041Е 043Е |
[о] |
он |
О о |
О о |
|
Ѻ ѻ |
047A 047B |
70 |
[о] |
он широкое |
Не исп. |
Shift+0 0 |
Ѡ ѡ |
0460 0461 |
[о] |
оме́га |
Не исп. |
Shift+6 6 |
|
Ꙍ ꙍ |
A64C A64D |
[о] |
оме́га дополняется в раскладке на одной
клавише знаками |
Не исп. |
AltGr+с AltGr+м |
|
Ѽ ѽ |
047C 047D |
[о] |
оме́га (торж.) |
Не исп. |
Shift+«=» «=» |
|
Ѿ ѿ |
047E 047F |
800 |
[от] |
от |
Не исп. |
Shift+7 7 |
П п |
041F 043F |
80 |
[п] |
поко́й |
П п |
П п |
Р р |
0420 0440 |
100 |
[р] |
рцы |
Р р |
Р р |
С с |
0421 0441 |
200 |
[с] |
сло́во |
С с |
С с |
Т т |
0422 0442 |
300 |
[т] |
тве́рдо |
Т т |
Т т |
У у |
0423 0443 |
400 |
[у] |
ук |
У у |
AltGr+2 AltGr+3 |
Ѹ ѹ |
0478 0479 |
[у] |
оник |
Не исп. |
Shift+3 3 |
|
Ꙋ ꙋ |
A64A A64B |
[у] |
ук |
Не исп. |
У у |
|
Ф ф |
0424 0444 |
500 |
[ф] |
ферт |
Ф ф |
Ф ф |
Х х |
0425 0445 |
600 |
[х] |
хер |
Х х |
Х х |
Ц ц |
0426 0446 |
900 |
[ц’] |
цы |
Ц ц |
Ц ц |
Ч ч |
0427 0447 |
90 |
[ч’] |
червь |
Ч ч |
Ч ч |
Ш ш |
0428 0448 |
[ш’] |
ша |
Ш ш |
Ш ш |
|
Щ щ |
0429 0449 |
[ш’т’] |
ща |
Щ щ |
Щ щ |
|
Ъ ъ |
042A 044A |
[ъ] |
ер |
Ъ ъ |
Ъ ъ |
|
Ы ы |
042B 044B |
[ы] |
еры́ |
Ы ы |
Ы ы |
|
Ь ь |
042C 044C |
[ь] |
ерь |
Ь ь |
Shift+\ \ |
|
Ѣ ѣ |
0462 0463 |
[æ], [ие] |
ять |
|
Shift+5 5 |
|
Э э |
042D 044D |
? есть мал. |
Э э |
AltGrShft+э AltGrShft+«/» |
||
Ю ю |
042E 044E |
[йу] |
ю |
Ю ю |
Ю ю |
|
Я я |
042F 044F |
Не исп. |
Я я |
|
||
Ѥ ѥ |
0464 0465 |
[йэ] |
Е йотиров. |
Не исп. |
AltGrShft+ь AltGrShft+б |
|
Ꙗ ꙗ |
A656 A657 |
[йа] |
А йотированное |
Не исп. |
Shift+4 4 |
|
Ѧ ѧ |
0466 0467 |
[эн] [йа] |
Малый юс |
Не исп. |
Я я |
|
Ѫ ѫ |
046A 046B |
[он] [у] |
Большой юс |
Не исп. |
AltGrShft+ф AltGrShft+ы |
|
Ѩ ѩ |
0468 0469 |
[йэн] |
юс малый йотированный |
Не исп. |
AltGrShft+я AltGrShft+ч |
|
Ѭ ѭ |
046C 046D |
[йон] |
юс большой йотированный |
Не исп. |
AltGrShft+ю AltGrShft+«.» |
|
Ѯ ѯ |
046E 046F |
60 |
[кс] |
кси |
Не исп. |
Shift+8 8 |
Ѱ ѱ |
0470 0471 |
700 |
[пс] |
пси |
Не исп. |
Shift+9 9 |
Ѳ ѳ |
0472 0473 |
9 |
[θ], [ф] |
фита́ |
Не исп. |
Shift+«1» «1» |
Ѵ ѵ |
0474 0475 |
[и], [в] |
и́жица |
Не исп. |
Shift+«-» «-» |
|
Ҁ ҁ |
0480 0481 |
(90) |
коппа |
Не исп. |
AltGrShft+с AltGrShft+м |
Табл. 2. Кодирование букв церковнославянской азбуки и раскладки (шрифт Panteley v1.68).
В ЦС языке существует ряд цифр, представленных отдельными знаками, в талице представлена цифра, имеющая значение «одна тысяча» (табл. 3). |
||||
|
Символ |
Уникод |
Число |
Клавиши раскладки рус. языка |
|
҂ |
0482 |
Одна тысяча (1 000) |
AltGr+4 |
Табл. 3. Кодирование цифр церковнославянской азбуки и раскладки.
Знак |
Юникод |
Название |
Соответствие |
Клавиши раскладки рус. языка |
, |
002C |
Запятая |
, |
Alt+«.» |
. |
002E |
Простая точка |
. |
«.» |
к. |
002E |
Малая точка |
; |
«.» |
к· |
00B7 |
Средняя точка |
· |
AltGr+ё |
: |
003A |
Двоеточие |
(:), (;), (…) |
AltGr+6 |
; |
037E |
Вопросительная |
«;» |
AltGr+7 |
! |
0021 |
Удивительная |
! |
AltGr+1 |
꙳ |
A673 |
Славянская звездочка |
* |
AltGr+8 |
- |
002D |
Дефис |
- |
AltGr+«-» |
|
00AD |
Мягкий перенос. |
|
AltGr+«ш» |
/ |
002F |
Косая черта |
/ |
AltGr+«\» |
( ) |
0028 0029 |
Круглые скобки |
( ) |
AltGr+я AltGr+ч |
[ ] |
005B 005D |
Квадратные скобки |
[ ] |
AltGr+э AltGr+ж |
Табл. 4. Кодирование знаков пунктуации церковнославянской азбуки и раскладки. |
Особенностью ЦС языка является частое применение надстрочных знаков. Все употребляемые в современном ЦС языке надстрочные знаки представлены в таблице и закодированы в раскладке (табл. 5). |
||||
Знак |
Юникод |
Название |
Клавиши раскладки рус. языка |
|
́ |
0301 |
Оксия (острое ударение) |
ь |
|
̀ |
0300 |
Вария (тяжелое ударение) |
Ь |
|
̑ |
0311 |
Камора или переспомен (облегченное ударение) |
AltGr+«м» |
|
҆ |
0486 |
Звательцо или псили (простое придыхание) |
AltGr+«а» |
|
҅ |
0485 |
Дасия (густое придыхание) |
AltGr+«о» |
|
́҆ |
0486 + 0301 |
ИСО (придыхание + оксия) комбинация двух знаков, печатающихся в тексте нажатием одной клавиши |
AltGr+«в» |
|
҆̀ |
0486 + 0300 |
Апостроф (придыхание + вария) комбинация двух знаков, печатающихся в тексте нажатием одной клавиши |
AltGr+«ы» |
|
̏ |
030F |
Смычец или кендема исп. для буквы ѷ. |
AltGr+2 |
|
꙯ |
A66F |
Взмет |
AltGr+«.» |
|
꙾ |
A67E |
Кавыка для маркировки слова в его начале или конце (знак с местом в строке) |
AltGr+«ю» |
|
꙼ |
A67C |
Кавыка для маркировка слова
в его средине |
AltGr+«д» |
|
̆ |
0306 |
Краткая |
AltGr+«и» |
|
̈ |
0308 |
Две точки над ӏ̈ |
AltGr+«й» |
|
҄ |
0484 |
Палатилизация (смягчение) |
AltGr+«ь» |
|
꙽ |
A67D |
Паерок (замещение ъ, как маркировка над иной буквой) |
AltGr+«ъ» |
|
ꙿ |
A67F |
Паерок (замещение ъ, как маркировка вместо буквы ъ) |
В табл. |
|
҃ |
0483 |
Простое титло |
AltGr+«ф» |
|
҇ |
0487 |
Покрытие для буквотитлов |
AltGr+«г» |
|
Табл. 5. Кодирование надстрочных знаков церковнославянской азбуки и раскладки. |
||||
Со времен, Остромирова Евангелия, встречаются буквы титла,
вынесенные над строкой буквы или их сочетания, покрываемые или не покрываемые
особым знаком «покрытие». В раскладке представлены пять ныне часто
используемых букв титлов. Одной клавишей раскладки они печатаются в тексте с
дополнительно запрограммированным знаком «покрытие» U+0487. Клавишей «Bksp»
покрытие, при использовании шрифта «Panty», может удаляться, далее так же и
сама буква. Остальные буквотитлы находятся по таблице шрифта и печатаются с
дополнительным покрытием или в разновидности исторической формы – без
покрытия. |
|||||
Знак |
Уникод |
Название |
Комб. знак |
Уникод |
Раскладка рус. языка |
ⷢ |
2DE2 |
г |
ⷢ҇ |
U+2DE2 U+0487 |
AltGr+«п» |
ⷣ |
2DE3 |
д |
ⷣ |
U+2DE3 (совмещен в одном знаке) |
AltGr+«к» |
ⷪ |
2DEA |
о |
ⷪ҇ |
U+2DEA U+0487 |
AltGr+«ц» |
ⷬ |
2DEC |
р |
ⷬ҇ |
U+2DEC U+0487 |
AltGr+«н» |
ⷭ |
2DED |
с |
ⷭ҇ |
U+2DED U+0487 |
AltGr+«у» |
ⷱ |
2DF1 |
ч |
ⷱ҇ |
2DF1 0487 |
AltGr+«е» |
ⷯ |
2DEF |
х |
ⷯ |
U+2DEF (совмещен в одном знаке) |
AltGr+«щ» |
ⷥ |
2DE5 |
з |
ⷥ |
U+2DE5 (совмещен в одном знаке) |
AltGr+«з» |
Табл. 6. Кодирование букв титлов современной церковнославянской азбуки и раскладки. |
знак |
юникод |
название |
|
☦ |
2626 |
Православный крест |
AltGr+«р» |
Табл. 7. Кодирование знаков церковнославянской раскладки.
Вопросы дальнейшего обсуждения Наряду с тем, что проведенные предварительные испытания позволяют сделать вывод о соответствии в основном требованиям и к кодированию ЦС азбуки, и к созданному на её основе шрифту, необходимо отметить, что при этом существует ряд проблем, требующих решения. Эти проблемы подразделяются на две связанные группы, области филологии и области программирования азбуки, относящиеся к стандартизации (приведению к определённой норме) ЦС языка и к программному кодированию букв и знаков. К основным проблемам программирования относится необходимость определения и стандартизации кодирования букв: десятеричной «Ї», прописной якорной «Е», а также знаков пунктуации: малой точки, удивительной и иных дополнительных. 1) Буква «и» десятеричная в ЦС текстах со времени возникновения ЦС азбуки встречается в трёх формах: без точки «Ӏ», с одной точкой «І» и с двумя точками сверху «Ї». При этом в каждом пятом случае две точки заменяются надстрочными знаками. Если запрограммировать Ї 0407 и ї 0457 с двумя точками в одном буквенном знаке, тогда этими точками в сочетании с надстрочными знаками ударениями и титлами будет искажаться должный вид текста. В ряде программ имеется функция OpenType, автоматически программно заменяющая «ї» с двумя точками на необходимую палочку при сочетании с надстрочными знаками, но OpenType существует не во всех программах.
Фото 2. Пример проблем с «ї» 0457. Соотношение «и» десятеричной с титлом и ударением в ЦС UTF-8 CU. В ячейке слева на Фото 2. шрифт или программа не поддерживает Open Type, поэтому буква «ї» 0457 с двумя точками не заменяется под диакритическими знаками на «палочку». В центральной ячейке случай частичной поддержки Open Type, когда «ї» с двумя точками автоматически заменяется на палочку в данной программе текстового редактора или просмотрщика только «ударением», а для ЦС знаков таких как, титла, псили и иных не работает. В ячейке справа продемонстрирован случай полной поддержки программой Open Type, когда всеми диакритическими знаками буква «ї» функцией таблиц GSUB шрифта заменяется на «палочку». Эта проблема решается использованием для кодирования «ї» двух знаков: палочки «ӏ» 04CF и верхнего диакритического знака, двух точек « ̈» 0308, не имеющего своего места в ряду, но располагающегося над предыдущей буквой. В случае сочетания «ї» с иными надстрочными знаками «две точки» просто не печатаются. При таком кодировании не требуется Open Type функции чтения GSUB таблицы шрифтов и соответственно расширяется количество программ, которые могут использовать данный шрифт. Во избежание путаницы в кодировании данной буквы и в дальнейшей электронной обработке всего объема текстов ЦС языка представляется более целесообразным использование одного кода для данной буквы во всех случаях общего стандарта ЦС языка всей истории его развития «ӏ» 04CF. С последующим добавлением в тексте необходимого надстрочного знака. В том числе, особого компонента буквы, точки или двух точек, выполняющих в данном случае функцию надстрочного знака, предназначенного для лучшего опознания (читабельности) «тощей» буквы-палочки, приданием ей точкой или двумя точками дополнительной высоты. Необходима экспертиза и стандартизация. 2) Якорное «є» 0454 употребляется в словах ЦС языка, заменяя обычную «е» 0435 в начале и (при указании на не единственное число) в средине слова, при этом несет на себе информационную нагрузку в области чисел и склонений слова. При наборе такого слова прописными буквами логически вытекает, что должно применять её пару «Є» 0404, но такой особой буквы нет в ЦС языке. В текстах применяется обычная заглавная пара к «е» 0435 – «Е» 0415. Но в таком случае при наборе прописными буквами неизбежно будет потеряна несомая буквой «якорная е» информации и может быть искажен смысл текста.
Таблица. 8 Прописные и строчные пары буквы «е҆сть» (форма Е 0415 в шрифте Panteley v1.68.изменена в долее узкую, в соответствие е 0435) Например, слово ЦС языка ка́мень при склонении в ед. ч. тв. падежа пишется с обычной «е», чем? - ка́менем, а во мн. ч. дат. падежа пишется с буквой «е якорной», чему? - ка́менєм. Если набрать это слово прописными буквами: КА́МЕНЕМ, то информация о таком различии теряется. Решение проблемы видится, возможно, в изменении формы или в маркировке дополнительным знаком, например, знаком COMBINING GRAVE ACCENT BELOW « ̖» 0316 графемы производной от «е якорной» её пары, строчной буквы - «Є̖» 0404+0316, для отличия этой буквы от обычной заглавной «Е» 0415 (изменена форма). По-видимому, для сохранения целостности азбуки, лучше, не использовать «Е» 0415 в качестве заглавной, даже при наборе строчными буквами. Необходима экспертиза и стандартизация. 3) Малая точка отличается от обычной тем, что следующее предложение (всегда в средине абзаца) пишется со строчной, а не с заглавной буквы. Анализ текстов показывает, что применение строчной буквы вместо заглавной определяется не впереди стоящей точкой, а особенностями построения текста ЦС языка. Точка всегда одна и та же. Решение проблемы не в кодировании особой точки, которой таковая не является, а в понимании особенностей построения и обозначения начала предложений в средине абзаца ЦС языка. А также в определении нормы современного ЦС языка, потому что в части допущенных ИС РПЦ к публикации текстов эта строчная заменяется прописной, в соответствии с современной пунктуацией. Необходима экспертиза и стандартизация. 4) Вопросительный знак «?» русского языка в ЦС языке «удивительная» обозначается вертикально расположенными точкой и запятой «;». Проблема возникает при автоматизации программными средствами перевода ЦС текста на русский язык и при конструировании системы программирования шрифта, где этот знак также имеется, но с другим значением. Решение проблемы заключается в использовании в качестве «удивительной» знака не русского и латинского «;» 003B, а такого же вида, но из исторически обусловленной области и с кодом «;» 037E. Что необходимо учитывать при программировании шрифтов и раскладок, а также процессе создания иных программ. Необходима экспертиза и стандартизация. Решение указанных проблем позволит сделать еще один шаг к увеличению автоматизации компьютерной обработки ЦС текстов, таких например, как проверка правописания, поиск, использование словарей и иного. Что необходимо в области образования и науки, а также востребовано и в иных сферах, связанных с текстовой информацией на ЦС языке. Выводы Необходима стандартизация кодирования ЦС текста в UTF-8 CU и UTF-8 CU-PH. Необходимо совершенствование шрифтов в программировании и дизайне. Представленное кодирование церковнославянской азбуки в основном соответствуют требованиям, выдвигаемым необходимостью осуществления работы с электронным текстом церковнославянского языка.
. Е-почта для замечаний и предложений sl@sancti.ru, csl@ukrpost.ua
Калашников Ю.В. Церковнославянская азбука. Кодирование CU. Краткое описание. [Электронный ресурс] // Электронные материалы журнала «Праведность и мир». ISSN 2078-8932. URL: http://sancti.ru/patr/soft/font/abc-cu.htm (дата обновления: 2017.04.14). |
||||||||||
|
праведность и мир © Калашников Ю.В. 2016 |
опубликовано:
2016.10.12 |