праведность и мир электронные материалы журнала домашняя / БИБЛИОТЕКА / ПРОРАММЫ / ЦС ЯЗЫК / церковнославянская азбука

 

 

Я́ко апо́столом единонра́внии и слове́нских стран учи́телие,
Кири́лле и Мефо́дие богому́дрии, Влады́ку всех моли́те,
вся язы́ки слове́нския утверди́ти в Правосла́вии и единомы́слии,
умири́ти мир и спасти́ ду́ши на́ша.
Тропарь равноапостольных Мефодия и Кирилла

 

ЦЕРКОВНОСЛАВЯНСКАЯ АЗБУКА

КОДИРОВАНИЕ ДЛЯ ИСПОЛЬЗОВАНИЯ В ЭЛЕКТРОННЫХ ДОКУМЕНТАХ

Версия CU v1.3

Составление таблицы кодирования азбуки церковнославянского языка для использования в текстах электронных документов и на этой основе создание электронных программ шрифтов и раскладки клавиатуры разработаны в исполнении повеления Христа Спасителя: «Идите и научите все народы…», в продолжении труда святых равноапостольных Кирилла и Мефодия просветителей словенских, в процессе развития и сохранения культурного наследия Святой Православной Руси, в полученном от прародителей и родителей почтении и любви ко Христу и Богу, Церкви и Отечеству.

Фрагмент Евангелия. Москва, Синодальная типография, XIX в., мини формат

Фото 1. Фрагмент Евангелия. Москва, Синодальная типография, XIX в., мини формат.

Описание

Кодирование азбуки ЦС языка, а также соответствующего разработанного автором данной статьи шрифта и раскладки клавиатуры для набора текста соответствует The Unicode Standard, Version 9.0. http://www.unicode.org.

Юникод (Unicode) – один из ряда стандартов кодирования символов, где каждому символу присваивается индивидуальный код, одинаково распознаваемый различными вычислительными системами, использующими этот стандарт.

Азбука, а также соответствующий шрифт и раскладка клавиатуры располагаются в следующих областях символов юникод стандарта, табл. 1.

Basic Latin. Latin-1 Supplement. Latin Extended-A. Spacing Modifier Letters. Combining Diacritical Marks. Cyrillic. Cyrillic Extended-A. Cyrillic Extended-B. Supplemental Punctuation. General Punctuation. Miscellaneous Symbols. Miscellaneous Symbols and Pictographs.

Информацию о шрифте ЦС языка «Панти» (Panteley v.1.6); о раскладке клавиатуры ЦС языка «Церковнославянский» kbl-cu.v1.6; по фонетической азбуке ЦС языка смотреть на странице разработки: http://sancti.ru/patr/soft/font/slavonic.htm.

 

Текст со шрифтом Panteley 1.51

Црⷭ҇тво твоѐ, хрⷭ҇тѐ, бж҃е, / црⷭ҇тво всѣ́хъ вѣкѡ́въ, / и҆ влⷣчество твоѐ во всѧ́комъ ро́дѣ и҆ ро́дѣ, / воплоти́выйсѧ ѿ дх҃а ст҃а́го, / и҆ ѿ приснодв҃ы марӏ́и вочл҃вѣ́чивыйсѧ, / свѣ́тъ на́мъ возсӏ̈ѧ́, хрⷭ҇те́ бж҃е, / твое́ прише́ствӏ̈е: / свѣ́тъ ѿ свѣ́та, ѻ҆́ч҃ее сӏ̈ѧ́нӏ̈е, / всю̀ тва́рь просвѣти́лъ є҆си́, / всѧ́кое дыха́нӏ̈е хва́литъ тѧ́. / ѻ҆́бразъ сла́вы ѻ҆́ч҃ӏ̈ѧ, / сый, и҆ пре́жде сы́й, / и҆ возсӏ̈ѧ́вый ѿ дв҃ы бж҃е, поми́лꙋй насъ. (Из꙽ѡбрази́тельнаѧ въ на́вечерїи рождества̀ хрⷭ҇то́ва).

Таблица 1. Фото (вверху) и текст (внизу). Образец текста с заданным шрифтом Panteley v.1.6

Если образец букв шрифта снизу отличается от его фото сверху (несоответствие длины строк может незначительно изменяться в различных браузерах, что не является проблемой), то для дальнейшего чтения страницы с полным отображением информации необходимо:
или обновить на компьютере браузер,
или установить на компьютер шрифт «Panty», загрузив со страницы разработки: http://sancti.ru/patr/soft/font/slavonic.htm.

Каждая буква алфавита (табл. 2), знак пунктуации (табл. 3), надстрочный знак (табл. 4) и буква под титлом (табл. 5) церковнославянского языка имеют свой уникод (набор цифр и букв), в соответствии с которым кодируется шрифт и компьютерная раскладка, предназначенная для набора текста на ЦС языке. В другие системы кодирования юникод, в том числе, и ЦС языка, автоматически конвертируется специальными входящими в шрифты или программы таблицами. В ниже представленных таблицах показано соотношение символов церковнославянского языка, их кода, звучания, названия, букв современного алфавита русского языка и наименования соответствующих клавиш раскладки русского языка «Русская» или их сочетаний (схема 1). Следует отметить, что представленные ниже таблицы включают не все знаки, используемые в ЦС языке. Часть из отсутствующих в данном обзоре знаков можно просмотреть через Таблицу символов операционной системы компьютера или текстового редактора в шрифте Panty, отсутствующие там иные необходимо программировать в шрифт из таблиц Юникода. Отсутствующие в Юникоде знаки можно добавлять, подавая заявку в консорциум Юникода или программировать в системе фонетической азбуки*.  

Для понимания структуры таблиц рассмотрим, например, ЦС букву «а» (табл. 2), которая имеет шифр уникода – U+0430, называется «а҆зъ», соответствует букве русского языка «а», под титлом «а҃» обозначает число 1, набирается путем нажатия на клавишу «а», соответствующую раскладке русского языка «Русская» (схема 1). Для набора заглавной «А» с шифром уникода – U+0410 используется комбинация клавиш Shift + «А». В раскладке в качестве дополнительной используются также правая клавиша AltGr или её аналог справа Alt + Ctrl, в зависимости от программного обеспечения компьютера. А так же используется сочетание клавиш AltGr и Shift.

 

Символ

Уникод

Число ЦС

Чтение

Название буквы ЦС

Соответств. буква рус. языка

Клавиши раскладки «Русская»

А а

0410 0430

1

[а]

аз

А а

А а

Б б

0411 0431

[б]

бу́ки

Б б

Б б

В в

0412 0432

2

[в]

ве́ди

В в

В в

Г г

0413 0433

3

[г]

глаго́ль

Г г

Г г

Д д

0414 0434

4

[д]

добро́

Д д

Д д

Е е

0415 0435

5

[е]

есть

Е е

Е е

Є є

0404 0454

[е]

есть широкое (якорное)

Не исп.

 

Э э

 

Ж ж

0416 0436

[ж']

живе́те

Ж ж

Ж ж

Ѕ ѕ

0405 0455

6

[дз']

зело́

Не исп.

Shift+2 2

З з

0417 0437

7

[з]

земля́

З з

З з

И и

0418 0438

8

[и]

и́же (8-ричное)

 

И и

Й й

04180306
04380306

[й]

иже краткое комбинированное

 

И + AltGr+«и»
и + AltGr+«и»

Ӏ̈  ӏ̈

04c0 0308
04
cf 0308

10

[и]

иже (10-ричное)

комбинированное

Не исп.

Й + AltGr+«й»
й + AltGr+«й»

К к

041A 043A

20

[к]

ка́ко

К к

К к

Ћ ћ

040B 045B

гервь
(для транслит. глаголицы)

Не исп.

Shift AltGr+в а

Л л

041B 043B

30

[л]

лю́ди

Л л

Л л

М м

041C 043C

40

[м]

мысле́те

М м

М м

Н н

041D 043D

50

[н]

наш

Н н

Н н

О о

041Е 043Е

[о]

он

О о

О о

Ѻ ѻ

047A 047B

70

[о]

он широкое

Не исп.

Shift+0 0

Ѡ ѡ

0460 0461

[о]

оме́га

Не исп.

Shift+6 6

Ꙍ ꙍ

A64C A64D

[о]

оме́га дополняется в раскладке на одной клавише знаками
0486 0487

Не исп.

AltGrAltGr

Ѽ ѽ

047C 047D

[о]

оме́га (торж.)

Не исп.

Shift+«=» «=»

Ѿ ѿ

047E 047F

800

[от]

от

Не исп.

Shift+7 7

П п

041F 043F

80

[п]

поко́й

П п

П п

Р р

0420 0440

100

[р]

рцы

Р р

Р р

С с

0421 0441

200

[с]

сло́во

С с

С с

Т т

0422 0442

300

[т]

тве́рдо

Т т

Т т

У у

0423 0443

400

[у]

ук

У у

AltGr+2 AltGr+3

Ѹ ѹ

0478 0479

[у]

оник

Не исп.

Shift+3 3

Ꙋ ꙋ

A64A A64B

[у]

ук

Не исп.

У у

Ф ф

0424 0444

500

[ф]

ферт

Ф ф

Ф ф

Х х

0425 0445

600

[х]

хер

Х х

Х х

Ц ц

0426 0446

900

[ц’]

цы

Ц ц

Ц ц

Ч ч

0427 0447

90

[ч’]

червь

Ч ч

Ч ч

Ш ш

0428 0448

[ш’]

ша

Ш ш

Ш ш

Щ щ

0429 0449

[ш’т’]

ща

Щ щ

Щ щ

Ъ ъ

042A 044A

[ъ]

ер

Ъ ъ

Ъ ъ

Ы ы

042B 044B

[ы]

еры́

Ы ы

Ы ы

Ь ь

042C 044C

[ь]

ерь

Ь

ь

Shift+\  \

Ѣ ѣ

0462 0463

[æ], [ие]

ять

 

Shift+5 5

Э э

042D 044D

?

есть мал.

Э э

AltGrShft

AltGrShft+«/»

Ю ю

042E 044E

[йу]

ю

Ю ю

Ю ю

Я я

042F 044F

Не исп.

Я я

 

Ѥ ѥ

0464 0465

[йэ]

Е йотиров.
Редко исп.

Не исп.

AltGrShft

AltGrShft

Ꙗ ꙗ

A656 A657

[йа]

А йотированное

Не исп.

Shift+4 4

Ѧ ѧ

0466 0467

[эн] [йа]

Малый юс

Не исп.

Я я

Ѫ ѫ

046A 046B

[он] [у]

Большой юс

Не исп.

AltGrShft+ф

AltGrShft+ы

Ѩ ѩ

0468 0469

[йэн]

юс малый йотированный

Не исп.

AltGrShft+я

AltGrShft+ч

Ѭ ѭ

046C 046D

[йон]

юс большой йотированный

Не исп.

AltGrShft

AltGrShft+«.»

Ѯ ѯ

046E 046F

60

[кс]

кси

Не исп.

Shift+8 8

Ѱ ѱ

0470 0471

700

[пс]

пси

Не исп.

Shift+9 9

Ѳ ѳ

0472 0473

9

[θ], [ф]

фита́

Не исп.

Shift+«1» «1»

Ѵ ѵ

0474 0475

[и], [в]

и́жица

Не исп.

Shift+«-» «-»

Ҁ ҁ

0480 0481

(90)
арх.

коппа

Не исп.

AltGrShft

AltGrShft

 Табл. 2. Кодирование букв церковнославянской азбуки и раскладки (шрифт Panteley v1.68).

 

В ЦС языке существует ряд цифр, представленных отдельными знаками, в талице представлена цифра, имеющая значение «одна тысяча» (табл. 3).

 

Символ

Уникод

Число

Клавиши раскладки рус. языка

 

҂

0482

Одна тысяча (1 000)

AltGr+4

Табл. 3. Кодирование цифр церковнославянской азбуки и раскладки.

 

Знак

Юникод

Название

Соответствие

Клавиши раскладки рус. языка

,

002C

Запятая

,

Alt+«.»

.

002E

Простая точка

.

«.»

к.

002E

Малая точка

;

«.»

к·

00B7

Средняя точка

·

AltGr+ё

:

003A

Двоеточие

(:), (;), (…)

AltGr+6

;

037E

Вопросительная

«;»

AltGr+7

!

0021

Удивительная

!

AltGr+1

A673

Славянская звездочка

*

AltGr+8

-

002D

Дефис
В ЦС на базовой линии

-

AltGr+«-»

­

00AD

Мягкий перенос.
В ЦС на базовой линии

­

AltGr+«ш»

/

002F

Косая черта

/

AltGr+«\»

( )

0028 0029

Круглые скобки

( )

AltGr+я AltGr+ч

[ ]

005B 005D

Квадратные скобки

[ ]

AltGr+э AltGr+ж

Табл. 4. Кодирование знаков пунктуации церковнославянской азбуки и раскладки.

 

Особенностью ЦС языка является частое применение надстрочных знаков. Все употребляемые в современном ЦС языке надстрочные знаки представлены в таблице и закодированы в раскладке (табл. 5).

Знак

Юникод

Название

Клавиши раскладки рус. языка

́

0301

Оксия (острое ударение)

ь

̀

0300

Вария (тяжелое ударение)

Ь

̑

0311

Камора или переспомен (облегченное ударение)

AltGr+«м»

҆

0486

Звательцо или псили (простое придыхание)

AltGr+«а»

҅

0485

Дасия (густое придыхание)

AltGr+«о»

́҆

0486 + 0301

ИСО (придыхание + оксия) комбинация двух знаков, печатающихся в тексте нажатием одной клавиши

AltGr+«в»

҆̀

0486 + 0300

Апостроф (придыхание + вария) комбинация двух знаков, печатающихся в тексте нажатием одной клавиши

AltGr+«ы»

̏

030F

Смычец или кендема исп. для буквы ѷ.

AltGr+2

A66F

Взмет

AltGr+«.»

A67E

Кавыка для маркировки слова в его начале или конце (знак с местом в строке)

AltGr+«ю»

A67C

Кавыка для маркировка слова в его средине
(диакритический знак над буквой)

AltGr+«д»

̆

0306

Краткая

AltGr+«и»

̈

0308

Две точки над ӏ̈

AltGr+«й»

҄

0484

Палатилизация (смягчение)

AltGr+«ь»

A67D

Паерок (замещение ъ, как маркировка над иной буквой)

AltGr+«ъ»

A67F

Паерок  (замещение ъ, как маркировка вместо буквы ъ)

В табл.

҃

0483

Простое титло

AltGr+«ф»

҇

0487

Покрытие для буквотитлов

AltGr+«г»

 Табл. 5. Кодирование надстрочных знаков церковнославянской азбуки и раскладки.

 

Со времен, Остромирова Евангелия, встречаются буквы титла, вынесенные над строкой буквы или их сочетания, покрываемые или не покрываемые особым знаком «покрытие». В раскладке представлены пять ныне часто используемых букв титлов. Одной клавишей раскладки они печатаются в тексте с дополнительно запрограммированным знаком «покрытие» U+0487. Клавишей «Bksp» покрытие, при использовании шрифта «Panty», может удаляться, далее так же и сама буква. Остальные буквотитлы находятся по таблице шрифта и печатаются с дополнительным покрытием или в разновидности исторической формы – без покрытия.
 

Знак

Уникод

Название

Комб. знак

Уникод

Раскладка рус. языка

2DE2

г

ⷢ҇

U+2DE2 U+0487

AltGr+«п»

2DE3

д

U+2DE3 (совмещен в одном знаке)

AltGr+«к»

2DEA

о

ⷪ҇

U+2DEA  U+0487

AltGr+«ц»

2DEC

р

ⷬ҇

U+2DEC  U+0487

AltGr+«н»

2DED

с

ⷭ҇

U+2DED  U+0487

AltGr+«у»

2DF1

ч

ⷱ҇

2DF1  0487

AltGr+«е»

2DEF

х

U+2DEF (совмещен в одном знаке)

AltGr+«щ»

2DE5

з

U+2DE5 (совмещен в одном знаке)

AltGr+«з»

Табл. 6. Кодирование букв титлов современной церковнославянской азбуки и раскладки.

 

знак

юникод

название

2626

Православный крест

AltGr+«р»

Табл. 7. Кодирование знаков церковнославянской раскладки.

 

Вопросы дальнейшего обсуждения

Наряду с тем, что проведенные предварительные испытания позволяют сделать вывод о соответствии в основном требованиям и к кодированию ЦС азбуки, и к созданному на её основе шрифту, необходимо отметить, что при этом существует ряд проблем, требующих решения. Эти проблемы подразделяются на две связанные группы, области филологии и области программирования азбуки, относящиеся к стандартизации (приведению к определённой норме) ЦС языка и к программному кодированию букв и знаков.

К основным проблемам программирования относится необходимость определения и стандартизации кодирования букв: десятеричной «Ї», прописной якорной «Е», а также знаков пунктуации: малой точки, удивительной и иных дополнительных.

1) Буква «и» десятеричная в ЦС текстах со времени возникновения ЦС азбуки встречается в трёх формах: без точки «Ӏ», с одной точкой «І» и с двумя точками сверху «Ї». При этом в каждом пятом случае две точки заменяются надстрочными знаками. Если запрограммировать Ї 0407 и ї 0457 с двумя точками в одном буквенном знаке, тогда этими точками в сочетании с надстрочными знаками ударениями и титлами будет искажаться должный вид текста. В ряде программ имеется функция OpenType, автоматически программно заменяющая «ї» с двумя точками на необходимую палочку при сочетании с надстрочными знаками, но OpenType существует не во всех программах.

Фото 2. Пример проблем с «ї» 0457. Соотношение «и» десятеричной с титлом и ударением в ЦС UTF-8 CU.

В ячейке слева на Фото 2. шрифт или программа не поддерживает Open Type, поэтому буква «ї» 0457 с двумя точками не заменяется под диакритическими знаками на «палочку». В центральной ячейке случай частичной поддержки Open Type, когда «ї» с двумя точками автоматически заменяется на палочку в данной программе текстового редактора или просмотрщика только «ударением», а для ЦС знаков таких как, титла, псили и иных не работает. В ячейке справа продемонстрирован случай полной поддержки программой Open Type, когда всеми диакритическими знаками буква «ї» функцией таблиц GSUB шрифта заменяется на «палочку».

Эта проблема решается использованием для кодирования «ї» двух знаков: палочки «ӏ» 04CF и верхнего диакритического знака, двух точек « ̈» 0308, не имеющего своего места в ряду, но располагающегося над предыдущей буквой. В случае сочетания «ї» с иными надстрочными знаками «две точки» просто не печатаются. При таком кодировании не требуется Open Type функции чтения GSUB таблицы шрифтов и соответственно расширяется количество программ, которые могут использовать данный шрифт.

Во избежание путаницы в кодировании данной буквы и в дальнейшей электронной обработке всего объема текстов ЦС языка представляется более целесообразным использование одного кода для данной буквы во всех случаях общего стандарта ЦС языка всей истории его развития «ӏ» 04CF. С последующим добавлением в тексте необходимого надстрочного знака. В том числе, особого компонента буквы, точки или двух точек, выполняющих в данном случае функцию надстрочного знака, предназначенного для лучшего опознания (читабельности) «тощей» буквы-палочки, приданием ей точкой или двумя точками дополнительной высоты.

Необходима экспертиза и стандартизация.

2) Якорное «є» 0454 употребляется в словах ЦС языка, заменяя обычную «е» 0435 в начале и (при указании на не единственное число) в средине слова, при этом несет на себе информационную нагрузку в области чисел и склонений слова. При наборе такого слова прописными буквами логически вытекает, что должно применять её пару «Є» 0404, но такой особой буквы нет в ЦС языке. В текстах применяется обычная заглавная пара к «е» 0435 – «Е» 0415. Но в таком случае при наборе прописными буквами неизбежно будет потеряна несомая буквой «якорная е» информации и может быть искажен смысл текста.

 

 

CYRILLIC CAPITAL LETTER IE
CYRILLIC SMALL LETTER IE

CYRILLIC CAPITAL LETTER UKRAINIAN IE
Old Cyrillic yest

Прописная

Е 0415

Є 0404  (? Є̖ ?)

Строчная

е 0435

є 0454

Таблица. 8 Прописные и строчные пары буквы «е҆сть» (форма Е 0415 в шрифте Panteley v1.68.изменена в долее узкую, в соответствие е 0435)

Например, слово ЦС языка ка́мень при склонении в ед. ч. тв. падежа пишется с обычной «е», чем? - ка́менем, а во мн. ч. дат. падежа пишется с буквой «е якорной», чему?  - ка́менєм. Если набрать это слово прописными буквами: КА́МЕНЕМ, то информация о таком различии теряется.

Решение проблемы видится, возможно, в изменении формы или в маркировке дополнительным знаком, например, знаком COMBINING GRAVE ACCENT BELOW « ̖» 0316 графемы производной от «е якорной» её пары, строчной буквы - «Є̖» 0404+0316, для отличия этой буквы от обычной заглавной «Е» 0415 (изменена форма). По-видимому, для сохранения целостности азбуки, лучше, не использовать «Е» 0415 в качестве заглавной, даже при наборе строчными буквами.

Необходима экспертиза и стандартизация.

3) Малая точка отличается от обычной тем, что следующее предложение (всегда в средине абзаца) пишется со строчной, а не с заглавной буквы. Анализ текстов показывает, что применение строчной буквы вместо заглавной определяется не впереди стоящей точкой, а особенностями построения текста ЦС языка. Точка всегда одна и та же.

Решение проблемы не в кодировании особой точки, которой таковая не является, а в понимании особенностей построения и обозначения начала предложений в средине абзаца ЦС языка. А также в определении нормы современного ЦС языка, потому что в части допущенных ИС РПЦ к публикации текстов эта строчная заменяется прописной, в соответствии с современной пунктуацией.

Необходима экспертиза и стандартизация.

4) Вопросительный знак «?» русского языка в ЦС языке «удивительная» обозначается вертикально расположенными точкой и запятой «;».  Проблема возникает при автоматизации программными средствами перевода ЦС текста на русский язык и при конструировании системы программирования шрифта, где этот знак также имеется, но с другим значением.

Решение проблемы заключается в использовании в качестве «удивительной» знака не русского и латинского «;» 003B, а такого же вида, но из исторически обусловленной области и с кодом «;» 037E. Что необходимо учитывать при программировании шрифтов и раскладок, а также процессе создания иных программ.

Необходима экспертиза и стандартизация.

Решение указанных проблем позволит сделать еще один шаг к увеличению автоматизации компьютерной обработки ЦС текстов, таких например, как проверка правописания, поиск, использование словарей и иного. Что необходимо в области образования и науки, а также востребовано и в иных сферах, связанных с текстовой информацией на ЦС языке.

Выводы

Необходима стандартизация кодирования ЦС текста в UTF-8 CU и UTF-8 CU-PH.

Необходимо совершенствование шрифтов в программировании и дизайне.

Представленное кодирование церковнославянской азбуки в основном соответствуют требованиям, выдвигаемым необходимостью осуществления работы с электронным текстом церковнославянского языка.

 

. 

Е-почта для замечаний и предложений  sl@sancti.ru, csl@ukrpost.ua

 

Калашников Ю.В. Церковнославянская азбука. Кодирование CU. Краткое описание. [Электронный ресурс] // Электронные материалы журнала «Праведность и мир». ISSN 2078-8932. URL: http://sancti.ru/patr/soft/font/abc-cu.htm (дата обновления: 2017.04.14).

 

 

праведность и мир © Калашников Ю.В. 2016

опубликовано: 2016.10.12
Редакция: 20
16.11.09,18,28,30; 12.01. 2017.04.14

  правила сайта