Система без диакритик и спецсимволов




Латиница

Различные системы латиницы для русского языка.

Содержание [убрать] · 1 Официальные системы · 2 Виды латиницы · 3 Экономия в латинице · 4 Написание е, я, ю, ё o 4.1 Объединение э, е, ё · 5 Написание ж, ч, ш · 6 Написание ц, щ · 7 Написание й, ь, ъ, ы · 8 Система без диакритик и спецсимволов · 9 Система, удобная для обучения письму o 9.1 Система j/x ("португальская") o 9.2 Система g/ss o 9.3 Система zz/ss o 9.4 Система j/ch ("французская") · 10 Система без диакритик и диграфов · 11 Полутораграфическая система · 12 Система латиницы, восходящая к белорусской · 13 Латиница для украинского языка · 14 Примечания

Официальные системы

Существует несколько официальных систем латиницы для русского языка:

1. Проект латинизации русского языка 1929-30 гг., первый вариант[1] (ƶ=ж, ç=ц, c=ч, x=х, ş=ш, sc=щ, í=ь, ú,á,ó=ю,я,ё после согласной (иначе ju,ja,jo), э после согласной записать нельзя)

2. Проект латинизации русского языка 1929-30 гг., второй вариант[1] (то же, ü,ä,ö=ю,я,ё после согласной (иначе ju,ja,jo), j=ь, э после согласной записать нельзя)

3. Проект латинизации русского языка 1929-30 гг., третий вариант (на основе Нового Тюркского Алфавита)[1] (то же, ь=ы, j=ь, y=ю, ə=я, ɵ=ё, э после согласной записать нельзя)

4. Академическая 1906-25 гг.[2] (на основе чешского, ch=х, ю=ju (ĭu после согласных), й=j)

5. Географического общества 1911 г.[2] (zh=ж, ch=х, tz=ц, tsh=ч, ju=ю, е=э=е, ё нет, j=ь (j' перед ё,ю,я))

6. Наркомата связи[2] (j=ж, i=и=й, ou=у, kh=х, ts=tz=ц, tch=ч, ch=ш, iou=ю, е=э=е, ё нет, ь пропускается (в середине слова = i))

7. Внешторга[2] (zh=ж, kh=х, z=ц, ch=ч, ju=ю, е=э=е, ё нет, j=ь)

8. ОСТ 8483 1935 г.[2] (zh=ж, kh=х, c=ts=ц, ch=ч, ju=ю, j'=ь (может пропускаться в конце слова и между двумя согласными))

9. Академическая 1939 г.[2] (h=х, c=ц, ю=ju, šč=щ, ь=j (' перед е,ё,и,я,ю), e (или é? по Щербе непонятно)=э)

10. Академическая 1968 г.[3] (x=х, c=ц, '=ь, 'ji=ьи, 'а/#ja=я, e=э=е, гачеки/h, щ=ш+ч, ч после ш как .č/.ch, ъ дефисом или отсутствует (по тексту непонятно), особые указания на о после й и ь, но опечатка в тексте не позволяет понять точно)

11. ГОСТ 16876-71[4] (zh=ж, x=х, cz=c (перед i,e,y,j)=ц, ch=ч, shh=щ, y=ы, eh=э, ъ=") - два регистра[5]. Его копирует СТ СЭВ 1362 (1978)[4]

12. United Nations romanization system (1987)[4] (h=х, š=ш, šč=щ, è=э, ju=ю, ë=ё)

13. ISO/R 9 (вариант 1954)[4]

14. ISO/R 9 (вариант 1968)[4] (ch=х, š=ш, šč=щ, ė=э, ju=ю, ë=ё)

15. ISO 9 = ГОСТ 7.79-2000[4] (система А: h=х, š=ш, ŝ=щ, è=э, û=ю, ë=ё) (система Б: x=х, ch=ч, cz/c=ц, sh=ш, shh=щ, e`=э, yu=ю, yo=ё, y`=ы) [6]

16. American Library Association & Library of Congress (ALA-LC) romanization tables for Slavic alphabets (1997)[4] (ĭ=й, zh=ж, ë=ё, i͡u=ю, ė=э)

17. British Standard 2979:1958[4] (ĭ=й, zh=ж, shch=щ, kh=х, ë=ё, é=э, yu=ю, ȳ (ui в British Library)=ы)

18. BGN/PCGN romanization of Russian (1944)[4] (y=ы=й, zh=ж, shch=щ, kh=х, ë,yë=ё, используется также точка в середине строки для разделения сочетаний типа тс)

19. Приложение № 7 к инструкции о порядке оформления и выдачи паспортов гражданам Российской Федерации для выезда из Российской Федерации и въезда в Российскую Федерацию (2004)[7] (y=ы=й, zh=ж, kh=х, ts=ц, shch=щ, yu=ю, ъ=`, ь=`` (в ряде имён пропускается или пишется как i), ё нет)

20. Регламент оформления загранпаспортов, вступивший в силу 16 марта 2010 года: А/A, Б/B, В/V, Г/G, Д/ D, Е/E, Ё/E, Ж/ZH, З/Z, И/I, Й/I, К/K, Л/L, М/M, Н/N, О/O, П/P, Р/R, С/S, Т/T, У/U, Ф/F, Х/KH, Ц/TC, Ч/CH, Ш/SH, Щ/SHCH, Ы/Y, Э/E, Ю/IU, Я/IA[8]. Используется также в ГОСТ Р 52535.1-2006[9]

21. Русская азбука Морзе (дата неизвестна, в русской версии аппарата Юза было совершенно другое размещение русских букв, несмотря на разный порядок клавиш, на разных образцах одинаковое: [7][8]) (q=щ, v=ж, x=ь, дополнительные комбинации, ё отсутствует)

22. Телеграфный трёхрегистровый код МТК-2 (1963) (односимвольный пятибитный, q=я, v=ж, x=ь, нет ъ, ё, ч)[10]

23. KOI, КОИ, ГОСТ 19768-74 (1974) (q=я, v=ж, x=ь, спецсимволы, нет ё и заглавной Ъ)

При этом закон "О языках народов Российской Федерации" гласит: "В Российской Федерации алфавиты государственного языка Российской Федерации и государственных языков республик строятся на графической основе кириллицы. Иные графические основы алфавитов государственного языка Российской Федерации и государственных языков республик могут устанавливаться федеральными законами." [9]

Виды латиницы

Требования к латинице различаются в зависимости от области, где она должна использоваться.

§ латиница для чата должна быстро набираться в английской раскладке;

§ латиница для набора кириллицы на клавиатуре без русских обозначений должна быть обратимой и легко набираемой (возможны системы в одно нажатие; с шифтами; в два нажатия);

§ латиница для идентификаторов в языках программирования должна укладываться в английский алфавит без спецсимволов (даже без апострофов);

§ латиница для документов желательно должна быть обратимой (хотя в существующей паспортной системе РФ это не так);

§ латиница для поиска в базах (например, как у Старостина[11]) должна набираться в английской раскладке и, по идее, быть обратимой; хотя неточный поиск убирает последнее требование.

Если латиница предлагается для использования повсеместно вместо кириллицы, то ничто не заставляет привязывать латинскую орфографию к кириллической. В частности, можно писать по польским правилам, имитируя польский язык (как в хронике Быховца). Возможна также этимологическая латиница (более соответствующая морфологическому принципу письма).

Экономия в латинице

Насколько малым по площади можно сделать текст латиницей? Для славянских языков самая лаконичная латиница — чешского типа. "Понедельник начинается в субботу" в чешском переводе занимает 336899 символов против 336163 на русском и 336047 на болгарском (для сравнения, 363828 на английском). В каждом случае пробелы не учтены. В чешском алфавите 41 буква, не считая диграфа ch. Цифры при наборе в чешской раскладке используются под буквы. Кроме алфавита важная причина лаконичности — неполногласие.

В основном речь идёт о нескольких буквах: ж,ц,ч,ш,щ,э - доля которых в тексте в сумме 3.4% (больше всего ч=1.2%). Доля ю,я - 2.2% в сумме (0.5% + 1.7%). Но нельзя не экономить на е (7%). Доля ё - 0.45%, погоды не делает.

Символов в любом транслитерованном тексте в среднем больше, чем в нём же, записанном кириллицей. Но даже самые "толстые" транслиты при наборе шрифтом Times оказываются короче того же текста кириллицей.

Написание е, я, ю, ё

Основные методы написания после согласной:

1. с i слева (так в польском: чревато путаницей идёт=идиот; поэтому в ALA-LC используют лигу (i͡u), а в академической системе 1906-25 гг. - диакритику над i (ĭu); можно взамен ставить диерезис или разделитель (' или h) в словах типа идиот)

2. с j слева (как и в начале слова или после гласной)

3. с y слева (сочетания ы+э/а/у/о редки, в основном с приставкой вы-)

4. с диакритикой (акут неудобен, т.к. путается с ударением; из алфавитов с гачками трема для a,o,u есть только в эстонском; полный набор огонков и гачков есть в литовском)

5. отдельный знак (латиница не имеет достаточно гласных, остаются согласные и спецсимволы)

6. модификация согласных (требуется 42 буквы)

Поскольку русская е встречается очень часто и смягчает согласную, во многих системах её после согласной пишут одном символом: e. Это вызывает проблему написания э после согласных (можно использовать дополнительную букву, диакритику, разделитель типа апострофа или немого h или удвоение e).

Основные методы написания в начале слова или после гласной:

1. с j слева (как в чешском и польском)

2. с y слева (сочетания ы+э/а/у/о в этой позиции не встречаются)

3. отдельный знак (тот же, что и после согласной)

Некоторые системы не различают е/э и в этой позиции.

Объединение э, е, ё

Некоторые системы не различают эти три буквы или какие-то их пары. Число образующихся омонимов сравнительно невелико. Это объясняется следующим:

1. источники образования ё и е в русском языке - одни и те же (важное отличие в том, что ё редко образуется от ятя, см. ё в позиции ятя).

2. э в русских словах встречается редко, в основном в начале слов (см. приставки, буква э)[12], причём в диалектах может йотироваться (етот (Google: 800,000), ентот (181,000)). Йотация начального э сравнима с йотацией начального и: диал. йих (Дяда Стёпа - милиционер 06:20, 14:30), йим (Про Ксюшу и Компьюшу 00:30, Незнайка на луне 3/3 (9 серия) 12:20).

3. некоторые е в начале слов произносятся без йотации: с эво́, эщё (оба Alone Coder, Рязань), эдини́ца (иногда Рязань - Alone Coder).

4. в кириллической орфографии э после согласных обозначается редко: интернет (из-за 1956:9:3). При заимствовании собственных имён из английского в русский язык звуки /e/ и /æ/ произносятся одинаково: как э без смягчения предыдущей согласной, но только второе пишется как э (см. Д. И. Ермолович "Имена собственные на стыке языков и культур").

5. Иногда е пишется даже в начале слов там, где подразумевается э: об Евангелии (Ренан "Жизнь Иисуса"), Евклид. Барсов рекомендовал писать Эвропа.

Однако объединения е=э или е=ё нарушают принцип предсказуемости чтения, который можно сформулировать так: «система записи даёт алгоритм правильного произношения слова по его записи со знаком ударения».

Написание ж, ч, ш

Можно использовать такие варианты:

1. Знаки для з, к(ц), с с диакритикой (как в чешском: ž, č, š) - з, с в чешском смягчаются до ж, ш перед гласной переднего ряда (в русском это не так, и знаки для г, х вместо знаков для з, с были бы логичнее для русского). Остальные знаки такого транслита надо приспосабливать к чешской раскладке клавиатуры (в официальных системах этого не сделано).

2. Польские соответствия: ż, cz, sz. Остальные знаки такого транслита надо приспосабливать к польской раскладке клавиатуры.

3. Знаки для з, к(ц), с с буквой-модификатором (как в английском: zh, ch, sh). Удобно для систем без диакритик. При этом не годится h=х, т.к. получается Пасха=Паша.

4. Знаки для г, к, х перед гласной переднего ряда (по первой палатализации) или модификатором (для случая йотовой палатализации, выпавшего ь или заимствования). При этом г, к, х, не палатализовавшиеся перед гласной переднего ряда (например, в окончании) придётся как-то отделять (' или h, или дефис). Такая система интересна в основном для этимологического письма.

5. Удвоение символов для з, ц, с.

6. Отдельные символы, например, j (как во французском и португальском), c (как в итальянском), x (как в португальском). В этом случае переезжают другие претенденты на эти знаки, например, й на y, ц на ts.

Возможны комбинации этих приёмов - для каждой из трёх букв свой приём (например, в латинизации 1929-30 ч=c, т.к. ч чаще, чем ц).

Написание ц, щ

В отличие от ж, ч, ш, эти два звука часто рассматривают как составные: тс и шч (или сч) соответственно. Поэтому некоторые системы их пишут этими двумя знаками. Объединение ц=тс не годится для обратимых транслитов, но удобно для обучения письму. Для обратимых транслитов возможно объединение ц=тз, но есть проблемы, в частности, с аббревиатурами: заготзерно. В ГОСТ Р 52535.1-2006 ц=tc - обратимое сочетание, хотя в остальном этот ГОСТ необратим. Объединение щ=шч необратимо: веснушчатый. Объединение щ=сч - тем более. Но для обучения письму объединения ц/тс/тьс и щ/сч/шч/жч идеальны.

Знак ş (латинизация 1929-30) или ŝ (ISO 9) для щ неудобен, т.к. его нет в чешской раскладке клавиатуры (есть ли он вообще в какой-то из стандартных раскладок? А есть ли все остальные символы этих систем в этой раскладке?).

Написание й, ь, ъ, ы

Можно объединить й=ь, так как й не используется после согласных, а ь используется только после согласных. Можно объединить даже й=ь=ъ, если не учитывать детали произношения (омонимов не образуется). Этот же знак для й можно использовать в составе я, ю,ё. В словах типа чьи, съезд, объём приходится писать два одинаковых символа подряд, иначе получается неоднозначность чтения. Такое объединение характерно для систем с й=j.

Можно объединить й=ы, так как й используется только перед гласной или после гласной, а ы не сочетается с гласными, кроме окончания -ые и приставки вы-. Окончания -ый и -ые пишутся через два одинаковых символа подряд. Иногда их сокращают до одного, но получается неоднозначность чтения. Такое объединение характерно для систем с й=y.

Объединение й=ь(=ъ) нельзя использовать одновременно с й=ы, так как получается путаница Cье=Cые, Cь=Cы. Но для передачи и,й,ь,ъ,ы всё-таки достаточно двух символов, например, по следующей системе:

§ Cа > Ca

§ Cай > Cay

§ Cаи > Cai

§ Cая > Caia

§ Cайя/Cайа > Caya

§ Cы > Cy

§ Cый > Cyy

§ Cыя > Cyia

§ Cь > CC (удвоение согласной; двойные согласные остаются только на стыках, путаница только сск/ськ)

§ Cьи > Ciyi

§ Cиа > Cya

§ Cия > Ciia

§ Cья > Ciya

§ Cъя > Cyya

§ Cя > Cia

Можно использовать апострофы или другие спецсимволы для ь, ъ. Например, для ъ напрашивается дефис. Такой вариант неприемлем для идентификаторов в языке C.

Можно объединить ь=е или ь=и (скандирующее письмо, в первом случае более этимологическое). Для ъ можно аналогично ъ=о. Без ударений такую запись читать сложно.

Можно разложить ы на два элемента: ы=ъи (ui в British Library). Это весьма этимологично, что проявляется, например, в слове безыскусный. Но ы также может происходить от праславянского ū — в частности, в корнях слов. Некоторые ы происходят от и, ср. рус. дыра и стсл дира.

Можно объединить й=и, так как й происходит от и. Омонимов при этом почти не образуется: самый значительный пример — это войны и воины (спай-спаи, надой-надои, пробой-пробои, стай-стаи), которые в некоторых диалектах неотличимы (Alone Coder, Рязань). Запись с и вместо й можно видеть, например, в фильме «Праздник святого Йоргена» (1930). Проблему вызывают пары словоформ, в которых вариант с й имеет другое ударение: твой!=твои, мой!=мои, рой!=рои, чай!=чаи, клей!=клеи, буй!=буи... Это ситуация типа за́мок/замо́к.

Система без диакритик и спецсимволов

Такую систему можно использовать для идентификаторов в языке C.

а=a, б=b, в=v, г=g, д=d, е=je/e (после согласной), ё=jo, ж=zh, з=z, и=i, й=j, к=k, л=l, м=m, н=n, о=o, п=p, р=r, с=s, т=t, у=u, ф=f, х= x, ц=c, ч=ch, ш=sh, щ= shh, ъ=w, ы=y, ь=j, э=e/ we (после согласной), ю=ju, я=ja.

Обратима. Символ q не используется. Замена ъ на o или h превращает систему в необратимую (съ в съезд). Замена э после согласной на he или e превращает систему в необратимую (сэ в сэр). w при чтении этой системы не произносится, работает как разделитель. h тоже не произносится, работает как модификатор. j примерно соответствует /ɪ/.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: