Знаки, наборы знаков, алфавиты




Дискретные сообщения

Дискретизация сигнала

Определение. Изменение некоторой физической величины во времени, обеспечивающее передачу сообщения (а тем самым и информации), называется сигналом.

В связи с передачей информации говорят об аналоговых и дискретных сигналах.

Аналоговые сигналы описываются непрерывными функциями времени, поэтому аналоговый сигнал иногда называют непрерывным сигналом. Дискретный сигнал ‑ сигнал, имеющий конечное число значений.

Оцифровка сигнала. При оцифровке сигнала x(t) производятся дискретизация или квантование.

Дискретизация - это преобразование непрерывного аналогового сигнала в цифровую форму, то есть замена сигнала x(t) с непрерывным временем t на дискретный сигнал - последовательность чисел x(ti) для дискретного набора моментов времени t1, t2,..., ti,... (чаще всего интервалы между моментами времени Δt = ti - ti-1 берутся одинаковыми).

При дискретизации, конечно, часть информации о сигнале теряется. Но если сигнал x(t) за время Δt не сильно изменяется, числа x(ti) и x(ti-1) близки друг к другу, то поведение x(t) между временами ti и ti-1 нетрудно восстановить (сигнал практически линейно изменяется во времени от x(ti-1) до x(ti)).

Квантование сигнала - производится со значением сигнала x(ti). Выбирается некий набор возможных значений сигнала x1, x2,..., xi,... и каждому x(ti) сопоставляется ближайшее число из этого набора.

Восстановление – обратный дискретизации процесс. При дискретизации по времени, непрерывный сигнал заменяется последовательностью отсчётов, величина которых может быть равна значению сигнала в данный момент времени. Возможность точного воспроизведения такого представления зависит от интервала времени между отсчётами Δt.

Определение. Сигнал называется дискретным, если параметр сигнала может принимать лишь конечное число значений, и существен лишь в конечном числе моментов времени (возможно, периодически повторяющихся).

Дискретными сообщениями называются такие сообщения, которые могут быть переданы с помощью дискретных сигналов.

Знаки, наборы знаков, алфавиты

„Знать алфавит ужасно важно,

он в телефонной книге каждой"

Языковые сообщения в письменной форме строят обычно, записывая знаки письма (графемы) друг за другом. Хотя длинные сообщения могут размещаться на многих строчках и страницах, это разбиение не имеет, вообще говоря, никакого значения; оно не несёт важной информации. По существу такие сообщения являются последовательностями знаков. Это оказывается справедливым и для устных языковых сообщений, если разложить устный текст на элементарные составные части, так называемые фонемы, и под знаками понимать фонемы. Чтобы можно было воспроизводить фонемы и письменно, принято соглашение о международных письменных знаках для отдельных фонем.

Точка зрения, что сообщение есть последовательность знаков, не ограничивается, разумеется, тем случаем, когда знаки — это фонемы или графемы (например, знаки букв и цифр, знаки препинания). Знаки планет или знаки зодиака и даже кивок и покачивание головой также могут пониматься как знаки.

Знак — это элемент некоторого конечного множества отличимых друг от друга объектов, набора знаков. Используется в целях коммуникации.

Набор знаков, в котором определён (линейный) порядок знаков, называется алфавитом.

Вот некоторые примеры алфавитов (порядок в них — это порядок перечисления):

а) алфавит десятичных цифр {0, 1, 2, 3, 4, 5, 6, 7, 8, 9};

b) алфавит заглавных латинских букв {A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S, T,U,V,W,X,Y,Z};

c) алфавит строчных греческих букв

d) алфавит заглавных кириллических букв {А, Б, В, Г, Д, Е, Ё, Ж, З, И, Й, К, Л, М, Н, О, П, Р, С, Т, У, Ф, Х, Ц, Ч, Ш, Щ, Ъ, Ы, Ь, Э, Ю, Я};

e) алфавит 12 знаков зодиака;

f) алфавит японской катаканы.

Особенно важны наборы, состоящие всего из двух знаков. Такие наборы называют двоичными наборами знаков, а сами знаки — двоичными знаками. Вместо термина „двоичный знак" часто употребляют сокращение бит (от английского binary digit). Примерами двоичных наборов являются:

· пара цветов {красный, зелёный},

· пара яркостей {светлый, тёмный},

· пара состояний {пробивка, нет пробивки},

· пара жестов {кивок головой, покачивание головой},

· пара значений истинности {истина, ложь},

· пара ответов {да, нет},

· пара знаков {включено, выключено},

· пара напряжений {12В, 2В},

· пара цифр {0, 1}

и тому подобное. В качестве абстрактных знаков для двоичного набора принято использовать знаки {0, 1}.

Знаки и символы

Следует различать собственно знак и его смысл. Знак вместе с его смыслом называется символом. В соответствии с целью употребления один и тот же знак часто имеет разный смысл. Например, знак ♀ применяется в астрономии как символ планеты Венера, а в биологии — как символ женской особи. Часто бывает и так, что разные знаки имеют одинаковый смысл; например, знаки ∙ и ×, а в последнее время и *, понимаются как символ умножения.

Заметим, кстати, что всякое сообщение имеет смысл, т. е. уже является символом. Очевидно, что этот символ получается в результате присоединения к сообщению той информации, которая им передается.

В некоторых распространенных языках программирования для представления знаков кодировочных таблиц используются объекты типа char. Слово char происходит, вероятно, от character. Оно очень многозначно, но имеет и такие значения, как буква, иероглиф, цифра, знак, символ. Поэтому существует традиция использовать термин символ как синоним термину знак.

Коды и кодирования

Если N — предложение некоторого естественного языка, то N можно рассматривать как последовательность знаков, по крайней мере, тремя разными способами.

Прежде всего, N представляет собой последовательность букв, цифр, знаков препинания и так далее; иначе, N — это последовательность слов, которые в другом контексте могут сами рассматриваться как знаки; наконец, и все предложение целиком можно рассматривать как один знак.

Первое понимание используется, например, когда имеется правило для нанесения сообщения N на носитель информации; второе понимание лежит в основе стенографических сокращений; последнее третье понимание бывает уместным при переводе на другой естественный язык, когда пословица одного языка переводится соответствующей по смыслу пословицей другого языка.

Дискретные сообщения представляют собой (конечные или бесконечные) последовательности знаков. При этом, исходя из соображений, связанных с физиологией органов чувств, или из чисто технических соображений, их обычно разбивают на конечные последовательности знаков, называемых словами. На более высоком уровне каждое слово можно снова рассматривать как знак, при этом соответствующий набор знаков будет, вообще говоря, шире первоначального. Обратно, данный набор знаков можно получить с помощью составления слов, исходя из некоторого набора с меньшим числом знаков, в частности из двоичного набора знаков. Некоторые из перечисленных выше наборов получены с помощью словообразования «над» конкретными двоичными наборами знаков или, абстрактно, над набором {0, 1}.

Слова над двоичным набором знаков называются двоичными словами. Они не обязаны иметь постоянную длину как, например, азбука Морзе. Если же слова имеют постоянную длину в n знаков, то говорят о n-разрядных двоичных кодах. Например, 2-й международный телеграфный код ‑ это 5-разрядный двоичный код, ISO ‑ 7-разрядный двоичный код.

Дадим теперь точное определение:

Кодом называется правило, описывающее отображение одного набора знаков в другой набор знаков (или слов); так же называют и множество образов при этом отображении.

Помимо основного значения слова code — «кодекс», «свод законов» (гражданский кодекс, кодекс Наполеона) — начиная с середины 19-го века. Слово code означало книгу, в которой словам естественного языка сопоставлены группы цифр или букв. Употребление таких кодов приобрело значение скорее в связи со стремлением сэкономить на стоимости телеграмм, чем в связи с соображениями конспиративности.

Если каждый образ при кодировании является отдельным знаком, то такое отображение назовем шифровкой, а образы — шифрами (англ. Cipher |ˈsaɪfər|). Поскольку здесь имеется криптографический аспект, обращение этого отображения — когда оно однозначно — называется декодированием или дешифровкой.

В коммерческих и криптографических кодах слова, фразы и понятия естественных языков кодируются в большинстве случаев словами над некоторым буквенным или цифровым алфавитом, обычно пятерками. В технических кодах буквы, цифры и другие знаки почти всегда кодируются двоичными словами. В большинстве используемых в технике кодов все слова имеют одинаковую длину. Самый старый из них — это восходящий к И. М. Э. Бодо 2-й международный телеграфный код CCIT- 2, пятиразрядный двоичный код, который до сих пор используется во внутренней и международной открытой телеграфной связи. Несколько моложе семиразрядный ISO, который лег в основу ASCII.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-08-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: