Естественные и формальные языки. Язык как знаковая система.

Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.), т.е. информация представляется с помощью естественных языков.

В основе естественного языка лежит алфавит – набор знаков, которые различаются человеком по их начертанию. В основе русского языка лежит кириллица, содержащая 33 знака, английский язык использует латинский алфавит (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов).

В соответствии с правилами грамматики из последовательности символов строят основные объекты языка – слова. Из слов в соответствии с правилами синтаксиса строят предложения.

В естественных языках грамматика и синтаксис языка формулируются с помощью большого числа правил, из которых есть исключения, т.к. правила складывались исторически.

Наряду с естественными языками были разработаны формальные (иногда говорят, искусственные) языки (системы счисления, язык алгебры, языки программирования и т.д.). Основное отличие формальных от естественных языков состоит в наличии строгих правил грамматики и синтаксиса.

Например, системы счисления можно рассматривать как формальные языки, имеющие алфавит (цифры) и позволяющие не только именовать и записывать объекты (числа), но и выполнять над ними арифметические операции по строго определенным правилам.

Существуют формальные языки, которые в качестве знаков используют химические формулы, изображения элементов электрических схем, ноты, дорожные знаки, точки и тире (код азбуки Морзе) и т.д.

Представление информации может осуществляться с помощью формальных языков, которые являются знаковыми системами. Каждая знаковая система строится на основе определенного алфавита и правил выполнения операций над знаками.

Кодирование информации

Кодирование информации – это операция преобразования информации из одной знаковой системы в другую.

Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.

В процессе обмена информацией часто приходится производить операции кодирования и декодирования информации. Например, при вводе знака алфавита в компьютер путем нажатия соответствующей клавиши на компьютере, происходит кодирование знака, т.е. преобразование его в компьютерный код. При выводе знака на экран монитора или принтер происходит обратный процесс – декодирование, когда из компьютерного кода знак преобразуется в его графическое изображение.

Двоичное кодирование информации.

Для представления информации в компьютере используется двоичное кодирование, т.к. технические устройства компьютера могут сохранять и распознавать не более двух различных состояний (цифр): намагничен / размагничен (участок поверхности магнитного носителя информации), отражает/не отражает (участок поверхности лазерного диска); и т.д.

Информация на компьютере представлена в машинном коде, алфавит которого состоит из цифр (0 и 1). Каждая цифра машинного кода несет информацию в 1 бит.

Системы счисления

Система счисления – это знаковая система, в которой числа записываются по определенным правилам с помощью символов некоторого алфавита, называемыми цифрами.

Системы счисления делятся на непозиционные и позиционные.

Непозиционная система счисления – система счисления, в которой значение цифры не зависит от ее позиции в записи числа.

Примеры непозиционных систем счисления: унарная (единичная) система счисления, римская система счисления, алфавитная система счисления.

Унарная (единичная) система счисления характеризуется тем, что в ней для записи чисел применяется только один вид знаков – палочка. Каждое число в этой системе счисления обозначалось с помощью строки, составленной из палочек, количество которых равнялось обозначаемому числу. Неудобства такой системы счисления очевидны: это громоздкость записи больших чисел, значение числа сразу не видно, чтобы его получить, нужно сосчитать палочки.

В римской системе счисления для обозначения чисел используются заглавные латинские буквы, являющиеся «цифрами» этой системы счисления:


I	V	X	L	C	D	M

Число в римской системе счисления обозначается набором стоящих подряд «цифр». Значение числа равно:

1) сумме значений идущих подряд нескольких одинаковых «цифр» (назовем их группой первого вида);

2) разности значений большей и меньшей «цифр», если слева от большей «цифры» стоит меньшая (группа второго вида);

3) сумме значений групп и «цифр», не вошедших в группы первого и второго видов.

Примеры.

1. Число 32 в римской системе счисления имеет вид:

XXXII = (X+X+X)+(I+I) =30+2 (две группы первого вида)

2. Число 444 в римской системе счисления имеет вид:

CDXLIV = (D-C)+(L-X)+(V-I) (= 400 + 40 + 4 – три группы второго вида)

3. Число 1974:

MCMLXXIV = M+(M-C)+L+(X++X)+(V-I) = 1000+900+50+20+4 (наряду с группами обоих видов в формировании числа участвуют отдельные «цифры»)

4. Число 2005:

MMV = (M+M) +V = 1000+1000+5 (две группы первого вида)

Позиционные системы счисления характеризуется тем, что количественное значение цифры зависит от ее позиции в числе. Каждая позиционная система счисления имеет определенный алфавит цифр и основание, равное количеству цифр (знаков в ее алфавите).

Наиболее распространенными позиционными системами счисления являются десятичная, двоичная, восьмеричная и шестнадцатеричная.

Десятичная система счисления имеет алфавит из десяти цифр: 0, 1, …, 9.

Двоичная система счисления имеет алфавит из двух цифр: 0, 1.

Например, в числе 1987₁₀ цифра «1» обозначает одну тысячу (1*10³),

цифра «9» обозначает девять сотен (9*10²),

цифра «8» обозначает восемь десятков (8*10¹),

цифра «7» обозначает семь единиц (7*10⁰).

В общем виде, если запись числа в системе счисления с основанием n>1 выглядит как abcd, то само число равно значению выражения an³+bn²+cn¹+dn⁰.

Естественные и формальные языки. Язык как знаковая система.

Поиск по сайту