Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.), т.е. информация представляется с помощью естественных языков.
В основе естественного языка лежит алфавит – набор знаков, которые различаются человеком по их начертанию. В основе русского языка лежит кириллица, содержащая 33 знака, английский язык использует латинский алфавит (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов).
В соответствии с правилами грамматики из последовательности символов строят основные объекты языка – слова. Из слов в соответствии с правилами синтаксиса строят предложения.
В естественных языках грамматика и синтаксис языка формулируются с помощью большого числа правил, из которых есть исключения, т.к. правила складывались исторически.
Наряду с естественными языками были разработаны формальные (иногда говорят, искусственные) языки (системы счисления, язык алгебры, языки программирования и т.д.). Основное отличие формальных от естественных языков состоит в наличии строгих правил грамматики и синтаксиса.
Например, системы счисления можно рассматривать как формальные языки, имеющие алфавит (цифры) и позволяющие не только именовать и записывать объекты (числа), но и выполнять над ними арифметические операции по строго определенным правилам.
Существуют формальные языки, которые в качестве знаков используют химические формулы, изображения элементов электрических схем, ноты, дорожные знаки, точки и тире (код азбуки Морзе) и т.д.
Представление информации может осуществляться с помощью формальных языков, которые являются знаковыми системами. Каждая знаковая система строится на основе определенного алфавита и правил выполнения операций над знаками.
|
Кодирование информации
Кодирование информации – это операция преобразования информации из одной знаковой системы в другую.
Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.
В процессе обмена информацией часто приходится производить операции кодирования и декодирования информации. Например, при вводе знака алфавита в компьютер путем нажатия соответствующей клавиши на компьютере, происходит кодирование знака, т.е. преобразование его в компьютерный код. При выводе знака на экран монитора или принтер происходит обратный процесс – декодирование, когда из компьютерного кода знак преобразуется в его графическое изображение.
Двоичное кодирование информации.
Для представления информации в компьютере используется двоичное кодирование, т.к. технические устройства компьютера могут сохранять и распознавать не более двух различных состояний (цифр): намагничен / размагничен (участок поверхности магнитного носителя информации), отражает/не отражает (участок поверхности лазерного диска); и т.д.
Информация на компьютере представлена в машинном коде, алфавит которого состоит из цифр (0 и 1). Каждая цифра машинного кода несет информацию в 1 бит.
Системы счисления
Система счисления – это знаковая система, в которой числа записываются по определенным правилам с помощью символов некоторого алфавита, называемыми цифрами.
|
Системы счисления делятся на непозиционные и позиционные.
Непозиционная система счисления – система счисления, в которой значение цифры не зависит от ее позиции в записи числа.
Примеры непозиционных систем счисления: унарная (единичная) система счисления, римская система счисления, алфавитная система счисления.
Унарная (единичная) система счисления характеризуется тем, что в ней для записи чисел применяется только один вид знаков – палочка. Каждое число в этой системе счисления обозначалось с помощью строки, составленной из палочек, количество которых равнялось обозначаемому числу. Неудобства такой системы счисления очевидны: это громоздкость записи больших чисел, значение числа сразу не видно, чтобы его получить, нужно сосчитать палочки.
В римской системе счисления для обозначения чисел используются заглавные латинские буквы, являющиеся «цифрами» этой системы счисления:
I | V | X | L | C | D | M |
Число в римской системе счисления обозначается набором стоящих подряд «цифр». Значение числа равно:
1) сумме значений идущих подряд нескольких одинаковых «цифр» (назовем их группой первого вида);
2) разности значений большей и меньшей «цифр», если слева от большей «цифры» стоит меньшая (группа второго вида);
3) сумме значений групп и «цифр», не вошедших в группы первого и второго видов.
Примеры.
1. Число 32 в римской системе счисления имеет вид:
XXXII = (X+X+X)+(I+I) =30+2 (две группы первого вида)
2. Число 444 в римской системе счисления имеет вид:
|
CDXLIV = (D-C)+(L-X)+(V-I) (= 400 + 40 + 4 – три группы второго вида)
3. Число 1974:
MCMLXXIV = M+(M-C)+L+(X++X)+(V-I) = 1000+900+50+20+4 (наряду с группами обоих видов в формировании числа участвуют отдельные «цифры»)
4. Число 2005:
MMV = (M+M) +V = 1000+1000+5 (две группы первого вида)
Позиционные системы счисления характеризуется тем, что количественное значение цифры зависит от ее позиции в числе. Каждая позиционная система счисления имеет определенный алфавит цифр и основание, равное количеству цифр (знаков в ее алфавите).
Наиболее распространенными позиционными системами счисления являются десятичная, двоичная, восьмеричная и шестнадцатеричная.
Десятичная система счисления имеет алфавит из десяти цифр: 0, 1, …, 9.
Двоичная система счисления имеет алфавит из двух цифр: 0, 1.
Например, в числе 198710 цифра «1» обозначает одну тысячу (1*103),
цифра «9» обозначает девять сотен (9*102),
цифра «8» обозначает восемь десятков (8*101),
цифра «7» обозначает семь единиц (7*100).
В общем виде, если запись числа в системе счисления с основанием n>1 выглядит как abcd, то само число равно значению выражения an3+bn2+cn1+dn0.