Классификационная регистрационная




Тема 3.

Классификация и кодирование информации

1. Система классификации

2. Система кодирования

3. классификация информации по разным признакам

 

Система классификации

Важным понятием при работе с информацией является классификация объектов.

Классификация — система распределения объектов, под объектом подразумевается процесс, предмет, по классам в соответствии с определенным признаком.

Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов — это процедура группировки на качественном уровне, который направлен на выделение одного из свойств. Применительно к информации как к объекту классификации, выделенные классы называют информацию объектами. Свойства информатизации объекта определяются информационными параметрами, которые называют реквизитами. Реквизиты представляются числовыми данными(стоимость, вес), признаками(цвет, марка машины).

Реквизит — логически неделимый элемент, который описывает определенное свойство объекта, процесса, явления.

Кроме выявления общих свойств информационного объекта классификация нужна для разработки алгоритмов и процедур обработки информации.

При любой классификации желательно соблюдать следующие требование:

- полнота охвата объекта рассматривает области, возможности включения новых объектов.

В любой структуре разрабатываются и применяются государственные, отраслевые, региональные классификаторы.

Классификатор — это системный свод наименований и кодов классификационных группировок.

При классификации широко используется понятие «классифицированный признак» и его значение, которое позволяет установить сходство или различие объектов. Возможен подход классификации с объединением этих двух понятий в одно.

Признак классификации равен основанию деления.

Разработка 3 методов классификации объектов:

1) иерархический

2) фасетный

3) дестриптонный

Эти методы различаются разной стратегией применения классификационных признаков.

Эти методы различаются разной стратегией применения классификационных признаков.

1. Иерархическая система классификации строится следующим образом:

1) исходное множество элементов составляет нулевой уровень и делиться в зависимости от выбранного признака на классы, группировки, которые образуют первый уровень.

2) Каждый класс первого уровня в соответствии со своим характерным для него признаком делится на классы.

В иерархической системе из-за жесткой структуры особое внимание следует уделить выбору классификационных признаков. Количество уровней классификации соответствует числу признаков, характеризующих глубину классификации

1) простота построения

2)использование независимых классификационных признаков в различных ветвях иерархической системы

Недостатки:

1) жесткая структура, которая приводит к сложности внесения изменений

2) невозможно сгруппировать объекты заранее не предусмотренным сочетанию признакам

 

2. Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от симатического содержания классифицированного объекта.

Признаки классификации называются фасетными(=рамка), каждый фасет содержит совокупность однородных значений данного классифицированного признака, знания в фасете могут располагаться произвольно, но лучше упорядочить.

Достоинства:

1) возможность создания большой емкости классификации

2) возможность простой модификации всех системных классов без изменения структуры существующих группировок

Недостатки:

1) сложность построения, т.к. приходится учитывать все многообразие классификационных признаков

 

3. Дескрипторная система классификации служит для организации информации, для введения словарей, она использует язык, приближенный к естественному.

Широко используется в библиотечной системе поиска. Суть заключается в следующем:

1) отбирается совокупность ключевых слов, описывающих определенную предметную область или совокупность однородных объектов.

2) Выбираемые ключевые слова или словосочетания, которые подвергаются нормализации, т.е. выбирается несколько или одно наиболее употребляемых.

3) Словарь – дескриптор. Словарь ключевых слов, которые были отображены в результате нормализации.

 

Система кодирования

Система кодирования применяется для замены названий объектов на условные обозначения, в целях обеспечения удобной и более эффективной обработки информации. Код строится на базе алфавита, букв, символов. Код характеризуется длиной, число позиций в коде, структурой, порядком расположения в коде символов для обозначения классификационного признака. Процедура присвоения объекту кодового обозначения и есть кодирование. Можно выделить два группы методов:

1) классификационная (ориентированна на проведение предварительной классификации объектов на основе

2) регистрационная, не требующая предварительного классифицирования объектов

 

Система кодирования

       
 
   
 

 


классификационная регистрационная

 

               
       
 

 


последовательная параллельная порядковая серийно-порядковая

(для иерархической (для фасетной

классификации) классификации)

 

Последовательная система кодирования применяется после классификации объектов.

Суть заключается в следующем: сначала записывается код старшей группировки 1-ого уровня и т.д. в результате получается кодовая комбинация, каждый разряд которой содержит информацию.

Все фасеты кодируются независимо друг от друга, для значения каждого фасета выделяется определенное количество разрядов кода.

Регистрационная используется для обозначения идентификации объектов, не требуя классификации объектов.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами. Этот порядок может быть случайным или определенным после предварительного упорядочивания по алфавиту.

Серийно-порядковая система предусматривает предварительное выделение двух объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: