Проф. Л.И.Бородкин
Данный курс преподается студентам исторического факультета МГУ им. М.В.Ломоносова с 1996 г. Лекционный курс сопровождают двухсеместровые практические занятия: в IV семестре - практикум по основам информатики и применению информационных технологий в исторических исследованиях; в V семестре - практикум по изучению компьютерных методов анализа данных (в основном методов математической статистики). Практикумы были поставлены в 1991 г.
Целью лекционного курса является ознакомление студентов-историков с основными понятиями информатики и математики, а также со спецификой их использования в исторических исследованиях. Лекционный материал дается с учетом как международного, так и отечественного опыта информатизации гуманитарных наук. В изложении математических понятий и методов основное внимание уделяется их логической структуре. Обсуждение принципов построения математических моделей и статистических теорий проводится с учетом ограничений, порождаемых особенностями социально-гуманитарного знания.
Цель практикумов в данном цикле - овладение современными информационными технологиями (применительно к задачам хранения и анализа данных исторических источников), обучение работе как со стандартным, так и со специализированным программным обеспечением. Практикумы проводятся на базе двух компьютерных классов, оснащенных современными компьютерами (с доступом к глобальной сети Интернет).
В результате освоения материала практикума cтудент должен уметь:
· квалифицированно пользоваться современной литературой, содержащей опыт применения информационных технологий и математических методов в исторических исследованиях;
· работать с электронными текстами;
· эффективно пользоваться методами поиска информации в сети Интернет;
· работать с электронными каталогами ведущих библиотек России и мира;
· работать с Интернет-ресурсами архивной службы России и других стран;
· создавать базы данных по материалам источников разных типов;
· применять математико-статистические методы анализа данных исторических источников, разбираться в их логических основах;
· грамотно пользоваться компьютерными программами статистического анализа для обработки данных источников;
· разбираться в основных подходах к моделированию исторических процессов, знать о возможностях и ограничениях математических моделей в изучении прошлого.
В III семестре студенты сдают зачет по данной дисциплине, а в IV семестре - экзамен.
I. ОСНОВЫИНФОРМАТИКИ.
ИСТОРИЧЕСКАЯ ИНФОРМАТИКА
1. Введение.
1.1. Предмет и задачи курса.
1.2. Информатика как комплексная научно-техническая дисциплина. Информатизация общества - одна из основных тенденций современного развития.
1.3. Социальная информатика и познание закономерностей информатизации общества.
1.4. Основные направления использования компьютерных технологий в исторических исследованиях:
· создание и использование компьютерных баз и банков данных;
· создание и использование электронных текстов; компьютеризованный анализ описательных источников;
· статистическая обработка данных исторических источников на компьютере;
· компьютерное моделирование исторических процессов и явлений;
· сканирование текстов и изображений, компьютеризованный анализ изобразительных источников и картографического материала;
· применение мультимедиа технологий в исторических исследованиях и в обучении истории;
· информатизация архивов, музеев и библиотек;
· Internet - новые информационные ресурсы для историков.
2. Предметная область и основные понятия информатики.
2.1. Понятия информационных задач, систем, продуктов и ресурсов.
2.2. Понятие о теории информации. Определения и способы измерения количества информации.
2.3. Информация и данные. Табличная, текстовая, графическая информация. Понятие языка описания документа. Языки разметки документов.
3. Историческая информатика: предмет, история становления и основные тенденции развития.
3.1. Опыт применения средств вычислительной техники в исторических исследованиях:
· эра больших ЭВМ: 60-е - середина 80-х годов;
· «микрокомпьютерная революция»: конец 80-х - начало 90-х гг.
3.2. Историческая информатика: структура и содержание. Прикладная и теоретическая компоненты исторической информатики.
4. Машиночитаемые источники: модели данных, программы обработки.
4.1. Основные этапы компьютеризованного исторического исследования.
4.2. Данные и модели данных:
· типы данных;
· структуры данных.
4.3. Специфика моделирования исторических источников:
· статистические источники;
· структурированные источники;
· текстовые источники (свободный текст);
· изобразительные и картографические источники.
4.4. Машиночитаемые данные (МЧД): хранение, каталогизирование и доступ.
4.5. Принципы формирования и функционирования архивов машиночитаемых исторических данных. Обзор национальных архивов МЧД.
5. Аппаратное и программное обеспечение компьютерных систем.
5.1. Аппаратное обеспечение персонального компьютера и его эволюция в 80-90-е гг.
5.2. Аппаратное обеспечение электронных коммуникаций.
5.3. Аппаратная поддержка мультимедиа.
5.4. Уровни программного обеспечения:
· операционные системы (ОС) и оболочки;
· операционная система MS DOS;
· операционная система Windows;
· прикладное программное обеспечение.
5.5. Прикладное программное обеспечение (ППО):
· основные функции и компоненты прикладных программ;
· классификация видов ППО применительно к задачам исторических исследований.
6. Электронный текст: создание, хранение, поиск, анализ.
6.1. Системы подготовки текстов; основные функции текстового процессора.
6.2. Электронный текст как новый информационный ресурс в исторических исследованиях.
6.3. Концепции электронного текста.
6.4. Методы извлечения информации в полнотекстовых системах.
6.5. Анализ текстовых источников с помощью программы TACT: компьютеризованный контент-анализ.
7. Информационные системы и базы данных.
7.1. Понятие информационной системы (ИС). Документальные и фактографические ИС. База данных в структуре ИС.
7.2. Технология баз данных (БД); основные определения.
7.3. Проектирование БД:
· концептуальная модель БД; определения сущности, атрибута, связи;
· логическая модель БД.
7.4. Реляционная база данных; таблица как отношение и ее свойства.
7.5. Принципы работы реляционных систем управления базами данных (СУБД).
7.6. Основные этапы работы с реляционной БД:
· создание и модификация структуры базы; имя, тип и длина поля; типы полей;
· просмотр, информационный поиск и редактирование записей БД;
· запросы к БД; типы запросов; запросы с критериями поиска;
· работа с несколькими таблицами;
· связывание таблиц БД и обеспечение целостности.
7.7. Возможности и ограничения применения СУБД Access при создании баз данных историками.
7.8. Понятие о документальных БД и информационно-поисковых системах (ИПС). Полнотекстовый и библиографический поиск. Оценка результатов поиска. Релевантность.
7.9. Специфика исторических источников и источнико-ориентированный подход к созданию БД:
· источнико-ориентированные и проблемно-ориентированные БД;
· примеры специализированных пакетов программ, созданных для работы с историческими источниками; система KLEIO.
7.10. Опыт создания и использования баз данных в исторических исследованиях:
· просопографические базы данных;
· базы данных в исследованиях по социально-экономической и социально-политической истории.
7.11. Интеллектуальные ИС и базы знаний.
7.11.1. Методы искусственного интеллекта: экспертные системы (ЭС), представление знаний.
7.11.2. Базы данных и базы знаний в ЭС.
7.11.3. Когнитивные модели понимания текста, опыт их применения в исторических исследованиях.
8. Электронные таблицы и пакеты статистических программ: работа со структурированными данными
8.1. Специфика электронных таблиц как программного обеспечения.
8.2. Электронная таблица Excel for Windows:
· устройство электронной таблицы;
· операции над данными и средства их реализации.
8.3. Первичный анализ статистических данных.
8.4. Решение источниковедческих проблем.
8.5. Графические возможности электронных таблиц.
8.6.Статистические пакеты - эффективный аналитический инструментарий при работе с массовыми источниками.
8.7. Основные возможности статистических пакетов:
· дескриптивная статистика;
· выборочный метод;
· анализ статистических взаимосвязей;
· анализ временных рядов;
· многомерный статистический анализ;
· таблицы сопряженности;
· визуализация результатов статистического анализа.
8.8. Характеристика возможностей статистических пакетов SPSS и STATISTICA в практике исторических исследований.
9. Хранение и обработка графической информации на компьютере.
9.1. Представление графической информации в памяти компьютера. Характеристика возможностей основных графических пакетов.
9.2. Создание коллекций электронных изображений:
· интегрирование изображений в базы данных;
· возможности улучшения качества электронных изображений;
· опыт создания и использования баз данных, построенных на материалах изобразительных источников.
9.3. Сканирование и оптическое распознавание исторических текстов:
· возможности и ограничения программ распознавания старопечатных и рукописных текстов;
· опыт распознавания текстов исторических источников.
9.4. Компьютерное картографирование в исторических исследованиях:
· виды компьютерных карт;
· ГИС (географические информационные системы) - программное обеспечение компьютерного картографирования;
· основные этапы создания компьютерной карты;
· опыт использования ГИС в исторических исследованиях.
10. Глобальная сеть Интернет.
10.1. Назначение сети Интернет. Интернет - глобальная компьютерная сеть, объединяющая различные сети, взаимосвязанные с помощью специальных программ (протоколов).
10.2. Основные возможности сети Интернет:
10.2.1. Telnet - протокол удаленного доступа к ресурсам Интернета, дающий пользователю возможность работать с библиотечными каталогами, базами данных и прочими информационными ресурсами.
10.2.2. Электронная почта - средство посылать сообщения, получать их в свой электронный почтовый ящик, а также рассылать копии письма сразу нескольким получателям.
10.2.3. World Wide Web: концепция универсальной глобальной информационной системы. Понятие гипертекста. Гипертекстовые системы - новый класс систем управления информационными ресурсами (текстами, файлами, рисунками, звуками, подвижными изображениями и т.п.). Броузеры - программы, позволяющие ориентироваться в сети, обеспечивающие сетевое соединение и отображающие гипертекстовые документы. Отечественные и зарубежные поисковые системы, позволяющие проводить "навигацию" в сети, искать нужную информацию по ключевым словам. "Домашние странички", веб-сайты, порталы. Новые информационные ресурсы Интернета для историков. Обзор полезных Web-сайтов, содержащих информацию для специалистов по отечественной и всеобщей истории. Поиск архивных Интернет-ресурсов. Работа с электронными каталогами ведущих библиотек России и других стран.