Примерная программа учебного курса (учебной дисциплины)
Программа курса (дисциплины) «Теория вероятностей» составлена в соответствии с требованиями к обязательному минимуму содержания и уровню подготовки дипломированного специалиста (бакалавра, магистра) по циклу «гуманитарных дисциплин» по специальности/направлению «математическая лингвистика», а также задачами, стоящими перед Новосибирским государственным университетом по реализации Программы развития НГУ.
Автор Савельев Лев Яковлевич, к. ф. - м. н., профессор
(ФИО, ученая степень, ученое звание)
Факультет Гуманитарный____________________________________________
Кафедра
Фундаментальной и прикладной лингвистики
Цели освоения дисциплины (курса)
Дисциплина «Теория вероятностей» является теоретической базой всех статистических дисциплин. Она необходима для изучения ряда дисциплин учебного плана. Курс позволяет овладеть основными вероятностными методами, применяемыми в современных лингвистических теориях и прикладных лингвистических моделях. Теория вероятностей имеет важное методологическое значение в познавательном процессе.
Курс соответствует двум приоритетным направлениям Программы развития НГУ: математика, гуманитарные науки.
Место дисциплины в структуре образовательной программы
Важное место среди разнообразного инструментария, используемого в гуманитарном образовании и лингвистических исследованиях, занимают анализ текстов и стилей, теория лингвистических переменных, стохастический анализ информации, вероятностные модели языков. Понимание и осмысленное использование этого инструментария в решении исследовательских и практических задач невозможны без определенного запаса знаний и навыков в области теории вероятностей. Именно на овладение необходимым минимумом этих знаний и навыков нацелен курс “Теория вероятностей”. Курс нацелен в первую очередь на разъяснение их прикладных возможностей стохастических методов и на изложение рекомендаций по их использованию.
Для усвоения материала курса теории вероятностей необходимы достаточно полные курсы
1. Алгебры
2. Математического анализа
3. Теории вычислений
В свою очередь материал курса теории вероятностей используется при изложении целого ряда дисциплин, связанных с фундаментальной и прикладной лингвистикой:
1. Прикладной лингвистики
2. Исторической лингвистики
Статистической лингвистики
4. Структурной лингвистики
Криптологии
Стилеметрии
7. Информационных технологий систематизации и исследования художественных текстов
8. Современных информационных технологий в области создания машинных фондов, текстовых и словарных баз данных, электронных библиотек
9. Разработки методов компьютерной систематизации и обработки данных
10. Лингвистических экспериментов
Естественно, наиболее тесные связи с теорией вероятностей имеет статистическая лингвистика, дисциплина, изучающая количественные закономерности естественного языка, проявляющиеся в текстах. В основе с татистической лингвистики лежит предположение, что некоторые численные характеристики и функциональные зависимости между ними, полученные для ограниченной совокупности текстов, характеризуют язык в целом или его функциональные стили (публицистический, научный, художественный и т.п.). Практически важной и наиболее изученной числовой характеристикой является относительная частота употребления различных лингвистических единиц. Накопленные данные используются для выявления особенностей стиля отдельных авторов, атрибуции текстов, дешифровки исторических
Компетенции обучающегося, формируемые в результате освоения дисциплины
Перечень компетенций, формируемых при изучении дисциплины:
· готовность к критическому осмыслению случайности; способность к восприятию, анализу, обобщению информации, постановке цели и выбору путей ее достижения;
· умение использовать историю развития науки вообще и теория вероятностей в частности;
· способность использовать в познавательной и профессиональной деятельности базовые знания в области теория вероятностей;
· владение спецификой вероятностного мышления, способность аргументировано и, ясно делать стохастические выводы;
· осознание значимости теория вероятностей, стремление к саморазвитию, повышению квалификации и мастерства;
· способность анализировать стохастическую структуру языка в его истории и современном состоянии, пользуясь системой основных понятий и терминов теории вероятностей;
· владение навыками проведения конкретных стохастических исследований;
· владение навыками выступлений с сообщениями и докладами,
· представления материалов собственных исследований.
В результате освоения дисциплины обучающийся должен:
· Знать: основные понятия теории вероятностей; основные распределения дискретных и непрерывных случайных величин; методы вычисления вероятностей случайных событий, значений функций распределения, средних значений и других числовых характеристик случайных величин.
· Уметь: составлять и решать различные прикладные вероятностные задачи, связанные с лингвистикой, используя изученные теоретические и эмпирические распределения; проводить грамотный стохастический анализ имеющегося материала; по окончании курса студенты должны обладать набором навыков по стохастическому анализу текстов, получению содержательных выводов.
· Владеть: методами вычисления вероятностей случайных событий, значений функций распределения, средних значений и других числовых характеристик случайных величин; по окончании курса студенты должны владеть методами решения прикладных и теоретических задач, а также выполнять компьютерные вычисления с реальными данными; иметь практические навыки стохастического анализа лингвистических материалов.
4. Структура и содержание дисциплины ______________________________
Общая трудоемкость дисциплины составляет ___4__ зачетных единиц, __70_____ часов.
№ п/п | Раздел дисциплины | Семестр | Неделя семестра | Виды учебной работы, включая самостоятельную работу студентов и трудоемкость (в часах) | Формы текущего контроля успеваемости (по неделям семестра) Форма промежуточной аттестации (по семестрам) | |||
Теория вероятностей | Семестровое задание 24 | Лабораторная работа 4 | Консультации 18 | Контрольные работы с выставлением оценок, 7-я, 14-я недели | ||||
В ходе проведения лекций и практических занятий предусмотрено выполнение студентами двух самостоятельных работ по каждому из разделов, а также экзамен по теории вероятностей. В итоговой оценке по экзамену учитывается результат выполнения самостоятельных семестровых, лабораторных и контрольных работ. Все они вместе с активностью на практических занятиях и посещаемостью оцениваются по 10-ти бальной шкале. Суммарный рейтинг определяет поправку к оценке на экзамене и итоговую оценку за семестр, выставляемую в ведомость.
Программа курса | ||||||
Раздел, тема, содержание занятий | Количество часов | Литература | ||||
Лекции | лекций | упражнений | Самост. занятий | (пункты учебников) | ||
Теория вероятностей Тема 1. — Введение в курс: теории вероятностей и математической статистики, связь с математической лингвистикой, роль в лингвистических исследованиях | — | — | Пиотровский, Введение | |||
2-3 | Тема 2. — Правила действий со случайными событиями и вероятностями. | Савельев, ЭТВ 1-2 | ||||
4-5 | Тема 3. — Случайные величины, их распределения и основные числовые характеристики | Савельев, ЭТВ 1 | ||||
6-7 | Тема 4. — Важнейшие распределения. Наиболее распространенные в математической лингвистике распределения | Пиотровский, гл 6 | ||||
8-9 | Тема 5. — Неравенство Чебышева, законы больших чисел, центральная предельная теорема. | Савельев, ЭТВ 1 Пиотровский, гл 6 | ||||
Тема 6. — Информация и энтропия. Информационные измерения в текстах. Вычисление энтропии текста. | Савельев, ЭТВ 1 Пиотровский, гл 2, 5 Шеннон, с 669-686 | |||||
11-12 | Тема 7. — Стохастическая зависимость, коэффициенты корреляции, регрессии и информации. Вероятностное моделирование текста и составляющих его единиц. | Савельев, ЭТВ 1 Пиотровский, гл 6 Шеннон, с 243-332 | ||||
13-14 | Тема 8. — Цепи Маркова и их реализации. | Савельев, ЭТВ 1 Кемени, гл 2 | ||||
15-16 | Тема 9. — Марковские модели в лингвистике | Шеннон, с 243-332 | ||||
17-18 | Тема 10. — Элементы теории случайных процессов. | Феллер, том 1 |
КРАТКОЕ СОДЕРЖАНИЕ ТЕМ
Тема1. Теория вероятности - раздел математики, изучающий случайные события. Она находит зависимости между их появлениями, вычисляя вероятности их появлений. Математическая статистика - раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. Прикладная и математическая лингвистика существенно использует методы теории вероятностей и математической статистики.
Тема 2. Дискретные, непрерывные и общие вероятностные пространства. Правила сложения и умножения вероятностей. Зависимость и условные вероятности. Формула полной вероятности. Формула Байеса. Примеры применения в прикладной и математической лингвистике.
Тема 3. Случайные величины и переменные. Индикаторы случайных событий. Распределение и функции распределения. Свойства функции распределения. Плотность распределения. Характеристические функции и их свойства. Стохастическая независимость и зависимость. Среднее значение и его свойства. Дисперсия и стандартное отклонение. Последовательности независимых и зависимых случайных величин.
Тема 4. Важнейшие распределения:
· Биномиальное распределение
· Полиномиальное распределение
· Распределение Пуассона
· Экспоненциальные распределения
· Нормальное распределение
· Хи-квадрат распределение
· Распределение Стьюдента
· Распределение Коши