Возьмем для исследования отрывок из повести «Дубровский» А. С.Пушкина.




Учебный текст.

Основу статистического исследования составляет множество данных, полученных в результате измерения одного или нескольких признаков. Реально наблюдаемая совокупность объектов, статистически представленная рядом наблюдений случайной величины , является выборкой, а гипотетически существующая (домысливаемая) — генеральной совокупностью. Репрезентативность выборки — иными словами, ее представительность — это способность выборки представлять изучаемые явления достаточно пол­но — с точки зрения их изменчивости в генеральной совокупности. Генеральная совокупность может быть конечной (число наблюдений N = const) или бесконечной (N = ∞), а выборка из генеральной совокупности — это всегда результат ограниченного ряда наблюдений. Число наблюдений , образующих выборку, называется объемом выборки. Если объем выборки достаточно велик (n → ∞) выборка считается большой, в противном случае она называется выборкой ограниченного объема. Выборка считается малой, если при измерении одномерной случайной величины объем выборки не превышает 30 (n <= 30), а при измерении одновременно нескольких (k) признаков в многомерном пространстве отношение n к k не превышает 10 (n/k < 10). Выборка образует вариационный ряд, если ее члены являются порядковыми статистиками, т. е. выборочные значения случайной величины Х упорядочены по возрастанию (ранжированы), значения же признака называются вариантами.

Пример. Практически одна и та же случайно отобранная совокупность объектов — коммерческих банков одного административного округа Москвы, может рассматриваться как выборка из генеральной совокупности всех коммерческих банков этого округа, и как выборка из генеральной совокупности всех коммерческих банков Москвы, а также как выборка из коммерческих банков страны и т.д.

 

Пример выполнения практического задания:

Возьмем для исследования отрывок из повести «Дубровский» А. С.Пушкина.

«Похороны8 свершились11 на2 третий6 день4. Тело4 бедного7 старика7 лежало6 на2 столе5, покрытое8 саваном7 и1 окружённое10 свечами7. Столовая8 полна5 была4 дворовых8. Готовились10 к1 выносу6. Владимир8 и1 трое4 слуг4 подняли7 гроб4. Священник9 пошёл5 вперёд6, дьячок6 сопровождал11 его3, воспевая8 погребальные12 молитвы7. Хозяин6 Кистенёвки10 последний9 раз3 перешёл7 за2 порог5 своего6 дома4. Гроб4 понесли7 рощею5. Церковь7 находилась10 за2 нею3. День4 был3 ясный5 и1 холодный8 Осенние7 листья6 падали6 с1 дерев5. При3 выходе6 из2 рощи4 увидели7 кистенёвскую12 деревянную10 церковь7 и1 кладбище8, осенённое9 старыми7 липами6. Там3 покоилось9 тело4 Владимировой12 матери6; там3, подле5 могилы6 её2, накануне8 вырыта6 была4 свежая6 яма3. Церковь7 полна5 была4 кистенёвскими13 крестьянами11, пришедшими10 отдать6 последнее9 поклонение10 господину9 своему6. Молодой7 Дубровский10 стал4 у1 клироса7; он2 не2 плакал6 и1 не2 молился7, но2 лицо4 его3 было4 страшно7. Печальный9 обряд5 кончился8. Владимир8 первый6 пошёл5 прощаться9 с1 телом5, за2 ним3 и1 все3 дворовые8. Принесли8 крышку6 и1 заколотили10 гроб4. Бабы4 громко6 выли4; мужики6 изредка7 утирали7 слёзы5 кулаком7. Владимир8 и1 тех3 же2…»

1) Посчитав частоту появления каждой буквы в данном тексте, составим выборку, вариантами которой являются буквы русского алфавита.

2) Посчитав количество букв в каждом слове отрывка, составим выборку, вариантами которой являются количество букв в слове.

3) Упорядочив данные значений вариант, составим вариационные ряды и заполним соответствующие таблицы распределения частот.

Таблица частот появления букв русского алфавита (проза) n=847

Буквы а б в г д е ё ж з и й
Кратность                      
Относительная частота 54/ 15/ 40/ 15/ 32/ 68/ 10/ 6/ 9/ 72/ 9/
Частота % 6.2 1.7 4.6 1.7 3.6 7.8 1.1 0.7   8.2  
Буквы к л м н о п р с т у ф
Кратность                      
Относительная частота 36/ 64/ 30/ 54/ 100/ 34/ 51/ 45/ 30/847 15/847 7/847
Частота % 4.1 7.3 3.4 6.2 11.4 3.9 5.8 5.1 3.4 1.7 0,8
Буквы х ц ч ш щ ъ ы ь э ю я
Кратность                      
Относительная частота 7/ 4/ 4/ 8/ 5/ - 25/ 16/ - 4/ 15/
Частота % 0.5 0.5 0.9 0.6 2.9 - 0.5 1.7 - 0.55 1.7

Числовые характеристики

· Мода: буква «о» - чаще всего встречающаяся в произведении буква

· Количество глаголов - 28

· Количество существительных - 53

Таблица частот интервального ряда

Интервал значений варианты А - Й К - Ф Х – Я
Частоты      
Относительные частоты 330/847 459/847 88/847
Частоты % 37,6 52,4  

В отрывке из 149 слов мы получили 26 глаголов и 52 существительных. Количество глаголов и существительных в отрывке этого же произведения объёмом 2000 слов можно найти, используя определение репрезентативной выборки, по формуле

Si =(Mi/N)* S,

где N-объём репрезентативной выборки,

S- объём генеральной выборки,

Mi- частота (кратность) варианты репрезентативной выборки,

Si- частота (кратность) варианты генеральной выборки.

В нашем случае N=149, M1=26, M2=52, S=2000, поэтому

· для глаголов: S1=349;

· для существительных: S2=697.

Таблица распределения частот количества букв в слове n =149

(проза)

Варианты                          
Кратность                          
Частота % 8,1 8,1 8,1 12,8 8,7 14,8 14,1 9,4 5,4 6,7 1,3 2,0 0,7

Числовые характеристики

· Мода М (0)=6 (чаще всего в этом произведении встречаются слова, состоящие из 6 букв)

· Медиана М (е)= 7 (половина слов состоит не менее чем из 7 букв)

· Среднее арифметическое = 7 (среднее количество букв в слове)

Вопросы и задания для самоконтроля:

1. Объясните место и роль метода классификации и группировки в статистическом исследовании. Что такое классификация и группировка?

2. Какие задачи в исследовании совокупностей не могут быть решены с помощью простой группировки?

3. Назовите разновидности сложной группировки.

4. В каких случаях используются неравные интервалы? Какой вид группировки при этом предпочтителен?

5. Решение каких задач требует использования метода структурной группировки?

6. Что отличает статистическую таблицу от любой другой?

7. Какие типы статистических таблиц вам известны?

 

 

Примерное задание

Возьмем для исследования отрывок из повести «Дубровский» А. С.Пушкина.

«Похороны8 свершились11 на2 третий6 день4. Тело4 бедного7 старика7 лежало6 на2 столе5, покрытое8 саваном7 и1 окружённое10 свечами7. Столовая8 полна5 была4 дворовых8. Готовились10 к1 выносу6. Владимир8 и1 трое4 слуг4 подняли7 гроб4. Священник9 пошёл5 вперёд6, дьячок6 сопровождал11 его3, воспевая8 погребальные12 молитвы7. Хозяин6 Кистенёвки10 последний9 раз3 перешёл7 за2 порог5 своего6 дома4. Гроб4 понесли7 рощею5. Церковь7 находилась10 за2 нею3. День4 был3 ясный5 и1 холодный8 Осенние7 листья6 падали6 с1 дерев5. При3 выходе6 из2 рощи4 увидели7 кистенёвскую12 деревянную10 церковь7 и1 кладбище8, осенённое9 старыми7 липами6. Там3 покоилось9 тело4 Владимировой12 матери6; там3, подле5 могилы6 её2, накануне8 вырыта6 была4 свежая6 яма3. Церковь7 полна5 была4 кистенёвскими13 крестьянами11, пришедшими10 отдать6 последнее9 поклонение10 господину9 своему6. Молодой7 Дубровский10 стал4 у1 клироса7; он2 не2 плакал6 и1 не2 молился7, но2 лицо4 его3 было4 страшно7. Печальный9 обряд5 кончился8. Владимир8 первый6 пошёл5 прощаться9 с1 телом5, за2 ним3 и1 все3 дворовые8. Принесли8 крышку6 и1 заколотили10 гроб4. Бабы4 громко6 выли4; мужики6 изредка7 утирали7 слёзы5 кулаком7. Владимир8 и1 тех3 же2…». Всего слов:

 

Таблица частот появления букв русского алфавита (проза)

Буквы а б в г д е ё ж з и й
Кратность                      
Относительная частота                      
Частота %                      
Буквы к л м н о п р с т у ф
Кратность                      
Относительная частота                      
Частота %                      
Буквы х ц ч ш щ ъ ы ь э ю я
Кратность                      
Относительная частота                      
Частота %                      

 

Таблица частот интервального ряда

Интервал значений варианты А - Й К - Ф Х – Я
Частоты      
Относительные частоты      
Частоты %      

 

Таблица распределения частот количества букв в слове

(проза)

Варианты                          
Кратность                          
Частота %                          

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-06-30 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: