Лекция 4. Формы графического изображения данных.




График - это графическое изображение функциональной зависимости при помощи линий на плоскости. График должен сопровождаться заголовком, который содержит информацию о характере изображаемого показателя, единицах его измерения, территории и времени его определения.

1) гистограмма распределения - вид столбиковой диаграммы на оси Ох откладываются интервалы значения варьирующего признака, на оси Оу - частоты признака соответствующего масштабам. Применяется для интервального ряда. Пример на фотке (2 фотки). Если все интервалы не равны по величине, тогда на оси ординат откладываются не частоты признака, а его плотность. Плотность признака фотка.

2) Полигон распределения - вид линейного графика, представляющий собой ломаную линию. Края полигона распределения для сгруппированной переменной могут быть сведены к нулю. Обычно используются для дискретного ряда. На оси Ох откладываются варианты признака, на оси Оу его частоты. Пример 2 фотки. Можно получить и для интервального ряда. Для этого ломаные линии соединяют середины верхних основани прямоугольника. Фотка. Полигон распределения полезно получить в случае неравных интервалов, он точнее характеризует закономерность изменения значения признака и решает проблему открытых интервалов. Кроме того правильно построенный полигон распределения позволяет выявить тенденцию, скрытую табличной формой представления данных.

31.10.2015

Если исследуется совокупность качественно-однородных признаков, то средняя величина выступает здесь как типическая средняя, кот обобщает качественно-однородное значение признака изучаемой совокупности. При изучении совокупности с качественно-разнородными признаками на первый план может выйти нетипичность средних показателей. В данном случае средние величины обобщают качественно-разнородные значения признаков или систему пространственных совокупностей или динамических. Такие средние величины называются системными. При статистической обработке данных в зависимости от задач исследования нужно определить соответствующую среднюю. Для этого используется правило: величины, кот представляют собой числитель и знаменатель средней должны быть логически связаны между собой. Используются 2 категории средних величин - степенная и структурная. В первую входит средняя арифметическая, средняя гармоническая, средняя квадратическая, средняя геометрическая. Вторая категория - мода и медиана. Различные средние выводятся из общей формулы степенной средней. Фотка. Xi - величины, для которых вычисляются средние, f - частота, повторяемость данного значения признака. При к = 1 высчитывается среднее арифметическое. При к = -1 среднее гармоническое. При к = 0 среднее геометрическое. К = -2 среднее квадратическое.

Средние величины бывают простые и взвешенные. Взвешенными средними называют величины, которые учитывают, что некоторые варианты значения признака могут иметь различную численность в связи с чем каждый вариант приходится умножать на эту численность (частоту). То есть весами выступают числа единиц совокупности в разных группах. Частоту f (i) называют статистическим весом или весом средней.

Свойства арифметической средней:

1) сумма положительных отклонений индивидуальных значений признака от его средней величины равна сумме отрицательных отклонений. Таким образом,любые случайные отклонения будут погашены.

2) Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа.

3) Среднее арифметическое постоянной величины равна этой постоянной.

Кроме основных свойств существуют расчетные свойства средней арифметической:

1) если индивидуальное значение признака каждой единицы умножить или разделить на постоянное число, то среднее арифметическое увеличится или уменьшится во столько же раз.

2) Среднее арифметическое не изменится, если вес (частоту) каждого значения признака разделить на постоянное число.

3) Если индивидуальное значение признака каждой единицы уменьшить или увеличить на одну и ту же величину, то среднее арифметическое увеличится или уменьшится на ту же величину.

Средняя гармоническая (обратная средняя арифметическая) используется тогда, когда веса значения признака одинаковы. Фотка.

Гармоническая взвешенная. Фотка. Используется в тех случаях, когда вес по каждому признаку не равен.

Средняя геометрическая чаще всего применяется при определении средних темпов роста, когда индивидуальное значение признака представлено в виде относительных величин. Фотка.

Прежде чем рассчитывать структурные средние, нужно изучить то, какой ряд распределения используется. В зависимости от того, какой признак взят за основу группировки, различают ряды распределений. Если за основу взят качественный признак, то ряд распределения называют атрибутивным. Если по количеству, ряд называют вариационным. Построить вариационный ряд значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями. Выделяют три формы вариационного ряда: ранжированный, дискретный, интервальный.

Простейшим способом изучения вариации признака совокупности является размах вариации или ее амплитуда. Фотка. Она определяет лишь наибольшее различие в значениях признака и обусловлено двумя крайними величинами. Следовательно, она не учитывает особенности распределения в целом и не учитывает все различия каждого значения признака, поэтому на практике чаще всего прибегают к изучению среднего квадратического отклонения (стандартное). Оно позволяет определить границы, в которых изменяются конкретные значения признака. Фотка.

Если мы изучаем интервальный ряд, формула видоизменяется. Фотка. В изучаемой совокупности рабочих предприятия n, их возраст в среднем отклонялся на 13 лет от средней величины, равной 34,5 года.

Среднее квадратическое отклонение для определения размаха вариации качественных признаков считается по формуле. Фотка. П1 - частота первой варианты признака, п2 - частота второй варианты, н - число наблюдений.

Пример. Даны сведения об успеваемости группы студентов количеством 24 человека, после сессии 6 из них имеют задолженности, 18 сдали успешно. Чему равно среднее квадратическое отклонение?

6*18/24 (по предыдущей формуле) = 2

Дисперсией при интерпретации выражаются в тех же единицах, что и сами признаки. Следовательно, будучи выражеными в разных единицах измерения, средние квадратические отклонения несравнимы. В случае необходимости пользуются коэффициентом вариации. Фотка. Полученную величину модно выразить в процентах. Коэффициенты вариации нескольких признаков можно сравнивать. Показатели вариации раскрывают уровень репрезентативности средней величины, степень ее точности и адекватности историческим реалиям. При большом разбросе значения признака и при значительных показателях вариации средняя величина не считается достаточно достоверной характеристикой. Дисперсия является необходимым и обязательным дополнительным показателем при сравнении средних и сопоставлении различных группировок. С ее помощью проверяется и обосновывается правомерность применения статистических методов. Дисперсия служит индикатором однородности изучаемой совокупности и нормальности ее распределения. Сравнение дисперсии различных признаков позволяет судить об их качественном значении в изучаемой системе. Дисперсии помогают не потерять сглаженные средние показатели своеобразия признаков изучаемого явления.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-06-21 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: