Анализ данных – это наглядное, лаконичное и полезное их описание.
При проведении исследований объекты исследования описываются признаками, которые отличались друг от друга допустимыми наборами значений. Опишем различные типы шкал признаков согласно общепринятым определениям:
q непрерывная шкала – признак в этой шкале может принимать любое вещественное значение (-10; 0.36; 1.5 и т.д.) разумеется, некоторые признаки могут принимать, например, только положительные значения, то есть лежать в определенном допустимом диапазоне;
q дискретные шкалы – применяются в том случае, если признак не является по смыслу задачи вещественным числом; здесь есть два существенно разных варианта:
¨ номинальные шкалы – применяются, если целое число не является выражением какой-либо меры, а служит просто меткой варианта ответа на вопрос (цвет-красный, синий, зеленый); в случае если допустимыми вариантами ответа являются только «да» и «нет», шкала называется бинарной и признак принимает значение 1 или 0;
¨ порядковые или ординальные шкалы – применяются, если целое число отражает степень проявления определенного качества (например, степень уверенности в ответе); порядковая шкала может изменяться
а) от одной противоположности до другой и тогда допустимые значения располагаются симметрично относительно нуля – точки неопределенности;
б) от точки отсутствия качества до точки наивысшего его проявления – и тогда естественно придавать признаку только положительные значения.
Обычно результаты исследований сводятся в разнообразные таблицы. Если таблицы содержат большие количество данных об объекте исследования, то анализ такого рода таблиц может быть весьма затруднительным. Поэтому возникла необходимость в методах, позволяющих уже в первом приближении определить взаимосвязи между данными. Один из таких способов- визуализация данных.
|
Визуализация данных - задача, с которой сталкивается в своей работе любой исследователь. К задаче визуализации данных сводится проблема представления в наглядной форме данных эксперимента или наблюдения. Традиционные инструменты в этой области - графики и диаграммы – иногда плохо справляются с задачей визуализации, когда возникает необходимость изобразить более трех взаимосвязанных величин.
Для визуализации могут быть использованы 1-, 2- и 3-мерные пространства отображений, но в отчетах обычно ограничиваются способом визуализации с помощью 2-мерных поверхностей, поскольку именно в таком виде человек воспринимает геометрические структуры наиболее естественно и отношения между объектами исследования выглядят наиболее наглядно.
При этом признаки, которые не вошли в координатную плоскость можно представить как свойство этой плоскости. То есть данные обычно изображаются точками, однако, эффективно иметь возможность отображать разнообразную связанную с ними информацию. Для «увеличения размерности» точек данных могут быть использованы следующие приемы:
а) использование цвета, размера и формы для изображения точек данных; это дает возможность отражать три дополнительных измерения, связанных с точками: цвет и размер позволяют изображать количественные признаки -непрерывные шкалы, форма – номинальные шкалы признаков;
б) использование сложных изображений – Метод «звездочек и цветочков» - круг делится на число частей равных числу непоказанных на графике признаков. Затем проводятся лучи из центра круга. Длинна отрезка соответствует значению параметра.
в) точку можно изображать круговой диаграммой, на которой цветами изображено соотношение между значениями координат признаков, а размер отражает абсолютные величины.