II. Построение столбчатых и коробчатых графиков распределения,

I. Анализ распределения

1. Внести данные в один столбец в программе Past (можно свободно скачать с сайта https://folk.uio.no/ohammer/past/). Столбец назвать «Общая группа». Проанализировать заданную последовательность на наличие нескольких мод (вершин) (гистограмма, критерии нормальности).

а). Построить гистограмму распределения. Ориентировочно оценить распределение (наличие нескольких вершин – мод, симметрия). В этом поможет модуль Normal fit и Kernel density (плотность распределения). [Этот график не войдёт в итоговый doc файл. Он нужен только для вас, чтобы помочь с определением нормальности распределения. Сохранять этот рисунок не нужно.]

б). С помощью критериев (Normality tests) оценить нормальность распределения.

в). Создать файл.doc (Фамилия_Водоём.doc), выписать туда значение критерия Шапиро – Уилка (W=;округлять до сотых) и значение p к нему (p=; округлять до тысячных, если очень маленькое значение, писать p<0,001), написать предварительный вывод.

2. В случае полимодального распределения (несколько вершин) произвести разделение данных (Mixture analysis) (предварительно лучше их упорядочить по возрастанию). В окне Mixture analysis включить Kernel density и полученную гистограмму сохранить со следующими параметрами:

а). шрифт Times New Roman, размер 14, обычный;

б). назвать ось Y – «Абсолютная частота, шт.»;

в). назвать ось X – «Концентрация нитратов, мг/л», повернуть подпись горизонтально;

г). размеры рисунка 400х400.

Сохранить рисунок в формате SVG (Фамилия_Гистограмма.svg)

3. С помощью графического редактора TpX (можно свободно скачать с сайта https://sourceforge.net/projects/tpx/) доработать рисунок:

а). Заменить во всех числах точки на запятые;

б). Сделать заливку столбцов гистограммы по своему вкусу (неброско, можно штриховку).

в). Сохранить в формате TpX и PNG. Последний вставить в файл Фамилия_Водоём.doc.

4. В Past скопировать значения, принадлежащие разным группам в следующие столбцы (Copy – Paste). Назвать вновь полученные столбцы – «Группа 1», «Группа 2» и т. д.. Сохранить файл (Фамилия_Водоём.dat).

II. Построение столбчатых и коробчатых графиков распределения,

1. Построить коробчатые графики полученных данных (в одном окне), включая изначальную выборку («Общая группа»); построить столбчатый график (усы – 95%ДИ (в качестве типа усов выбрать стандартную ошибку среднего)). Графики сохранить со следующими параметрами:

а). шрифт Times New Roman, размер 14, обычный;

б). назвать ось Y – «Концентрация нитратов, мг/л»;

в). повернуть подписи столбцов данных горизонтально;

г). количество отметок на осях подобрать оптимальное (не слишком много, но чтобы значения средних, медиан, квартилей можно было легко определить по графику);

д). размеры рисунка 400х400.

е). если на рисунке есть ненужные пустые места, изменить значение конца оси Y (уменьшить).

Сохранить файл с расширением.svg для дальнейшей доработки в векторном редакторе TpX (всего 2 файла SVG – коробчатые графики и столбчатые).

2. С помощью графического редактора TpX (можно свободно скачать с сайта https://sourceforge.net/projects/tpx/) доработать рисунки:

а). Разместить подписи данных по центру столбцов/коробок и на одном уровне.

б). Для всех чисел заменить десятичную точку на десятичную запятую.

в). Сделать заливку столбцов/коробок на свой вкус (цвет спокойный, можно штриховку), различную (различаться должны либо цвет, либо штриховка) для каждого столбца/коробки (напр., если всего получилось 3 группы, цвет для «Общей группы» – сочетание цветов для двух составных групп: зелёный, синий, жёлтый).

Сохранить рисунки каждый в двух форматах: TpX и PNG.

Итого получается 7 файлов: файл с данными (.dat), 2 рисунка SVG, 2 рисунка TpX, 2 рисунка PNG. В дальнейшем понадобятся файл с данными и рисунки PNG.

3. В созданный ранее текстовый файл вставить 2 рисунка PNG и под каждым графиком указать (для «Общей группы» обозначения без индекса, для выделенных групп – нижний индекс с номером группы):

а). для столбчатого – объём выборки (N=, N₁= и т.д.), среднее (x=, x₁= и т.д.), ст. отклонение (σ=, σ₁= и т. д.), ст. ошибку среднего (σ_x=, σ_x₁= и т. д.) 95%ДИ;

б). для коробчатого – объём выборки, медиану (Me=, Me₁= и т.д.), нижний квартиль (Q₁=, Q₁(1)= и т.д.), верхний квартиль (Q₃=, Q₃ (1)= и т.д.);

Значения средних, станд. отклонений, 95%ДИ округлять на знак больше точности измерений, станд. ошибку – ещё на знак больше, медианы и квартили – с точностью измерений. Все значения определяем с помощью меню Univariate – Summary statistics (95%ДИ для среднего (mean) определяем с помощью bootstrap в этом же окне).

Сделать итоговый вывод: в чём причина неоднородности исходной выборки (по вашему мнению), т. е. почему эта выборка разделилась на несколько (в чём биологический смысл) [напр., в задаче про полёвок неоднородность объяснялась наличием самцов и самок в одной группе].

Итог: 1 файл DOC с тремя вставленными картинками, который и нужно сдать мне (отправить на почту). Все исходные и промежуточные файлы мне не нужны, но их не удаляйте!! (мало ли что)

II. Построение столбчатых и коробчатых графиков распределения,

Поиск по сайту