I. Анализ распределения
1. Внести данные в один столбец в программе Past (можно свободно скачать с сайта https://folk.uio.no/ohammer/past/). Столбец назвать «Общая группа». Проанализировать заданную последовательность на наличие нескольких мод (вершин) (гистограмма, критерии нормальности).
а). Построить гистограмму распределения. Ориентировочно оценить распределение (наличие нескольких вершин – мод, симметрия). В этом поможет модуль Normal fit и Kernel density (плотность распределения). [Этот график не войдёт в итоговый doc файл. Он нужен только для вас, чтобы помочь с определением нормальности распределения. Сохранять этот рисунок не нужно.]
б). С помощью критериев (Normality tests) оценить нормальность распределения.
в). Создать файл.doc (Фамилия_Водоём.doc), выписать туда значение критерия Шапиро – Уилка (W=;округлять до сотых) и значение p к нему (p=; округлять до тысячных, если очень маленькое значение, писать p<0,001), написать предварительный вывод.
2. В случае полимодального распределения (несколько вершин) произвести разделение данных (Mixture analysis) (предварительно лучше их упорядочить по возрастанию). В окне Mixture analysis включить Kernel density и полученную гистограмму сохранить со следующими параметрами:
а). шрифт Times New Roman, размер 14, обычный;
б). назвать ось Y – «Абсолютная частота, шт.»;
в). назвать ось X – «Концентрация нитратов, мг/л», повернуть подпись горизонтально;
г). размеры рисунка 400х400.
Сохранить рисунок в формате SVG (Фамилия_Гистограмма.svg)
3. С помощью графического редактора TpX (можно свободно скачать с сайта https://sourceforge.net/projects/tpx/) доработать рисунок:
а). Заменить во всех числах точки на запятые;
б). Сделать заливку столбцов гистограммы по своему вкусу (неброско, можно штриховку).
в). Сохранить в формате TpX и PNG. Последний вставить в файл Фамилия_Водоём.doc.
4. В Past скопировать значения, принадлежащие разным группам в следующие столбцы (Copy – Paste). Назвать вновь полученные столбцы – «Группа 1», «Группа 2» и т. д.. Сохранить файл (Фамилия_Водоём.dat).
II. Построение столбчатых и коробчатых графиков распределения,
1. Построить коробчатые графики полученных данных (в одном окне), включая изначальную выборку («Общая группа»); построить столбчатый график (усы – 95%ДИ (в качестве типа усов выбрать стандартную ошибку среднего)). Графики сохранить со следующими параметрами:
а). шрифт Times New Roman, размер 14, обычный;
б). назвать ось Y – «Концентрация нитратов, мг/л»;
в). повернуть подписи столбцов данных горизонтально;
г). количество отметок на осях подобрать оптимальное (не слишком много, но чтобы значения средних, медиан, квартилей можно было легко определить по графику);
д). размеры рисунка 400х400.
е). если на рисунке есть ненужные пустые места, изменить значение конца оси Y (уменьшить).
Сохранить файл с расширением.svg для дальнейшей доработки в векторном редакторе TpX (всего 2 файла SVG – коробчатые графики и столбчатые).
2. С помощью графического редактора TpX (можно свободно скачать с сайта https://sourceforge.net/projects/tpx/) доработать рисунки:
а). Разместить подписи данных по центру столбцов/коробок и на одном уровне.
б). Для всех чисел заменить десятичную точку на десятичную запятую.
в). Сделать заливку столбцов/коробок на свой вкус (цвет спокойный, можно штриховку), различную (различаться должны либо цвет, либо штриховка) для каждого столбца/коробки (напр., если всего получилось 3 группы, цвет для «Общей группы» – сочетание цветов для двух составных групп: зелёный, синий, жёлтый).
Сохранить рисунки каждый в двух форматах: TpX и PNG.
Итого получается 7 файлов: файл с данными (.dat), 2 рисунка SVG, 2 рисунка TpX, 2 рисунка PNG. В дальнейшем понадобятся файл с данными и рисунки PNG.
3. В созданный ранее текстовый файл вставить 2 рисунка PNG и под каждым графиком указать (для «Общей группы» обозначения без индекса, для выделенных групп – нижний индекс с номером группы):
а). для столбчатого – объём выборки (N=, N1= и т.д.), среднее (x=, x1= и т.д.), ст. отклонение (σ=, σ1= и т. д.), ст. ошибку среднего (σx =, σx1= и т. д.) 95%ДИ;
б). для коробчатого – объём выборки, медиану (Me=, Me1= и т.д.), нижний квартиль (Q1=, Q1 (1)= и т.д.), верхний квартиль (Q3=, Q3 (1)= и т.д.);
Значения средних, станд. отклонений, 95%ДИ округлять на знак больше точности измерений, станд. ошибку – ещё на знак больше, медианы и квартили – с точностью измерений. Все значения определяем с помощью меню Univariate – Summary statistics (95%ДИ для среднего (mean) определяем с помощью bootstrap в этом же окне).
Сделать итоговый вывод: в чём причина неоднородности исходной выборки (по вашему мнению), т. е. почему эта выборка разделилась на несколько (в чём биологический смысл) [напр., в задаче про полёвок неоднородность объяснялась наличием самцов и самок в одной группе].
Итог: 1 файл DOC с тремя вставленными картинками, который и нужно сдать мне (отправить на почту). Все исходные и промежуточные файлы мне не нужны, но их не удаляйте!! (мало ли что)