Функции MatLab для первичной обработки статистических данных




 

В MatLab для первичной обработки данных удобно использовать массивы и функции их обработки:

- mах(А) — возвращает наибольший элемент массива, если А одномерный массив (вектор). Если А матрица, то функция mах(А) возвращает вектор-строку, содержащую максимальные элементы каждого столбца.

>> a=[2 5 7;3 9 6;8 5 4]

max(a)

a =

2 5 7

3 9 6

8 5 4

ans =

8 9 7

- mах(А,В) — возвращает массив того же размера, что А и В, каждый элемент которого есть максимальный из соответствующих элементов этих массивов.

>> a=[2 5 7;3 9 6;8 5 4]

b=[3 5 9;1 7 3;6 8 2]

max(a,b)

a =

2 5 7

3 9 6

8 5 4

b =

3 5 9

1 7 3

6 8 2

ans =

3 5 9

3 9 6

8 8 4

- max(A,[ ],dim) — возвращает наибольшие элементы по столбцам или по строкам матрицы в зависимости от значения скаляра dim (dim=l по столбцам и dim=2 по строкам соответственно). Например, mах(А,[ ],1) возвращает максимальные элементы каждого столбца матрицы А.

- [C,I] =max(A) — кроме максимальных значений возвращает вектор индексов I этих элементов.

>> a=[2 5 7;3 9 6;8 5 4]

[C,I] =max(a)

a =

2 5 7

3 9 6

8 5 4

C =

8 9 7

I =

3 2 1

- min(A) — возвращает минимальный элемент, если А — вектор; или возвращает вектор-строку, содержащую минимальные элементы каждого столбца, если А — матрица.

- min(A,B) — возвращает массив того же размера, что А и В, каждый элемент которого есть минимальный из соответствующих элементов этих массивов.

- min(A,[ ],dim) — возвращает наименьший элемент по столбцам или по строкам матрицы в зависимости от значения скаляра dim (dim=l по столбцам и dim=2 по строкам соответственно).

- [C,I] = min(A) — кроме минимальных значений возвращает вектор индексов этих элементов.

- mean (А) — возвращает арифметическое среднее значение элементов массива, если А — вектор; или возвращает вектор-строку, содержащую средние значения элементов каждого столбца, если А — матрица.

- mean(A,dim) — возвращает среднее значение элементов по столбцам или по строкам матрицы в зависимости от значения скаляра dim (dim=l по столбцам и dim=2 по строкам соответственно).

>> A=[5 9 2; 8 4 7; 12 4 1]

S=mean(A)

A =

5 9 2

8 4 7

12 4 1

S =

8.3333 5.6667 3.33338

- median (A) — возвращает медиану, если А — вектор; или вектор-строку медиан для каждого столбца, если А — матрица.

- median(A,dim) — возвращает значения медиан для столбцов или строк матрицы в зависимости от значения скаляра dim.

Пример:

>> a=[5 9 2; 8 4 7; 12 4 1]

Me=median(a)

Me=median(a,2)

a =

5 9 2

8 4 7

12 4 1

Me =

8 4 2

Me =

5

7

4

- std(X) — возвращает стандартное отклонение элементов массива, если X — вектор. Если X — матрица, то std(X) возвращает вектор-строку, содержащую стандартное отклонение элементов каждого столбца (обратите внимание, что оно отличается от среднеквадратического отклонения).

- std(X.flag) — возвращает то же значение, что и std(X), если flag=0; если flag=l, функция std(X.l) возвращает среднеквадратическое отклонение (квадратный корень из несмещенной дисперсии).

- std(X.flag.dim) — возвращает стандартное или среднеквадратическое отклонения по рядам (dim=2) или по столбцам(dim=1) матрицы X в зависимости от значения переменной dim.

>> a=[5 9 2; 8 4 7; 12 4 1]

SO= std(a)

a =

5 9 2

8 4 7

12 4 1

SO =

3.5119 2.8868 3.2146

- sort (А) — в случае одномерного массива А сортирует и возвращает элементы по возрастанию их значений; в случае двумерного массива происходит сортировка и возврат элементов каждого столбца. Допустимы вещественные, комплексные и строковые элементы. Если А принимает комплексные значения, то элементы сначала сортируются по абсолютному значению, а затем, если абсолютные значения равны, по аргументу. Если А включает NaN-элементы, sort помещает их в конец.

- [В, INDEX] = sort(A) — наряду с отсортированным массивом возвращает массив индексов INDEX. Он имеет размер size(A), с помощью этого массива можно восстановить структуру исходного массива.

>> A=magic(4)

[B,INDEX]=sort(A)

A =

16 2 3 13

5 11 10 8

9 7 6 12

4 14 15 1

B =

4 2 3 1

5 7 6 8

9 11 10 12

16 14 15 13

INDEX =

4 1 1 4

2 3 3 2

3 2 2 3

1 4 4 1

- sort(A,dim) — для матриц сортирует элементы по столбцам (dim=l) или по рядам в зависимости от значения переменной dim.

- sortrows(A) — выполняет сортировку рядов массива А по возрастанию и возвращает отсортированный массив, который может быть или матрицей, или вектором-столбцом.

- sortrows(A,column) — возвращает матрицу, отсортированную по столбцам, точно указанным в векторе column. Например, sortrows(A,[2 3]) сортирует строки матрицы А сначала по второму столбцу, и затем, если его элементы равны, по третьему.

- [В, index] = sortrows (А) — также возвращает вектор индексов index. Если А — вектор-столбец, то B=A(index). Если А — матрица размера m*n, то B=A(index.:).

- cplxpair(A.[],dim) — сортирует матрицу А по строкам или по столбцам в зависимости от значения параметра dim.

 


Выполнение работы

В процессе выполнения индивидуального задания необходимо:

1. С учетом предметной области (например, оптовые продажи), отраженной в индивидуальном варианте, сформировать три массива данных .

2. В том случае, если достоверные и актуальные данные не удалось по каким-либо причинам найти в открытых источниках информации, то элементы массивов формируются при помощи генераторов случайных чисел. При этом параметры генерации элементов массивов выбираются исходя из привязки к реальной предметной области (интервал генерации элементов, размерность элементов, целочисленные/рациональные, количество элементов массивов (не менее 15) и так далее).

3. Данные, содержащиеся в массивах, отражают информацию о деятельности отдельно взятых единиц предметной области (например, данные о продажах по месяцам для трех менеджеров).

4. Требуется провести первичную статистическую обработку данных посредством определения мер центральной тенденции и разброса, а также провести анализ полученных значений мер и обосновать выбор наилучшей семантической единицы, соответствующей одному из массивов .

Варианты:

1. Анализ деятельности менеджеров по розничным продажам.

2. Анализ сотрудников университета по количеству подготовленных кандидатов наук.

3. Анализ деятельности маркетологов предприятия.

4. Анализ деятельности web-разработчиков по данным ежемесячной конверсии сайта.

5. Анализ научной квалификации сотрудников по числу опубликованный статей.

6. Анализ деятельности менеджеров по продажам за год.

7. Анализ доходов населения в различных регионах.

8. Анализ результативности спортсменов.

9. Анализ успеваемости студентов за весь период обучения.

10. Анализ эффективности работы производственных предприятий региона.

11. Анализ эффективности работы государственных служащих.

12. Анализ эффективности аграрных предприятий региона.

13. Анализ деятельности туроператоров.

14. Анализ деятельности менеджеров оптовых продаж.

15. Анализ эффективности программистов отдела.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-04-29 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: