Кафедра минералогии и геохимии
Контрольная работа по курсу
«Математические методы моделирования в геологии»
Вариант № 11
Преподаватель
Е.М. Асочакова
__________ подпись
«_____»__________2018 г.
Студент ОЗО группа 02380
Д.В. Целовальников
___________ подпись
Томск 2018
Содержание
Введение. 3
1. Статистические характеристики, используемые в геологии. 6
2. Закон распределения данных. 10
3. Корреляционный анализ. 13
4. Регрессионный анализ. 16
5. Кластерный анализ. 20
6. Факторный анализ. 24
Заключение. 29
Список использованных источников. 30
Введение
На современном этапе развития естественных наук, под влиянием научно-технического прогресса происходят существенные изменения методов научных экспериментов, анализа и обобщения получаемых результатов. Этому способствуют не только расширившиеся возможности фундаментальных наук, но также бурное развитие электронно-вычислительной техники и комплексной автоматизации самых разнообразных видов человеческой деятельности. В последние десятилетия наблюдается глубокое проникновение математических методов исследования во все отрасли естественных наук, что способствовало исключительным успехам некоторых из них, например биологии, метеорологии и др. Для успешного развития геологических наук необходимо также использовать полный арсенал существующих прогрессивных научных и технических средств, включая математические методы.
Основная цель данной работы выяснить и понять распределение полезных компонентов в пределах Восточного Забайкалья, по данным полученным в результате опробования и проведения рентгенофлуоресцентного анализа проб.
Для достижения поставленной цели решались следующие задачи:
1. научиться применять математические методы для обработки геологической информации;
2. научиться формулировать геологические задачи в пригодном виде для их решения математическими методами;
3. научится применять наиболее эффективные методы;
4. понять основные принципы геолого-математического моделирования;
5. установить возможность применения геолого-математического моделирования для данного участка.
Таблица №1 Исходные данные: «Результаты рентгенофлуоресцентного анализа пород Восточное Забайкалье, в %»
№пп | Порода | №пробы | SiO2 | TiO2 | Al2O3 | Fe2O3 | MnO | MgO | CaO | Na2O | K2O | P2O5 | ППП | Сумма |
Гранит | HC 101/38 | 80,54 | 0,13 | 10,2 | 2,14 | 0,02 | 0,47 | 0,41 | 2,86 | 3,46 | 0,03 | 0,08 | 100,35 | |
Гранит | HC 102/229 | 63,07 | 0,66 | 17,42 | 4,49 | 0,09 | 1,7 | 2,96 | 3,1 | 3,68 | 0,13 | 1,9 | 99,2 | |
Гранит | HC 101/45 | 66,34 | 0,6 | 18,6 | 3,89 | 0,04 | 1,44 | 0,57 | 1,28 | 3,34 | 0,14 | 2,48 | 98,72 | |
Гранит | HC 101/99 | 66,59 | 0,61 | 16,86 | 3,93 | 0,06 | 1,74 | 0,83 | 4,63 | 2,59 | 0,15 | 2,03 | 100,03 | |
Гранит | HC 106/110 | 69,53 | 0,35 | 14,17 | 2,73 | 0,1 | 0,8 | 3,04 | 2,33 | 4,16 | 0,07 | 2,1 | 99,39 | |
Гранит | HC 101/93 | 75,84 | 0,11 | 13,32 | 1,32 | 0,02 | 0,06 | 0,3 | 2,61 | 6,12 | 0,03 | 0,33 | 100,04 | |
Гранит | 76,28 | 0,16 | 12,93 | 1,64 | 0,05 | 0,42 | 0,27 | 2,95 | 4,5 | 0,05 | 0,68 | 99,84 | ||
Гранит | 40-34 | 72,06 | 0,23 | 14,96 | 2,15 | 0,05 | 0,85 | 0,5 | 2,32 | 5,64 | 0,05 | 0,85 | 99,55 | |
Гранит | k-55-114.0 | 72,95 | 0,15 | 15,1 | 1,96 | 0,06 | 0,61 | 0,31 | 5,39 | 1,72 | 0,05 | 1,23 | 99,46 | |
Гранит | 74,79 | 0,39 | 14,19 | 2,97 | 0,05 | 0,4 | 0,43 | 1,57 | 3,68 | 0,07 | 1,65 | 100,14 | ||
Гранит | 72,9 | 0,08 | 1,39 | 0,08 | 0,05 | 2,49 | 1,4 | 5,58 | 0,05 | 2,33 | 99,25 | |||
Гранит | 40-62 | 0,34 | 13,35 | 2,87 | 0,05 | 0,84 | 0,47 | 1,65 | 2,71 | 0,08 | 1,78 | 100,08 | ||
Гранит | Бл-7 | 75,815 | 0,273 | 12,483 | 1,531 | 0,011 | 1,596 | 1,205 | 1,842 | 4,483 | 0,042 | 0,47 | 99,75 | |
Гранит | Бл-5 | 72,667 | 0,248 | 16,303 | 1,461 | 0,039 | 1,789 | 1,566 | 1,169 | 4,154 | 0,01 | 0,56 | 99,96 | |
Гранит | Бл-3 | 75,611 | 0,01 | 12,899 | 0,64 | 0,001 | 1,229 | 0,57 | 1,759 | 6,97 | 0,01 | 0,17 | 99,85 | |
Гранит | Бл-2 | 73,238 | 0,38 | 13,625 | 1,944 | 0,026 | 1,758 | 1,247 | 1,224 | 5,375 | 0,189 | 0,62 | 99,62 | |
Гранит | Бл-20 | 74,984 | 0,093 | 14,837 | 0,1 | 0,012 | 0,076 | 0,388 | 2,759 | 5,75 | 0,01 | 0,32 | 99,22 | |
Гранит | Бл-19 | 75,126 | 0,281 | 13,336 | 0,343 | 0,011 | 0,066 | 0,326 | 3,908 | 6,085 | 0,01 | 0,22 | 99,7 | |
Гранит | Бл-18 | 76,761 | 0,039 | 13,149 | 0,1 | 0,001 | 0,068 | 0,31 | 3,102 | 6,208 | 0,01 | 0,05 | 99,69 | |
Гранит | Бл-17 | 78,062 | 0,131 | 13,082 | 0,1 | 0,01 | 0,06 | 0,409 | 3,039 | 4,677 | 0,01 | 0,1 | 99,57 | |
Гранит | Бл-16 | 74,839 | 0,326 | 14,187 | 0,607 | 0,031 | 0,069 | 0,369 | 2,749 | 5,908 | 0,047 | 0,12 | 99,25 | |
Гранит | Бл-15 | 73,64 | 0,363 | 14,119 | 0,73 | 0,02 | 0,086 | 0,375 | 2,907 | 6,351 | 0,056 | 0,22 | 98,87 | |
Гранит | Бл-14 | 74,983 | 0,366 | 14,117 | 0,149 | 0,018 | 0,094 | 0,436 | 2,734 | 5,462 | 0,076 | 0,22 | 98,66 | |
Гранит | Бл-13 | 76,317 | 0,213 | 12,996 | 0,477 | 0,057 | 0,076 | 0,361 | 3,308 | 5,42 | 0,081 | 99,31 | ||
Гранит | Бл-12 | 73,611 | 0,401 | 14,263 | 0,212 | 0,019 | 0,085 | 0,372 | 3,638 | 6,158 | 0,099 | 0,29 | 99,15 | |
Гранит | Бл-11 | 67,497 | 0,855 | 15,217 | 3,04 | 0,045 | 0,114 | 0,649 | 3,707 | 5,291 | 0,239 | 0,34 | 96,99 | |
Гранит | Бл-10 | 76,391 | 0,454 | 13,824 | 0,1 | 0,024 | 0,063 | 0,499 | 3,154 | 4,527 | 0,058 | 0,2 | 99,19 | |
Гранит | Бл-8 | 77,413 | 0,228 | 12,927 | 0,53 | 0,007 | 0,06 | 0,286 | 1,381 | 6,25 | 0,01 | 0,37 | 99,46 | |
Гранит | Бл-22 | 77,91 | 0,077 | 12,796 | 0,1 | 0,006 | 0,077 | 0,293 | 2,134 | 5,86 | 0,01 | 0,25 | 99,4 | |
Гранит | Бл-23 | 75,766 | 0,303 | 13,162 | 0,838 | 0,027 | 0,078 | 0,341 | 2,23 | 5,942 | 0,074 | 0,27 | 99,03 |
Статистические характеристики, используемые в геологии
Минимальное значение – наименьшее возможное значение.
Максимальное значение – наибольшее возможное значение.
Среднее значение - статистический обобщенный показатель какой либо величины.
Среднее арифметическое - (в математике и статистике) множества чисел — число, равное сумме всех чисел множества, делённая на их количество.
Среднее арифметическое взвешенное - общее название группы разновидностей среднего значения либо короткое название для любого из перечисленных: Среднее арифметическое взвешенное Среднее геометрическое взвешенное Среднее гармоническое взвешенное.
Среднее арифметическое взвешенное набора чисел x1……xn с весами ω1……ωn определяется как:
Средним геометрическим нескольких положительных вещественных чисел называется такое число, которым можно заменить каждое из этих чисел так, чтобы их произведение не изменилось.
Среднее степенное – любое число отличительное от нуля.
Среднее степени d (или просто среднее степенное) набора положительных вещественных чисел x1,…,xn определяется как:
Среднее квадратическое – число S, равное квадратному корню среднего арифметического квадратов данных чисел a1,a2,…,an:
Среднее гармоническое – один из способов, которым можно понимать «среднюю» величину некоторого набора чисел. Его можно определить следующим образом: пусть даны положительные числа x1,…xn, тогда их средним гармоническим будет такое число H, что
Можно получить явную формулу для среднего гармонического:
т.е. срежнее гармоническое есть обратная величина к среднему от обратных к числам x1,…,xn.
Медиана – середина, в математической статистике – число, характеризующее выборку (например набор чисел). Если все элементы выборки различны, то медиана — это такое число выборки, что ровно половина из элементов выборки больше него, а другая половина меньше него. В более общем случае медиану можно найти, упорядочив элементы выборки по возрастанию или убыванию и взяв средний элемент. Например, выборка {11, 9, 3, 5, 5} после упорядочивания превращается в {3, 5, 5, 9, 11} и её медианой является число 5. Если в выборке чётное число элементов, медиана может быть не определена однозначно: для числовых данных чаще всего используют полусумму двух соседних значений (то есть медиану набора {1, 3, 5, 7} принимают равной 4).
Мо́да - значение во множестве наблюдений, которое встречается наиболее часто. (Мода = типичность.) Иногда в совокупности встречается более чем одна мода (например: 6, 2, 6, 6, 8, 9, 9, 9, 0; мода — 6 и 9). В этом случае можно сказать, что совокупность мультимодальна. Из структурных средних величин только мода обладает таким уникальным свойством. Как правило, мультимодальность указывает на то, что набор данных не подчиняется нормальному распределению.
Квартили - предоставляют важную информацию о структуре вариационного ряда к-л признака. Вместе с медианой они делят вариационный ряд на 4 равные части. Квартилей две, их обозначают символами Q, верхняя и нижняя квартиль. 25% значений меньше, чем нижняя квартиль, 75% значений меньше, чем верхняя квартиль.
Для расчёта квартили надо поделить вариационный ряд медианой на две равные части, а затем в каждой из них найти медиану. К примеру, если выборка состоит из 6 элементов, тогда за начальную квартиль выборки принимается второй элемент, а за нижнюю квартиль пятый элемент.
Рисунок 1 - Квартили
В случае, если вариационный ряд состоит к примеру, из 9 элементов, тогда за верхнюю квартиль принимают арифм. среднее 2-го и 3-го элеметов, а за нижнюю арифм. среднее 7-го и 8-го элементов.
Децили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 10% единиц совокупности будут меньше по величине D1; 80% будут заключены между D1 и D9; остальные 10% превосходят D9.
Квантили – значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Если вероятность задана в процентах, то квантиль называется перцентилем. Например, для развитых стран 95-процентиль продолжительности жизни составляет 100 лет, означает, что ожидается, что 95% людей не доживут до 100 лет.
Дисперсия – мера разброса значений случайной величины относительно ее математического ожидания. Обозначается D[X] в русской литературе и Var(X) в зарубежной. В статистике часто употребляется значение σ2x или σ2.
Среднеквадрати́ческое отклоне́ние (синонимы: среднее квадрати́ческое отклоне́ние, среднеквадрати́чное отклоне́ние, квадрати́чное отклоне́ние; близкие термины: станда́ртное отклоне́ние, станда́ртный разбро́с) — в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания. При ограниченных массивах выборок значений вместо математического ожидания используется среднее арифметическое совокупности выборок (измерений), это среднее арифметическое называют оценкой математического ожидания.
Коэффициент вариации - Мера относительного разброса случайной величины; показывает, какую долю среднего значения этой величины составляет её средний разброс.
Коэффициент вариации равен отношению стандартного отклонения к среднему значению:
Коэффициент вариации имеет смысл использовать при ненулевых средних значениях.
Коэффициент полезен в ситуациях, когда о размерах отклонения величины можно судить, зная ее среднее значение.
Иногда предлагается условная классификация вариабельности выборки на основе коэффициента вариации: при выборка вариабельна слабо, при - средне, при - сильно.
Асимметрия представляет собой числовое отображение степени отклонения графика распределения показателей от симметричного графика распределения. Если асимметрия больше 0, то чаще в распределении встречаются значения меньше среднего. Такая асимметрия называется положительной или левосторонней.
Коэффициент эксцесса - (коэффициент островершинности) в теории вероятностей — мера остроты пика распределения случайной величины.
Пусть задана случайная величина X, такая что E│X│4<∞. Пусть µ4 обозначает четвертый центральный момент: µ4 = E [(X – EX)4], а – стандартное отклонение X. Тогда коэффициент эксцесса задается формулой: