Наиболее очевидная характеристика – это среднее положение распределения. Существует несколько видов среднего положения распределения, но только некоторые из них используются на практике.
Рис. Соотношение моды, медианы и среднеарифметического на графике непрерывного распределения случайной величины.
Первая характеристика – это мода. В распределении, приведенном на рисунке, мода соответствует средней точке на оси абсцисс, находящейся под наивысшей точкой кривой частот. Вторая характеристика – это медиана. Медиана соответствует средней точке на оси абсцисс, так перпендикуляр, проведенный через эту точку, делит площадь под кривой пополам, то есть половина площади от этой точки находиться справа, а половина находится слева. Главное свойство медианы заключается в том, что сумма абсолютных отклонений признака от медианы меньше, чем от любой другой величины. И третья самая важная характеристика это точка на оси абсцисс, соответствующая среднеарифметическому значению, которое рассчитывается как сумма всех результатов наблюдений, деленная на их число.
χ=∑xi/n
Основной характеристикой центра распределения является средняя арифметическая, все отклонения от нее (положительные и отрицательные) равны 0, для медианы характерно, что сумма отклонений от нее по модулю является минимальной, а мода представляет значение признака, которое наиболее часто встречается. Соотношение моды, медианы и среднеарифметической позволяет оценить асимметрию распределения. В симметричных распределениях все три характеристики совпадают, чем больше расхождение между модой и среднеарифметической, тем больше асимметрия распределения. Для умеренно асимметричных распределений разность между модой и среднеарифметической в 3 раза превышает разность между медианой и среднеарифметической.
|
Mo– χ=3(Me – χ).
Многие символы традиционно используются для обозначения кривых распределения, обычно для теоретических распределений или распределений совокупностей традиционно используются греческие буквы, а для обозначения характеристик выборок используются латинские буквы. Так среднее выборки обозначают как χ, а теоретическое среднее или среднее всей совокупности обозначают как μ. Статистика, которую мы вычисляем по выборке, используется как оценка истинного параметра совокупности. Среднеарифметическое значение, вычисленное по выборке, имеет два очень важных свойства, которые делают его более полезным для оценки истинного среднего или центрального положения распределения совокупности, чем любая из оставшихся характеристик (медиана или мода). Во-первых, среднеарифметическое выборки, в которой все пункты наблюдения, выбирались случайно, чаще всего является несмещенной оценкой истинного среднего значения совокупности. Во-вторых, для нормального распределения среднеарифметическое значение выборки характеризуется тенденцией лучшего приближения к истинному среднему или к среднему значению совокупности, чем медиана, посчитанная по той же выборке. Однако медиана нередко является лучшей оценкой среднего совокупности, когда мы имеем дело с асимметричными распределениями, когда результаты измерений не подчиняются нормальному распределению. Медиана позволяет в этом случае дать более объективную оценку среднего положения для большей части совокупности (до 99%), но не для 100 % совокупности.
|
Среднеарифметическое значение совокупности μ называют математическим ожиданием. Математическое ожидание определяется как сумма произведений всех возможных значений случайной величины на их вероятности:
μ= ∑xi*pi (pi – вероятности появления значений случайной величины).
В зависимости от характера имеющихся данных среднеарифметическое значение выборочных данных может быть рассчитано по разным формулам и в зависимости от этого она имеет разные названия. Широко используются четыре разновидности среднеарифметического значения.
1. Среднеарифметическое простое, не взвешенное значение, рассчитывается по приведенной уже формуле:
χ=∑xi/n.
2. Среднеарифметическое значение - взвешенное, рассчитывается по формуле:
χ=(x1*L1+x2*L2+x3*L3+…..xi*Li)/(L1+L2+L3…+ Ln) = ∑xi*Li/∑Li.
Среднеарифметическое взвешенное значение возникает в геологической практике, когда берутся пробы, в которых производят измерения компонентов, разной длины. В этом случае подсчет среднего значения без взвешивания на длину пробы, приведет к ошибочному результату, так как не будет сохраняться пропорциональность, поэтому используют для расчета формулу взвешенного значения. Можно рассчитать средневзвешенное значение компонента из данных, приведенных в таблице по формуле.
L – длина пробы | Xi – значение компонента в % |
0.2 | |
2.5 | 0.5 |
1.8 | 0.3 |
χ= (2*0.2+2.5*0.5+1.8*0.3)/(2+2.5+1.8)=0.347
Однако для учета пропорциональности используется и другой подход, часто средние значения и другие статистики рассчитывают после приведения длин проб к одной длине и пересчета содержаний компонентов на эту длину. Этот способ получил название – композитирование (compositing) проб, а такие пробы называют композитными пробами, в этом случае можно говорить о средневзвешенных значениях проб с учетом предварительного композитирования или о средневзвешенном композитном значении изучаемого компонента. В этом случае, если мы хотим композитировать на среднюю длину пробы в 2 метра, то нужно будет пересчитать содержания компонента, как в примере, показанном в, ниже располагающейся таблице.
|
0.2 | |
0.5 | |
(0.5*0.5+1.5*0.3)/2 = 0.35 |
В этом случае в программе Datamine Studio можно для расчета композиционных проб использовать процесс COMPDH. В других случаях композитирование данных опробования может быть взвешено с учетом горных кондиционных показателей - минимальной промышленной мощности рудной залежи и максимальной мощности пустого прослоя включаемого в контур рудной залежи. В этом случае взвешивание будет основано на таком показателе как размер уступа карьера, связанном с производительностью горного предприятия. Например, рудная жила, мощностью в 1 метр с большим содержанием полезного компонента (8) может быть взвешено на размер уступа, например в 15 метров. Если при пересчете на 15 метров, содержание компонента не опустится, ниже требуемого или планируемого минимума, то данные 15 метров будут включены в рудный контур. В другом случае, если содержание полезного компонента опустится ниже планируемого уровня и нерудный прослой по скважине будет больше 15 метров, то этот интервал не войдет в рудный контур.
Пересчет на 15 метровый уступ | (1*8+14*0)/15 = 0.53 |
В этом случае в программе Datamine Studio можно для расчета композиционных интервалов этим способом взвешивания использовать процесс COMPSE.
3. Средняя гармоническая взвешенная величина.
Расчет среднего гармонического взвешенного показателя в геологической практике возникает при эксплуатации залежей полезных ископаемых, когда хотят например определить среднее содержание полезного компонента в недрах по эксплуатационным показателям, например, такая ситуация может возникнуть при добыче россыпного золота драгой.
4. Средняя геометрическая величина.
Средняя геометрическая величина рассчитывается по формуле:
χG = n x1*x2*x3....xn = n Пxi.
И в случае если рассчитывается средняя геометрическая взвешенная величина, то ее определяют по следующей формуле:
χG = ∑m x1m1*x2m2*x3m3....xnmn = ∑m П(xi)mi,
где mi – вес i-го варианта.