Изменялась ли урожайность?




Но дисперсионный анализ может применяться также и для выяснения влияния двух, трех, четырех и вообще любого количества факторов. Однако возникающие при увеличении числа факторов трудности интерпретации результатов и необходимость громоздкой вычислитель­ной работы (в случае отсутствия ЭВМ) ставят предел усложнению задач. Практика показывает, что резуль­таты дисперсионного анализа трехфакторного комплекса


еще возможно интерпретировать. Модели же с большим числом факторов целесообразно разложить на несколько менее сложных комплексов и анализировать каждый в отдельности.

Рассмотрим особенности дисперсионного анализа двух-факторного комплекса на примере изучения данных по истории урожаев в России. Историками собран значи­тельный материал по истории урожаев в России XVII — XVIII вв., характеризующий динамику урожаев по де­сятилетиям и полстолетиям по районам и отдельным хле­бам.1 В суммарном виде эти данные приведены в табл. 30.

Из этих данных следует, что в течение 150 лет наблюдалось общее повышение урожайности в России, имелись существенные различия в динамике урожай­ности в отдельных районах и по отдельным хлебам. От­сюда можно сделать вывод, что урожайность зависела от трех факторов: района, вида хлебной культуры и вре­мени. За фактором «район» стояли различия в почвенно-климатических и социально-экономических условиях в от­дельных местностях России, а за фактором «вид хлеб­ной культуры» — биологические особенности той или иной культуры, а также специфика ее агротехники. Под фактором «время» имеется в виду прогресс агротехники, вовлечение в хозяйственный оборот целинных земель и некоторые другие социально-экономические условия, которые действовали на урожаи как бы автоматически, с течением времени.

Однако полученный вывод уязвим, ибо не учитывает весьма существенного обстоятельства, а именно того, что установленные из приведенных данных различия урожая по районам, полстолетиям и культурам могут быть ре­зультатом случайности или ошибок выборочных сред­них, и тогда они вовсе не обусловливаются указанными социально-экономическими факторами. Вывод о влия­нии района, культуры и времени на урожайность явля­ется, таким образом, гипотезой, которую следует прове­рить. Перед историком встает вопрос: случайна ли динамика урожаев, или она причинно обусловлена райо-

1 Индова Е. И. Урожаи в Центральной России за 150 лет (вторая половина XVII—XVIII в.). — В кн.: Ежегодник по аграрной истории Восточной Европы. 1965 г. Мм 1970.


12*



ТАБЛИЦА 30 Урожаи хлебов в Центральной России по второй половине XVII—XVIII в.

 

Район Вторая половина XVII в. Первая половина XVIII в. Вторая половина XVII в. Всего
          [                      
Центрально-Про­мышленный.. Центра л ьно-Ч ер-ноземный... Северо-Западный Северный.... Поволжье.... 33 23 32 47 3.3 3.8 3.1 3.2 4.1 3.1 3.9 3.5 3.0 4.0 3.2 3.8 3.1 4.9 3.7 62 53 54 59 3.3 4.1 3.1 3.3 3.8 2.9 4.4 3.1 3.3 3.5 3.9 4.5 3.3 3.2 3.7 87 74 61 75 3.2 4.6 3.0 3.8 3.9 3.1 5.2 3.0 3.7 4.0 3.1 4.6 3.1 3.9 4.0 182 150 147 3.4 4.2 3.1 3.6 4.0 3.0 4.5 3.2 3.5 4.0 3.4 4.3 3.2 4.0 3.8
Россия в целом   3.5 3.4 3.7   3.5 3.5 3.8   3.8 4.0 3.8   3.6 3.6 3.8

Примечание. 1 — количество данных; 2 — урожай ржи; 3—урожай овса; 4 — средний урожай по всем хлебам. Приве­денные в таблице данные составляют средний урожай в «самах».


ном, культурой и временем? Ответить на этот вопрос поможет дисперсионный анализ.

Для облегчения счетной работы решение задачи рас­членим на два этапа. На первом этапе выясним степень зависимости динамики урожайности от района и времени. С этой целью сгруппируем данные по районам и полсто­летиям. На втором этапе выясним зависимость урожая от вида культуры и времени. Для этого сгруппируем те же данные по культурам и десятилетиям. В резуль­тате анализа будет получен ответ на вопрос: влияли ли время в десятилетних и полстолетних интервалах, район и вид культуры на динамику урожая в России XVII — XVIII вв.

Прежде чем переходить к анализу данных об урожае, необходимо сделать одну оговорку. Дело в том, что при оценке воздействия на урожай двух факторов неиз­бежно возникает необходимость учесть влияние и треть­его фактора — взаимодействия между двумя учтенными факторами, между районом и временем, с одной стороны, и культурой и временем — с другой. О каком взаимодей­ствии факторов идет речь?

Историки знают, что прогресс агротехники в разных районах был неодинаковым: большим в нечерноземных районах, меньшим — в черноземных. Известно также, что в каждом из районов к середине XVII в. размеры фонда целинных земель существенно отличались, следо­вательно, возможности для роста урожайности в каждом районе за счет вовлечения в оборот новых земель не были равными. Кроме того, уже в XVII в. существовала спе­циализация районов на производстве того или иного вида хлеба: на Севере производили больше ржи и овса, на Юге — ячменя и пшеницы. Специализация тоже могла повлиять на динамику урожайности в отдельных рай­онах. Таким образом, комбинация, или взаимодействие, трех факторов — района, культуры и времени — могла оказывать существенное влияние на динамику урожай­ности, и ее необходимо учитывать. Многофакторный дисперсионный анализ как раз и позволяет выяснить не только степень влияния отдельных факторов, но и влияние их взаимодействия. В этом и заключается то но­вое, что он дает. В остальном анализы двухфакторного и однофакторного комплексов принципиально не разли­чаются.


Существует несколько способов проведения дисперси­онного анализа двухфакторного комплекса. Будучи прин­ципиально схожими, они имеют каждый свои недостатки и преимущества. Знакомясь с техникой проведения дис­персионного анализа (это в равной мере относится и к другим видам анализа: корреляционному, регрессион­ному и т. д.), необходимо принять во внимание, что для облегчения счетной работы в процесс вычислений вво­дится ряд промежуточных этапов, первоначальные фор­мулы упрощаются и видоизменяются, составляются до­полнительные таблицы. В результате неискушенному исследователю бывает трудно разобраться в обилии фор­мул, обозначений и даже инигда может показаться, что основополагающие принципы дисперсионного анализа «забыты». Чтобы этого не случилось, нужно хорошо знать основные этапы дисперсионного анализа: 1) под­счет суммы квадратов отклонений межгрупповой и внутри-групповой вариации; 2) подсчет степеней свободы; 3) вы­числения дисперсий и их отношений; 4) сравнение факти­ческих и теоретических отношений. Знание основных этапов и логики дисперсионного анализа и будет служить путеводной нитью, которая поможет историку разоб-браться в технике расчетов.

Как мы условились, выясним сначала с помощью дисперсионного анализа значение района и времени для динамики урожайности ржи. Исходные данные для про­ведения дисперсионного анализа приведены в табл. 30.

ТАБЛИЦА 31 Анализ дисперсий

 

 

  Сумма квадратов отклоне­ний Степе­ни сво­боды Дисперсия Отношение дисперсий
Источник вариации -^факт. -Р'теор.
Их взаимодействие Районы и время вместе Остаточная вариация 2.87 0.29 1.20 4.36 34.26   0.718 0.145 0.150 0.310 0.142 5.06 1.02 1.06 База ср 2.42 3.03 1.97 ►авнения
  38.62  

Результаты дисперсионного анализа этих данных см. в табл. 31.

Таким же образом был проведен дисперсионный ана­лиз влияния района и времени на динамику урожая овса, ячменя и пшеницы. Анализ дал те же результаты: урожай­ность зависела только от района.

Второй этап анализа данных об урожайности за XVII — XVIII вв., как уже указывалось, состоял в выяснении влияния вида культуры и времени в десятилетних ин­тервалах на урожайность хлебов. Дисперсионному ана­лизу подвергались данные за вторую половину XVII и XVIII в. (табл. 32).

ТАБЛИЦА 32 Анализ дисперсий

 

 

  Сумма квадратов отклоне­ний Степе­ни спо-боды Дисперсия Отношение дисперсий
Источник вариации ■^факт. ■^теор.
Культуры хлебов.. Десятилетия.... Их взаимодействие. Культуры и десятиле­тия вместе.... Остаточная вариация 1.20 0.85 1.74 3.79 52.21 12 307 0.40 0.21 0.15 0.32 0.17 2.35 2.63 1.24 2.40 1.13 1.81 База сравнения
  56.00  

Аналогичные результаты получились при дисперси­онном анализе данных об урожае по отдельным культу­рам за 1651—1700 и 1751—1800 гг.

Какие выводы позволяет сделать дисперсионный ана­лиз имеющихся данных по истории урожаев в XVII— XVIII вв.? Динамика урожайности хлебов в XVII—XVIII вв. зависела только от района, но не зависела от времени, от вида хлебов и от взаимодействия района и времени, вида хлебов и времени, вида хлебов и района, поскольку фактическое отношение дисперсий превышало теорети­ческое только при оценке зависимости урожая от района. Это означает, что предполагаемая тенденция к повыше­нию урожайности хлебов, которая как будто просматри-


валась из первоначальных статистических данных (см. табл. 30), является результатом случайности, особен­ностей выборочных данных, не обусловлена социально-экономическими факторами.

Дисперсионный анализ позволяет также сделать вы­вод: имеющиеся в распоряжении историков данные об уро­жайности не дают оснований считать, что уровни и дина­мика урожая сколько-нибудь существенно зависели от хлебных культур. По-видимому, различия в уровнях урожайности между отдельными культурами по 10-летиям и 50-летиям тоже являются результатом случайности и недостатка выявленных данных об урожае, а не обуслов­лены социально-экономическими факторами и биологи­ческими особенностями хлебных культур.

Несущественной оказалась зависимость урожайности и от комбинации факторов. Это свидетельствует о том, что сочетания факторов, вероятно, не имели еще в XVII — XVIII вв. заметных различий между районами и эти раз­личия не изменялись существенно от десятилетия к десяти­летию и от периода к периоду, а потому не оказывали ощутимого влияния на уровень и динамику урожайности.

Что касается различия в уровне и динамике урожаев между отдельными районами, то дисперсионный анализ подтверждает гипотезу, выдвинутую на основе первич­ной обработки данных об урожаях: различия в уровне и динамике урожаев между районами — результат законо­мерный, обусловленный географическими и социально-экономическими особенностями районов. Какие именно особенности вызвали вариацию урожайности между рай­онами, показывает конкретно-исторический анализ. Раз­личия в плодородии почвы, в системе агротехники, в фор­мах феодальной эксплуатации, в количестве лесов и сте­пени распаханности фонда земель — вот что обусловило разницу в уровнях и динамике урожайности между рай­онами. Собрав соответствующие статистические данные об этих факторах, можно вновь провести дисперсионный анализ, который оценит их влияние.

Таким образом, дисперсионный анализ выявленных историками данных об урожае ржи, овса, пшеницы и ячменя в России XVII—XVIII вв. дает основания по­лагать, что не было закономерных различий в уровне и динамике урожайности по отдельным культурам и в из­менении урожайности во времени, но существовала за-


висимость уровня и динамики урожайности от района. Ту тенденцию к росту урожайности, которую обнаружи­вают первичные данные, следует считать результатом случайности и неполноты выборочных данных. При боль­шем количестве сведений об урожае тенденция может «исчезнуть». Из этого не следует, что собранные истори­ками данные неверны — их просто недостаточно, чтобы сделать обоснованный вывод о росте урожая.

Следует подчеркнуть, что дисперсионный анализ не может заменить отсутствующих данных, он позволяет лишь критически оценивать добытые историками данные. Проведенный анализ дает право сказать, что имеющиеся сведения об урожае не являются основанием для вывода о тенденции урожая хлебов к росту. При строгом под­ходе к подобным сведениям они свидетельствуют лишь о том, что урожаи сильно колебались во времени, имея тенденцию к устойчивости, что никакого прогресса урожайности за 150 лет достигнуто не было. Возможно, что дополнительные сведения об урожае XVII—XVIII вв. заставят пересмотреть данный вывод. Однако на совре­менном этапе знаний вывод об устойчивости урожайности представляется наиболее реалистическим.

В применении дисперсионного анализа имеются некото­рые условия, с которыми вынужден считаться исследо­ватель.

1. Метод применим к анализу выборочных данных, взятых из совокупности, имеющей нормальное распре­деление или распределение, близкое к нормальному. От-дельные наблюдения, или данные, в выборке не связаны и не зависимы друг от друга.

2. Природа, или источник, изменчивости зависимой переменной во всех группах и подгруппах одна и та же.

3. Суммарное воздействие отдельных факторов на зависимую переменную получается в результате сложе­ния, а не умножения влияния отдельных факторов.

4. Численность данных по отдельным признакам (рай­онам, культурам, периодам и т. д.) либо равна, либо пропорциональна.

Нарушение указанных условий не исключает примене­ния дисперсионного анализа. Но оценки влияния фак­торов при этом менее точны, а общие выводы менее надежны. Поэтому прежде чем приступать к дисперсионному ана­лизу, полезно предварительно выяснить, насколько вы-


полняются перечисленные условия. В примере с исто­рией урожайности условия в основном выполнялись. Распределение имений по уровню урожайности в целом по России подчиняется нормальному закону распределе­ния, поскольку большая часть имений — 60—70% — имеет среднюю урожайность, остальные примерно в рав­ной пропорции составляют две группы имений — с вы­сокой и низкой урожайностью. Урожаи в отдельных имениях не зависимы друг от друга, так как не оказы­вают друг на друга влияния.

Природа, или источник, колебаний урожайности в отдельных имениях одна: социально-экономические, географические особенности имений и деловые качества их владельцев.

Суммарный эффект от воздействия отдельных факто­ров на урожайность получается в результате сложения их влияний. Это видно из того, что средние урожаи по от­дельным районам отличаются друг от друга не очень сильно, так как различия средних находятся в пределах 10096. Практика же дисперсионного анализа показы­вает, что если общий эффект влияния факторов получа­ется в результате умножения их отдельных значений, то величины групповых средних должны очень сильно — в несколько раз — отличаться друг от друга.

Наконец, численность групп и подгрупп урожайных данных по районам и периодам пропорциональна (см. табл. 30). За каждый из трех периодов: во второй поло­вине XVII в., в первой и второй половинах XVIII в. от­носительная численность данных — процент или доля сведений по району в общем количестве данных по Рос­сии — была примерно одинаковой вследствие того, что увеличение количества данных от десятилетия к десяти­летию во всех районах проходило в общем равномерно.

Рассмотренные примеры дисперсионного анализа со всей очевидностью раскрывают достоинства метода. Отметим прежде всего логическую и техническую простоту дисперсионного анализа и его универсальность. Метод одинаково применим к анализу и качественных, и коли­чественных признаков. Однако дисперсионный анализ особенно полезен при исследовании влияния факторов, имеющих качественное выражение. С подобными факто­рами большей частью имеет дело ученый, изучающий соци­альную, политическую и культурную историю. В силу


этого дисперсионный анализ следует рассматривать как очень важное орудие анализа в истории, использование которого может дать богатые плоды.

Например, изучение исторического явления во времени и пространстве, или в географии, является неотъемлемой частью всякого исторического исследования, поскольку раскрытие эволюции явлений и процессов именно во вре­мени и пространстве составляет его цель. Но в истории пространство и время чаще всего выступают как ка­чественные характеристики, не имеющие количествен­ной определенности, поскольку историк оперирует пре­имущественно периодами, этапами, эпохами, а не часами, минутами и секундами; губерниями, провинциями, рай­онами, странами, а не градусами широты и долготы. Применение дисперсионного анализа как раз и позволит оценить влияние времени и пространства на изучаемое историческое явление и тем самым ответить на вопрос, закономерны или случайны изменения, наблюдаемые ис­ториком по сохранившимся от прошлого сведениям. Благо­даря этому становится возможным с высокой точностью определить, имелась ли закономерная тенденция в эволю­ции данного явления в пространстве и времени. Это только одно из множества приложений дисперсионного анализа в историческом исследовании.

Ч» Ч* Ч*

В заключение хочется подчеркнуть, что эта книга дает возможность читателю ознакомиться с некоторыми наи­более известными математическими методами, применяе­мыми в историческом исследовании, разобраться в их смысле и логике и в значении для истории. Дальнейшее освоение этих методов возможно при самостоятельной работе, причем не столько с учебниками математики и статистики, сколько с конкретным историческим матери­алом, для анализа которого используются математичес­кие методы. Это нелегко, но чрезвычайно интересно и плодотворно и вполне посильно для любого историка. В применении математических методов в истории много нового, неизведанного, поскольку это одна из новых, молодых областей исторической науки. И для каждого, кто пожелает здесь приложить свои силы, открывается широкое поле деятельности.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-04-12 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: