В целом полученные результаты указывают на соответствие выявленных кластеров лингвистической, и географической классификациям. В связи с этим остро встает вопрос: какой из факторов является определяющим при формировании генетической структуры Кавказа - географическое соседство или лингвистическое родство?
Для точного количественного ответа на этот вопрос рассчитаны три матрицы попарных расстояний между всеми народами северо-кавказской языковой семьи: матрица генетических расстояний по частотам гаплогрупп Y хромосомы, матрица географических расстояний между изученными народами (в километрах), матрица лингвистических расстояний между северо-кавказскими языками, основанная на доле совпадающих слов между языками (создана член-корр. РАН А.В. Дыбо и проф. О.А. Мудраком). Корреляция между матрицами оценена по тесту Мантеля (Arlequin 3.11). Общая корреляция между генетическими и лингвистическими расстояниями (r=0.64) оказалась несколько выше, чем между генетическими и географическими (r=0.60) (табл. 5.). После вычета тесной связи между лингвистикой и географией (r=0.78), частные корреляции (табл. 5) между генетическими и лингвистическими расстояниями оказываются в полтора раза выше (r=0.34), чем между генетическими и географическими расстояниями (r=0.21).
Таблица 5. Корреляция между матрицами генетических, географических и лингвистических расстояний
Матрицы расстояний | Коэффициент корреляции | P-значение |
Генетика и лингвистика | 0.64 | 0.002 |
Генетика и география | 0.60 | 0.001 |
Генетика и лингвистика - без влияния географии (частный коэффициент корреляции) | 0.34 | 0.120 |
Генетика и география - без влияния лингвистики (частный коэффициент корреляции) | 0.21 | 0.180 |
Этот результат получен впервые. В предшествовавших работах достоверные корреляции либо вообще не удавалось выявить (Nasidze et al., 2004) из-за низкого уровня филогенетического разрешения, либо делался вывод о примате географии над лингвистикой (Кутуев, 2010). Возможно, недооценка лингвистического фактора была вызвана применением качественных «пошаговых» лингвистических расстояний, а не точных количественных показателей сходства языков, как в нашем исследовании.
Таблица 6. Генетическое межпопуляционное разнообразие при лингвистической и географической группировках популяций (AMOVA)
Уровни популяционной структуры | Лингвистические группы* | Географические группы* |
Различия между группами | 0.268 *** | 0.146*** |
Различия между популяциями внутри групп | 0.099 *** | 0.235 *** |
Различия между всеми популяциями | 0.633 *** | 0.619 *** |
Примечания: лингвистическая и географическая группировка популяций приведена в табл. 1;
*** P-значение <0.001
Рис. 4. Сравнение генетической кластеризации (слева) и лингвистической классификации (справа) народов Кавказа
Выявленная тенденция полностью подтверждена и анализом межпопуляционных различий методом AMOVA (табл. 6), позволяющим включить в анализ народы не только северокавказской языковой семьи, но и индоевропейской (осетины). При группировке популяций согласно географической классификации доля межпопуляционной генетической изменчивости составила 15%. При группировке популяций согласно лингвистической классификации, доля межпопуляционной генетической изменчивости выросла почти в два раза (27%), демонстрируя, что именно лингвистическое сходство, а не географическое соседство объясняет основную часть изменчивости Y хромосомы на Кавказе.
Сходство генетической и лингвистической классификаций подтверждается и при сравнении дендрограмм народов Кавказа: за единственным исключением (присоединением даргинцев после аварцев) генетическая дендрограмма (рис. 4, слева) является зеркальным отражением лингвистической классификации северокавказских языков (рис. 4, справа). Таким образом, различные виды анализа указывают, что лингвистическое родство, а не географическое соседство, является ведущим фактором в формировании генетического разнообразия народов Кавказа (по данным о полиморфизме Y хромосомы).
ФИЛОГЕОГРАФИЯ ПРЕОБЛАДАЮЩИХ НА КАВКАЗЕ ГАПЛОГРУППП И ДАТИРОВКИ ПОПУЛЯЦИОННО-СПЕЦИФИЧНЫХ КЛАСТЕРОВ
ГАПЛОТИПОВ
Генотипирование всех 1917 образцов по панели 17 STR маркеров позволило впервые получить обширную информацию не только о частотах гаплогрупп, но и о разнообразии STR гаплотипов в пределах основных гаплогрупп на Кавказе. При этом виде анализа каждая гаплогруппа перестает быть единицей наблюдения и подразделяется на множество составляющих ее гаплотипов, причем для каждого из них может быть установлена не только его частота, но и вероятное родство с другими гаплотипами, а при выявлении кластеров родственных гаплотипов можно датировать время их возникновения. Это многократно увеличивает как объем данных, так и информативность их анализа. Поэтому филогеографический анализ всех гаплогрупп, наиболее характерных для коренного населения Кавказа, проведен параллельно двумя методами: для каждой гаплогруппы построена и карта ее распространения (рис. 5), и филогенетическая сеть составляющих ее гаплотипов.
Карта распространения наиболее характерной для населения Кавказа гаплогруппы G -P18 (рис. 5) показывает что в других регионах она крайне редка, а среди народов Кавказа наиболее часто встречается среди ираноязычных осетин, причем во всех популяциях. На филогенетической сети этой гаплогруппы (рис. 6) четко выделяется кластер альфа, характерный для осетин-иронцев (возраст около 1400 лет). Кластер бета такого же возраста, но состоит из осетин-дигорцев. Можно предполагать, что осетины-иронцы и осетины-дигорцы некогда были единой популяцией, а около 1400 лет назад разделились на два субэтноса: если бы эти кластеры возникли еще до разделения субэтносов, то в обоих кластерах поровну встречались бы и иронцы, и дигорцы. По лингвистическим датировкам разделение двух диалектов - иронцев и дигорцев - произошло 1300 лет назад. По данным историков разделение на иронцев и дигорцев произошло не позднее 8 века нашей эры, т.е. тоже 1300 лет назад. Таким образом, мы обнаруживаем совпадение генетических, лингвистических и исторических датировок.
Созданные нами филогенетические сети для гаплогрупп G2a* -P15, G2a3b1 -P303, J2a4b* -M67(xM92), J1* -M267(xP58), R1a1a7 -M458, R1a*- M198(xM458), R1b1b2 -M269, J2* -M172, Q -M242 и L* -M20, так же как и рассмотренная выше сеть для гаплогруппы G -P18, демонстрируют важную особенность изменчивости Y хромосомы на Кавказе: каждая гаплогруппа включает несколько четких, обособленных друг от друга кластеров гаплотипов, причем ногие из этих кластеров оказываются приуроченными к конкретным этносам или субэтносам, но отсутствуют в других популяциях. Это явление этнической специфичности кластеров чрезвычайно широко распространено на Кавказе: нами обнаружено несколько десятков таких кластеров для разных гаплогрупп.
Обилие популяционно-специфичных кластеров позволяет использовать их для датирования истории кавказских популяций.
Рис.5. Фрагменты картографического атласа Кавказа на межрегиональном уровне: карты частот основных кавказских, ближневосточных и восточноевропейских гаплогрупп.
Рис. 6. Филогенетическая сеть гаплогруппы G2a1a- P18 на Кавказе
Для отбора наиболее четких и информативных кластеров применялись следующие критерии: а) кластер гаплотипов должен быть достаточно обширным – входящие в него гаплотипы суммарно должны быть встречены не менее чем у 10 человек; б) кластер должен четко идентифицироваться на медианной сети: все входящие в него гаплотипы должны соединяться с корневой (центральной) областью сети через один и тот же гаплотип; все дистальные гаплотипы должны входить в данный кластер; в) популяционная специфичность должна быть высокой (не меньше 85% образцов, входящих в кластер, должны происходить из данной популяции).
Восемнадцать кластеров, соответствующих этим строгим требованиям, использованы для сравнения их генетических датировок с лингвистическими и историческими датировками (табл. 7).
Таблица 7. Генетические датировки популяционно-специфичных кластеров гаплотипов
Кластеры | Популяции | Генетическая датировка | Лингвисти-ческая датировка | Историческое событие | |
генеалогическаяскорость STR мутаций | эволюционнаяскорость STR мутаций | ||||
P303-α | Шапсуги | 600±200 | 1900±700 | Отделение шапсугов от черкесов | |
P303-β | Шапсуги и черкесы | 1400±500 | 4300±1400 | Отделение черкесов и шапсугов от абхазов | |
P18-α | Иронцы | 1400±500 | 4200±1400 | Деление осетин на иронцев и дигорцев | |
P18-β | Дигорцы | 1300±500 | 4100±1400 | ||
R1b1b2-β | Дигорцы | 800±300 | 2300±800 | ||
P18- γ | Иронцы и дигорцы | 1200±500 | 3500±1400 | - | - |
M67-β | Чеченцы и ингуши | 1300±700 | 4100±2100 | Отделение нахской языковой ветви от дагестанской | |
M67-γ | Чеченцы и ингуши | 1600±600 | 4800±1800 | ||
M67- α | Ингуши | 1100±500 | 3300±1600 | Деление нахской языковой ветви на чеченскую и ингушскую | |
M67-δ | Чеченцы | 100±100 | 400±300 | ||
L3 | Чеченцы | 900±400 | 2900±1100 | ||
Q-α | Чеченцы | 1100±500 | 3300±1600 | ||
M267(xP58)α | Даргинцы Кубачинцы | 1000±500 | 3100±1400 | Отделение даргинцев, кубачинцев и кайтагцев от других популяций Дагестана | |
M267(xP58)β | Даргинцы Кубачинцы | 1300±600 | 3900±1900 | ||
M267(xP58)γ | Даргинцы Кубачинцы Кайтагцы | 1000±600 | 3200±2000 | ||
R1a1a*-α | Даргинцы | 900±400 | 2700±1300 | Отделение кубачинцев от даргинцев | |
R1b1b2-α | Лезгины | 2000±700 | 6100±2300 | Отделение лезгин от даргинской ветви | |
P15*-α | Лезгины | 2400±700 | 7400±2200 |
Для каждого кластера приведены две генетические датировки: а) на основе «эволюционной» скорости мутирования STR маркеров, полученной путем калибровки для исторически документированных миграций (Zhivotovsky et al., 2004); б) на основе «генеалогической» скорости мутирования STR маркеров, полученной при прямом сравнении в парах «отец-сын» (Ge et al., 2009). Сравнение с лингвистическими и историческими датировками обнаружило, что датировки на основе генеалогической скорости мутирования в наибольшей мере соответствует истории формирования генофонда Кавказа, тогда как эволюционные скорости в большинстве случаев дают значительно завышенные (удревненные) датировки (табл. 7).