вторник, 26 марта 2013 г.

Европейское генетическое

Год назад я опубликовал пост «Европейское социологическое» про то, как  статистическими методами обработал результаты соцопросов, проведённых в разных странах Европы. Интересный пост был, по-моему, так за прошлый год самый интересный. И вот, год спустя, судьба подкидывает продолжение. Сперва у Гоблина, а потом у Раймушки Хейккиля в «фейсбуке» вижу ссылку на некую «научную статью» в духе «британские  учёные™  установили…» Правда, на сей раз были не британские учёные, а «российские генетики». Собственно, общий смысл статейки в том, что русские – вовсе не русские, а русскоязычные финны. Генетики показали, ага. Собственно, ничего нового и сенсационного в этой заяве нет – это популярная среди хохляцких националистов легенда. Правда, тут аффтар и хохлов тоже опускает, разделяя их на восточных, которые тоже финны, и западных, которые, оказывается, родственны татарам. Собственно, тюркский субстрат на Украине и впрямь силён (достаточно посмотреть на монголоидные морды типичных «козаков», да и стрижка с чубом досталась им от степных кочевников), но силён он как раз на востоке, а запад занимали гето-даки, роднящие западенцев с румынами и молдаванами. Ну а настоящие славяне, это типа белорусы. Дело в том, что аффтар сего опуса из Белоруссии. В рунете, кроме своего псевдонима, известен ещё под именем Вадима Деружинского. Желающие могут поискать, чем сие двуногое без перьев прославилось. В общем, ну их в топку, белорусских цитирователей анонимных генетиков, я пошёл искать научные материалы на сей счёт. А материалов не так мало – этногенез Европы изучен довольно подробно.


Для описания популяционной, или, если угодно, этнической структуры применяются так называемые гаплогруппы. Объясняю, в чём их суть. Геном человека, как мы знаем, сложен и изменчив, поскольку при половом процессе гены рекомбинируют, и найти устойчивые маркеры не так просто. Но есть в геноме участки, которые рекомбинации не подвергаются. Во-первых, это ДНК Y-хромосомы. Y-хромосома, как известно, есть только у мужчин. У женщин на её месте вторая Х-хромосома. Таким образом, геном, заключённый в Y-хромосоме, переходит от отца к сыну практически в неизменном виде. Есть неизменный геном и для женщин – это митохондриальная ДНК. Поскольку в половом процессе она не участвует, все митохондрии в организме потомства будут из материнской яйцеклетки, и эта ДНК тоже удобна для обнаружения неких устойчивых генетических маркеров. В то же время и Y-ДНК и митохондриальная ДНК подвергаются ненаправленным изменениям, известным, как дрейф генов. А в результате дрейфа генов в закрытой популяции (до тех пор, пока она остаётся закрытой, по крайней мере) некие генетические комплексы могут либо полностью выбить свои аналоги и занять место в геноме всех членов популяции, либо просто исчезнуть (этот процесс нам наглядно демонстрировал при помощи бросаемой монетки на популяционной генетике Николай Васильевич Глотов). Вот и получаются эти самые группы гаплотипов – то есть гаплогруппы. По сходству этих самых гаплогрупп у двух популяций можно судить, насколько далеко они эволюционно разошлись. Построено даже эволюционное древо, где отдельные гаплогруппы обозначают буквами от A до R. А – самая древняя, R – соответственно, самая молодая. Ну и остался последний шаг: народы начинают смешиваться, в одном этносе оказываются разные гаплогруппы. По составу этим самых гаплогрупп можно судить, кто и кому приходится родственником. Опять таки, исследований на сей счёт много, построены, например, карты типа приведённой выше, где данные представлены в виде круговых диаграмм. Наглядно, и показывает примерное сродство отдельных этносов.

Я решил сделать ещё один шаг. Посмотреть, какие тут существуют основные градиенты, и от чего они зависят. Для этого, как и в случае с результатами соцопросов я использовал всё то же неметрическое шкалирование. Поскольку на сей раз в таблице присутствует немалое количество нулей, при определении нагрузок на оси я использовал не Евклидово расстояние, а расстояние Кульчинского. По той же причине пришлось сменить и метод кластеризации: вместо метода Мак-Квити я использовал гибкую бету (β = -0,25) и всё то же расстояние Кульчинского. Исходные данные нетрудно найти. Я, в частности, взял таблицы вот отсюда. Ну что ещё… Сразу оговорюсь, что данные представлены с огрехами. Почему-то не у всех наций общая сумма гаплотипов составляет 100%. То ли артефакт округления, а то ли неаккуратность в наборе данных. В любом случае, на итоговый результат это качественного влияния не имеет.

Итак, Y-ДНК человека. 73 страны (для Греции, Испании, Италии, Германии и Франции приведены данные и по отдельным областям), 12 гаплогрупп. Картинка.
Из картинки уже можно почерпнуть немало интересного.


  1. Бедные финны оказались в Европе на краю и в почти полном одиночестве. Русские попали в один кластер с тем, с кем и должны были попасть: украинцами и белорусами. Но, что любопытно, близкими генетическими соседями нам оказались и народы Прибалтики: эстонцы, латыши и литовцы. В принципе, логично: на восточно-европейской равнине древние балты, славяне и угро-финны жили вместе.
  2. Интересен компот на противоположном конце первой ординационной оси. В первую очередь, два кластера, в которых сбились неродственные романские и германские народы, населяющие Британские острова, Францию, Иберийский полуостров, Бенилюкс и  Северную Италию. Эдакий «весь цывилизованный мир в одном флаконе» (ну ладно, тут в двух). При этом неоднородна генетически Италия – северная Италия ближе к западному миру, а южная (с Сицилией) – к соседям по Средизимноморью: грекам, туркам и албанцам. И как тут не вспомнить Тимофеева-Ресовского, описавшего такую картину: «А ведь у вашего брата, знающего мир преимущественно по изящной словесности, представления часто совершенно превратные: «Ах, итальянки! Ах, итальянки!» К югу же от Рима, собственно уже и в Риме, итальянки – это помесь лягушки с обезьяной, вообще-то говоря. Ещё в 15-летнем возрасте туды-сюды, а к 25 годам в ней уже 100 килограммов, понимаете, с хвостиком, выползает она из всех юбок, и неизвестно, что у неё на морде в своё время было. Ужас!» 
  3. Между Русью и средиземноморскими народами расположился кластер из жителей Югославии, Румынии и Болгарии. В этот же кластер попали и греки из северной Греции. Ничего удивительного: это всё территории древней Иллирии. И совсем интересно: одними из ближайших соседей украинцев становятся хорваты. И на это должны быть сразу две причины: во-первых, именно с территории Украины переселились на Балканы чёрные хорваты, предки нынешних хорватов. А во-вторых, как я уже сказал, западенцы – потомки гето-даков. Считай, тех же иллирийцев.
  4. Интересный изолированный кластерок плавает в середине. Это славянские народы центральной Европы (поляки, чехи, словаки, словенцы). Но сюда же попали венгры и австрийцы. Ну, что венгры ассимилировали славянский субстрат, я знал. А вот что он так силён в Австрии – это новость. Я бы скорее ожидал в этом кластере восточных немцев, потомков полабских и поморских славян.
  5. Самое неожиданное для меня – там, где между скандинавскими народами затесались невесть как туда попавшие башкиры. Я сперва офигел, но потом узнал, что норманнская гаплогруппа I, оказывается, имеет два основных ареала: в Скандинавии и на Южном Урале. Уж как это вышло исторически – не знаю. Но давно известный факт: генетические родственники башкиров - шведы и норвежцы.

Уменьшим количество кластеров вдвое, чтобы посмотреть, кто с кем объединится. Ну, что же: большая группа «цывилизованных европейцев» объединилась вместе, объединились германские народы Центральной и Северной Европы (с примкнувшими башкирами), в один кластер слились восточные и западные славяне, прибалты объединились с финнами.


Ах да, сами градиенты. Как видите их два, и объясняют они почти всю изменчивость. На первый приходится  62,4% общей изменчивости, а на второй – 32,8%. О смысле этих градиентов можно догадаться уже просто по картинке. Ничего не напоминает? Если напоминает – хорошо, а я вот не сразу въехал. Ладно, пока движемся дальше.

Первым делом я присобачил к исходным европейским данным, все остальные данные, которые там были, в частности, по народам, не имеющих ареала расселения (евреям ашкенази и сефардам, а также аромунам – романоязычному населению Югославии, Греции и Албании) и по народам Ближнего Востока, Кавказа и Северной Африки. В принципе, ничего особенно интересного. Можете рассмотреть, хотя диаграмма адски загромождена – там уже 98 народов. Да и обработка не столь строгая, поскольку с данными пришлось похимичить (для добавившихся народов некоторых гаплогрупп не было, появилась гаплогруппа L, и графа "прочие").

Так что я вернулся к первой табличке, в которой, наоборот, вычистил все регионы имевшихся стран, включая загадочных башкиров. Таким образом, осталось 39 стран. Всё те же 12 гаплогрупп. Получившаяся диаграмма очень напоминает ту, что была при 73 странах, но легче воспринимается. Два крупных градиента, один берёт  47,6% общей изменчивости, второй – 46,9%.


Ну что, теперь можете их интерпретировать? Нет? Продолжаю объяснять. Собственно, никаких факторов, кроме самих гаплогрупп у меня в распоряжении нету. Посмотрим, как оси корррелируют с ними. И корреляции таки есть! Офигенные. С первой осью очень хорошо коррелируют две родственные гаплогруппы R1a и R1b. Пикантность ситуации в том, что их географические максимумы находятся на противоположных концах Европы. Доля носителей гаплогруппы R1b последовательно увеличивается к западу, и максимума достигает в Ирландии, где оное сочетание генов носят 81% мужчин. Можно сказать, что это гаплогруппа древних кельтов, та самая, которая объединяет народы Западной Европы. Доля её носителей негативно коррелирует с первой ординационной осью с сумасшедшим коэффициентом: (r=-0,936, τ=-0,778). То есть связь просто линейная.


Носители группы R1a, напротив, живут на востоке. Это гаплогруппа, характерная для славянских народов. Соответственно, её корреляция с первой осью не негативна, а позитивна. Величина коэффицентов корреляции (параметрического r и непараметрического τ) не столь велика, но вполне значима (r=0,773, τ=0,616).


Со второй ординационной осью коррелирует много гаплогрупп, но выделим из них три. Гаплогруппа I1 характерна для скандинавских народов и убывает к югу (r=0,716, τ=0,583).


Гаплогруппа с длинным названием E1b1b, судя по названию, довольно древняя (вы помните,
что гаплогруппа тем древнее, чем ближе её буквенный код к «А»?) Образовалась она не то на Среднем Востоке, не то в Восточной Африке. Предположительно где-то в Эфиопии. Соответственно, корреляция со второй осью негативна (r=-0,849, τ=-0,819).


Ну и наконец, гаплогруппа J2, появившаяся примерно 18 тысяч лет назад где-то на Ближнем Востоке, а затем расползшаяся по Балканам и Средиземноморью. Корреляция со второй осью также негативна (r=-0,799, τ=-0,738).


Ну, в общем, у вас теперь есть всё, чтобы догадаться, что это за два примерно равных градиента. Чистая линейная география. Градиенты «запад-восток» и «юг-север». Соответственно, ординационная диаграмма представляет из себя схематическую карту Европы. Для окончательной проверки гипотезы я добавил в данные по каждой стране географические широту и долготу её столицы. Так и есть: первая ось коррелирует с долготой, а вторая – с широтой. Итоговый вывод – на распространение генов Y-ДНК в Европе линейно влияет в основном банальная география. В принципе, логично: ежу ясно, что ребёнок должен быть похоже если не на папу, то, скорее всего, на соседа.



Ну и посмотрим, что там у девочек. Отдельно я обработал данные и по митохондриальной ДНК. Не столь интересно. Сразу виден мощный градиент, отделяющий европеек от башкирок, поволжских угро-финнок и адыгеек.


Убрал сразу этих трёх, чтобы не мешались. Всё равно малоинтересно. Градиента уже не два, а три.




Но при этом вся Европа более-менее однородна. Выпадают только баски (насколько я знаю, древнейший народ Европы), да ещё Албанцы с Испанцами вылетают (впрочем, не удивительно, что испанские кельты женились на баскских женщинах), ну и на юге некий архаичный субстрат образуется, возможно, этрусский. Но всё равно сплошная смесь. И русские, кстати, в самом что ни на есть её центре.

Вот такое получилось исследование с банальным, но забавным результатом. Можно будет показать Раймо, да и не только ему. Товарисчам с глобусом Европейской Украины это показывать бесполезно, они существуют независимо от фактологии. Только сперва надо на английский язык его перевести, а это в такой лом...

ЗЫ: Нашёл примерно такое же исследование, только с акцентом на популяции именно русских, опубликованное в 2008 году: Oleg Balanovsky; Siiri Rootsi; Andrey Pshenichnov; Toomas Kivisild; Michail Churnosov; Irina Evseeva; Elvira Pocheshkhova; Margarita Boldyreva; Nikolay Yankovsky; Elena Balanovska; Richard Villems.  Two sources of the Russian patrilineal heritage in their Eurasian context./ American journal of human genetics 2008;82(1):236-50. Читать тут.

6 комментариев:

  1. осталось сделать кригинг и посчитать непрерывную карту для вычисленных осей (каждая ось свой компонент цвета например).

    ОтветитьУдалить
    Ответы
    1. Велкам. Как сделаете, не забудьте ссылочку кинуть.

      Удалить
  2. Происхождение народов невозможно проследить по гаплогруппам. Всё это туфта. Гаплогруппам и их субкладам тысячи, а то и десятки тысяч лет, они существовали задолго до возникновения даже древних народов. Просто ушлые малые на определении гаплогрупп делают деньги и придают своему продукту товарный вид (Молген), связывая гаплогруппы с венедами, викингами, скифами, аланами и т.д. Не попадайтесь на эту удочку!

    ОтветитьУдалить
    Ответы
    1. По-моему скромному мнению, туфта - это то, что вы тут написали. Ни каких венедов и аланов тут в помине нету. Речь идёт исключительно о генетическом сродстве современных народов, которое весьма прозрачно. Основания я изложил довольно ясно.

      Удалить