вторник, 26 марта 2013 г.

Европейское генетическое

Год назад я опубликовал пост «Европейское социологическое» про то, как  статистическими методами обработал результаты соцопросов, проведённых в разных странах Европы. Интересный пост был, по-моему, так за прошлый год самый интересный. И вот, год спустя, судьба подкидывает продолжение. Сперва у Гоблина, а потом у Раймушки Хейккиля в «фейсбуке» вижу ссылку на некую «научную статью» в духе «британские  учёные™  установили…» Правда, на сей раз были не британские учёные, а «российские генетики». Собственно, общий смысл статейки в том, что русские – вовсе не русские, а русскоязычные финны. Генетики показали, ага. Собственно, ничего нового и сенсационного в этой заяве нет – это популярная среди хохляцких националистов легенда. Правда, тут аффтар и хохлов тоже опускает, разделяя их на восточных, которые тоже финны, и западных, которые, оказывается, родственны татарам. Собственно, тюркский субстрат на Украине и впрямь силён (достаточно посмотреть на монголоидные морды типичных «козаков», да и стрижка с чубом досталась им от степных кочевников), но силён он как раз на востоке, а запад занимали гето-даки, роднящие западенцев с румынами и молдаванами. Ну а настоящие славяне, это типа белорусы. Дело в том, что аффтар сего опуса из Белоруссии. В рунете, кроме своего псевдонима, известен ещё под именем Вадима Деружинского. Желающие могут поискать, чем сие двуногое без перьев прославилось. В общем, ну их в топку, белорусских цитирователей анонимных генетиков, я пошёл искать научные материалы на сей счёт. А материалов не так мало – этногенез Европы изучен довольно подробно.


Для описания популяционной, или, если угодно, этнической структуры применяются так называемые гаплогруппы. Объясняю, в чём их суть. Геном человека, как мы знаем, сложен и изменчив, поскольку при половом процессе гены рекомбинируют, и найти устойчивые маркеры не так просто. Но есть в геноме участки, которые рекомбинации не подвергаются. Во-первых, это ДНК Y-хромосомы. Y-хромосома, как известно, есть только у мужчин. У женщин на её месте вторая Х-хромосома. Таким образом, геном, заключённый в Y-хромосоме, переходит от отца к сыну практически в неизменном виде. Есть неизменный геном и для женщин – это митохондриальная ДНК. Поскольку в половом процессе она не участвует, все митохондрии в организме потомства будут из материнской яйцеклетки, и эта ДНК тоже удобна для обнаружения неких устойчивых генетических маркеров. В то же время и Y-ДНК и митохондриальная ДНК подвергаются ненаправленным изменениям, известным, как дрейф генов. А в результате дрейфа генов в закрытой популяции (до тех пор, пока она остаётся закрытой, по крайней мере) некие генетические комплексы могут либо полностью выбить свои аналоги и занять место в геноме всех членов популяции, либо просто исчезнуть (этот процесс нам наглядно демонстрировал при помощи бросаемой монетки на популяционной генетике Николай Васильевич Глотов). Вот и получаются эти самые группы гаплотипов – то есть гаплогруппы. По сходству этих самых гаплогрупп у двух популяций можно судить, насколько далеко они эволюционно разошлись. Построено даже эволюционное древо, где отдельные гаплогруппы обозначают буквами от A до R. А – самая древняя, R – соответственно, самая молодая. Ну и остался последний шаг: народы начинают смешиваться, в одном этносе оказываются разные гаплогруппы. По составу этим самых гаплогрупп можно судить, кто и кому приходится родственником. Опять таки, исследований на сей счёт много, построены, например, карты типа приведённой выше, где данные представлены в виде круговых диаграмм. Наглядно, и показывает примерное сродство отдельных этносов.

Я решил сделать ещё один шаг. Посмотреть, какие тут существуют основные градиенты, и от чего они зависят. Для этого, как и в случае с результатами соцопросов я использовал всё то же неметрическое шкалирование. Поскольку на сей раз в таблице присутствует немалое количество нулей, при определении нагрузок на оси я использовал не Евклидово расстояние, а расстояние Кульчинского. По той же причине пришлось сменить и метод кластеризации: вместо метода Мак-Квити я использовал гибкую бету (β = -0,25) и всё то же расстояние Кульчинского. Исходные данные нетрудно найти. Я, в частности, взял таблицы вот отсюда. Ну что ещё… Сразу оговорюсь, что данные представлены с огрехами. Почему-то не у всех наций общая сумма гаплотипов составляет 100%. То ли артефакт округления, а то ли неаккуратность в наборе данных. В любом случае, на итоговый результат это качественного влияния не имеет.

Итак, Y-ДНК человека. 73 страны (для Греции, Испании, Италии, Германии и Франции приведены данные и по отдельным областям), 12 гаплогрупп. Картинка.
Из картинки уже можно почерпнуть немало интересного.


  1. Бедные финны оказались в Европе на краю и в почти полном одиночестве. Русские попали в один кластер с тем, с кем и должны были попасть: украинцами и белорусами. Но, что любопытно, близкими генетическими соседями нам оказались и народы Прибалтики: эстонцы, латыши и литовцы. В принципе, логично: на восточно-европейской равнине древние балты, славяне и угро-финны жили вместе.
  2. Интересен компот на противоположном конце первой ординационной оси. В первую очередь, два кластера, в которых сбились неродственные романские и германские народы, населяющие Британские острова, Францию, Иберийский полуостров, Бенилюкс и  Северную Италию. Эдакий «весь цывилизованный мир в одном флаконе» (ну ладно, тут в двух). При этом неоднородна генетически Италия – северная Италия ближе к западному миру, а южная (с Сицилией) – к соседям по Средизимноморью: грекам, туркам и албанцам. И как тут не вспомнить Тимофеева-Ресовского, описавшего такую картину: «А ведь у вашего брата, знающего мир преимущественно по изящной словесности, представления часто совершенно превратные: «Ах, итальянки! Ах, итальянки!» К югу же от Рима, собственно уже и в Риме, итальянки – это помесь лягушки с обезьяной, вообще-то говоря. Ещё в 15-летнем возрасте туды-сюды, а к 25 годам в ней уже 100 килограммов, понимаете, с хвостиком, выползает она из всех юбок, и неизвестно, что у неё на морде в своё время было. Ужас!» 
  3. Между Русью и средиземноморскими народами расположился кластер из жителей Югославии, Румынии и Болгарии. В этот же кластер попали и греки из северной Греции. Ничего удивительного: это всё территории древней Иллирии. И совсем интересно: одними из ближайших соседей украинцев становятся хорваты. И на это должны быть сразу две причины: во-первых, именно с территории Украины переселились на Балканы чёрные хорваты, предки нынешних хорватов. А во-вторых, как я уже сказал, западенцы – потомки гето-даков. Считай, тех же иллирийцев.
  4. Интересный изолированный кластерок плавает в середине. Это славянские народы центральной Европы (поляки, чехи, словаки, словенцы). Но сюда же попали венгры и австрийцы. Ну, что венгры ассимилировали славянский субстрат, я знал. А вот что он так силён в Австрии – это новость. Я бы скорее ожидал в этом кластере восточных немцев, потомков полабских и поморских славян.
  5. Самое неожиданное для меня – там, где между скандинавскими народами затесались невесть как туда попавшие башкиры. Я сперва офигел, но потом узнал, что норманнская гаплогруппа I, оказывается, имеет два основных ареала: в Скандинавии и на Южном Урале. Уж как это вышло исторически – не знаю. Но давно известный факт: генетические родственники башкиров - шведы и норвежцы.

Уменьшим количество кластеров вдвое, чтобы посмотреть, кто с кем объединится. Ну, что же: большая группа «цывилизованных европейцев» объединилась вместе, объединились германские народы Центральной и Северной Европы (с примкнувшими башкирами), в один кластер слились восточные и западные славяне, прибалты объединились с финнами.


Ах да, сами градиенты. Как видите их два, и объясняют они почти всю изменчивость. На первый приходится  62,4% общей изменчивости, а на второй – 32,8%. О смысле этих градиентов можно догадаться уже просто по картинке. Ничего не напоминает? Если напоминает – хорошо, а я вот не сразу въехал. Ладно, пока движемся дальше.

Первым делом я присобачил к исходным европейским данным, все остальные данные, которые там были, в частности, по народам, не имеющих ареала расселения (евреям ашкенази и сефардам, а также аромунам – романоязычному населению Югославии, Греции и Албании) и по народам Ближнего Востока, Кавказа и Северной Африки. В принципе, ничего особенно интересного. Можете рассмотреть, хотя диаграмма адски загромождена – там уже 98 народов. Да и обработка не столь строгая, поскольку с данными пришлось похимичить (для добавившихся народов некоторых гаплогрупп не было, появилась гаплогруппа L, и графа "прочие").

Так что я вернулся к первой табличке, в которой, наоборот, вычистил все регионы имевшихся стран, включая загадочных башкиров. Таким образом, осталось 39 стран. Всё те же 12 гаплогрупп. Получившаяся диаграмма очень напоминает ту, что была при 73 странах, но легче воспринимается. Два крупных градиента, один берёт  47,6% общей изменчивости, второй – 46,9%.


Ну что, теперь можете их интерпретировать? Нет? Продолжаю объяснять. Собственно, никаких факторов, кроме самих гаплогрупп у меня в распоряжении нету. Посмотрим, как оси корррелируют с ними. И корреляции таки есть! Офигенные. С первой осью очень хорошо коррелируют две родственные гаплогруппы R1a и R1b. Пикантность ситуации в том, что их географические максимумы находятся на противоположных концах Европы. Доля носителей гаплогруппы R1b последовательно увеличивается к западу, и максимума достигает в Ирландии, где оное сочетание генов носят 81% мужчин. Можно сказать, что это гаплогруппа древних кельтов, та самая, которая объединяет народы Западной Европы. Доля её носителей негативно коррелирует с первой ординационной осью с сумасшедшим коэффициентом: (r=-0,936, τ=-0,778). То есть связь просто линейная.


Носители группы R1a, напротив, живут на востоке. Это гаплогруппа, характерная для славянских народов. Соответственно, её корреляция с первой осью не негативна, а позитивна. Величина коэффицентов корреляции (параметрического r и непараметрического τ) не столь велика, но вполне значима (r=0,773, τ=0,616).


Со второй ординационной осью коррелирует много гаплогрупп, но выделим из них три. Гаплогруппа I1 характерна для скандинавских народов и убывает к югу (r=0,716, τ=0,583).


Гаплогруппа с длинным названием E1b1b, судя по названию, довольно древняя (вы помните,
что гаплогруппа тем древнее, чем ближе её буквенный код к «А»?) Образовалась она не то на Среднем Востоке, не то в Восточной Африке. Предположительно где-то в Эфиопии. Соответственно, корреляция со второй осью негативна (r=-0,849, τ=-0,819).


Ну и наконец, гаплогруппа J2, появившаяся примерно 18 тысяч лет назад где-то на Ближнем Востоке, а затем расползшаяся по Балканам и Средиземноморью. Корреляция со второй осью также негативна (r=-0,799, τ=-0,738).


Ну, в общем, у вас теперь есть всё, чтобы догадаться, что это за два примерно равных градиента. Чистая линейная география. Градиенты «запад-восток» и «юг-север». Соответственно, ординационная диаграмма представляет из себя схематическую карту Европы. Для окончательной проверки гипотезы я добавил в данные по каждой стране географические широту и долготу её столицы. Так и есть: первая ось коррелирует с долготой, а вторая – с широтой. Итоговый вывод – на распространение генов Y-ДНК в Европе линейно влияет в основном банальная география. В принципе, логично: ежу ясно, что ребёнок должен быть похоже если не на папу, то, скорее всего, на соседа.



Ну и посмотрим, что там у девочек. Отдельно я обработал данные и по митохондриальной ДНК. Не столь интересно. Сразу виден мощный градиент, отделяющий европеек от башкирок, поволжских угро-финнок и адыгеек.


Убрал сразу этих трёх, чтобы не мешались. Всё равно малоинтересно. Градиента уже не два, а три.




Но при этом вся Европа более-менее однородна. Выпадают только баски (насколько я знаю, древнейший народ Европы), да ещё Албанцы с Испанцами вылетают (впрочем, не удивительно, что испанские кельты женились на баскских женщинах), ну и на юге некий архаичный субстрат образуется, возможно, этрусский. Но всё равно сплошная смесь. И русские, кстати, в самом что ни на есть её центре.

Вот такое получилось исследование с банальным, но забавным результатом. Можно будет показать Раймо, да и не только ему. Товарисчам с глобусом Европейской Украины это показывать бесполезно, они существуют независимо от фактологии. Только сперва надо на английский язык его перевести, а это в такой лом...

ЗЫ: Нашёл примерно такое же исследование, только с акцентом на популяции именно русских, опубликованное в 2008 году: Oleg Balanovsky; Siiri Rootsi; Andrey Pshenichnov; Toomas Kivisild; Michail Churnosov; Irina Evseeva; Elvira Pocheshkhova; Margarita Boldyreva; Nikolay Yankovsky; Elena Balanovska; Richard Villems.  Two sources of the Russian patrilineal heritage in their Eurasian context./ American journal of human genetics 2008;82(1):236-50. Читать тут.

9 комментариев:

  1. осталось сделать кригинг и посчитать непрерывную карту для вычисленных осей (каждая ось свой компонент цвета например).

    ОтветитьУдалить
    Ответы
    1. Велкам. Как сделаете, не забудьте ссылочку кинуть.

      Удалить
  2. Происхождение народов невозможно проследить по гаплогруппам. Всё это туфта. Гаплогруппам и их субкладам тысячи, а то и десятки тысяч лет, они существовали задолго до возникновения даже древних народов. Просто ушлые малые на определении гаплогрупп делают деньги и придают своему продукту товарный вид (Молген), связывая гаплогруппы с венедами, викингами, скифами, аланами и т.д. Не попадайтесь на эту удочку!

    ОтветитьУдалить
    Ответы
    1. По-моему скромному мнению, туфта - это то, что вы тут написали. Ни каких венедов и аланов тут в помине нету. Речь идёт исключительно о генетическом сродстве современных народов, которое весьма прозрачно. Основания я изложил довольно ясно.

      Удалить
  3. Вот уж точно блоггер-самоучка. Зачем анализировать фактьі, что их потом пьітаться натянуть на свое мнение? Из диаграммьі по у-хромосоме ясно видно, что русские стоят межде балтами и белоруссами-украинцами и ни с теми, ни с другими не образуют единого кластера. Диаграмма по митохондриальной ДНК говорит вовсе не о европейской центральности (?) женского генофонда России, а о том, что он менее архаичен, чем у "крайних" народов, т.е. появился на єтих землях позже, чем типьі др.народов на своих землях. Что за чушь про казаков-монголоидов? Все казаки произошли от тюркоязьічньіх половцев и косагов, но антропологически они бьіли европеоидьі. Забавно, что автор сам обладая чертами среднестатистического украинца (южноевропейский тип - широкие лицо, темньіе волосьі, хорошо развитая борода), всячески пьітается унизить своих "родственников".

    ОтветитьУдалить
    Ответы
    1. О, вечнообиженный родственник нарисовался.

      >Вот уж точно блоггер-самоучка.
      Не очень уместная ирония. Блогер-самоучка обозначает просто то, что я не вхож в блогерскую тусовку, и, тем более, не занимаюсь этим на профессиональной основе. А вот многомерный анализ – это моя непосредственная работа. Правда, экологической информации, но и генетику я тоже учил в университете, в том числе и популяционную.
      >Зачем анализировать фактьі, что их потом пьітаться натянуть на свое мнение?
      Смелая заява, особенно с учётом дальнейшего.
      > Из диаграммьі по у-хромосоме ясно видно, что русские стоят межде балтами и белоруссами-украинцами и ни с теми, ни с другими не образуют единого кластера.
      Объясняю, даже не тем, кто в танке, а скорее, сторонним зрителям. Ординационная диаграмма НЕ показывает кластерной структуры, его цель – продемонстрировать градиенты в континууме. Дискретности выделяются при помощи кластерного анализа, который был выполнен перед ординацией. Дендрограмма не приведена, но на ординационной диаграмме результаты показаны формой и цветом значков. Так вот по этому анализу при делении на 12 кластеров (рис 2) русские украинцы и белорусы попадают в один довольно компактный кластер. При укрупнении деления (рис. 3) данный кластер объединяется, в первую очередь, с кластером западных славян, куда входят поляки, чехи-словаки, а заодно и венгры с австрийцами. Отрицать это ни один человек, не пытающийся «натянуть что-то на своё мнение», не будет.

      > Диаграмма по митохондриальной ДНК говорит вовсе не о европейской центральности (?) женского генофонда России а о том, что он менее архаичен, чем у "крайних" народов, т.е. появился на єтих землях позже, чем типьі др.народов на своих землях.
      Озадачившая вас, судя по вопросительному знаку, «центральность», обозначает ровно одно: точка, соответствующая русским на ординационной диаграмме находится в её центре. Переводя на более доступный язык – русские близки к среднестатистическому варианту общеевропейской совокупности. Сама диаграмма показывает только то, что несколько небольших кластеров по митохондриальной ДНК отличаются от основного массива, утекая на периферию. Чего ординация никак НЕ делает – так это она не подтверждает «архаичности» какого-то генотипа на территории. Я вполне допускаю, что результат может обозначать пришлость большинства европейских народов (большой голубой кластер, куда входят, в том числе, и русские) в Европе, но она точно так же может обозначать и пришлость некоторых периферийных вариантов, например, красного или пурпурного кластеров,.собирающих разные народы Южной Европы. Конечно, если не заниматься «натягиванием фактов на своё мнение», в котором вы пытались меня обвинить

      > Что за чушь про казаков-монголоидов
      А вас что-то смущает? Меня – нет. Я же не сказал, что «Все» казаки монголоиды.

      > Все казаки произошли от тюркоязьічньіх половцев и косагов, но антропологически они бьіли европеоидьі.
      Вот это, как раз, чушь. Во-первых, европеоидная природа половцев весьма дискуссионна. Достаточно посмотреть, как они изображались, например, в венгерских летописях. Имеются немало результатов остеологических реконструкций со вполне монголоидным обликом. Наличие европеоидных реконструкций (я, правда, таких видел весьма мало) обозначает только то, что европеоидные типажи у половцев также встречались. Как у современных казахов, которые несомненные монголоиды. Как и большинство потомков половцев.

      Удалить
    2. Во-вторых, антропогенез казаков (даже не «всех», а хотя бы только запорожских) существенно обширней, чем половцы и касоги. Начать можно с дополовецкого тюркского субстрата, печенегов и чёрных клобуков. Очень сильно внёс свою лепту и славянский генотип, и не только из Киева и Чернигова. Впоследствии, приложились и иные кавказские племена, и южные огузы из турок и крымчаков, и непосредственно ордынские монголы, так что к XVIII веку генотип запорожства представлял собой компот не хуже нынешней Турции.

      > Забавно, что автор сам обладая чертами среднестатистического украинца (южноевропейский тип - широкие лицо, темньіе волосьі, хорошо развитая борода)
      Ой, опасное это дело, выводы по одному конкретному случаю, не считая моего скептического отношения к анализу внешних признаков. Широкое лицо встречается у многих народов Северной Европы и Азии (в Азии даже чаще), тёмные волосы есть, например, у карел. У меня нет никаких связей с Южной Европой. Средняя Россия (Москва, Нижний Новогород) есть. Прибалтийские финны есть (дед по отцовской линии наполовину карел, наполовину саволакс). Тюрки есть (бабушка по материнской линии – Касимовская татарка). На уровне семейной легенды есть по материнской линии в 5-6 поколении грузины. Никаких украинцев или южноевропейцев нет и не было.
      Волосы в детстве у меня были существенно светлее, лет до пяти я был вообще белокурым. Даже ещё в студенческие годы, когда я обзавёлся бородой, она была заметно темнее волос на голове. Сейчас уравнялось. Борода у меня типично татарская, булгарская, если угодно, тут точно бабушкин корешок.
      Но, в целом, если считать обликом «среднестатистического украинца» славянина с весомой примесью тюрка и кавказца, каковым я являюсь, то, пожалуй, в этом есть рациональное зерно. Ну а «южноевропейскость» - это чушь, конечно. Тем более, из верхних картинок видно, что Южная Европа – это по крайней мере, три разных варианта генотипов.

      > всячески пьітается унизить своих "родственников".
      Во-первых, отчего же «родственников» в кавычках? ИМХО я вполне иллюстративно показал, что русские украинцы и белорусы – очень близкие народы. Я бы вообще сказал, один народ, генетически более однородный, чем итальянцы или греки, например.
      А во-вторых, непонятно, в чём состоит «унижение»? В то, что русские с украинцами попали в один кластер? Или в том, что на ординации митохондриальной ДНК русские находятся в центре диаграммы? Или вас унижает главный вывод о том, что значимыми факторами в генотипах жителей Европы являются географические широта и долгота?

      Впрочем, лукавлю. Я представляю, в чём состоит «унижение», но промолчу. Ибо вывод будет не очень приятен для вас лично.

      Удалить