《自然·通讯》杂志日前在线发表了中国科学院及复旦大学徐书华团队关于人类族群演化中的混血历史的研究论文。论文提出了一种新方法,能更有效地检测和量化近缘种的基因交流,并在更精细的尺度上重构复杂的基因交流历史。该方法也适用于非人类物种的遗传数据分析。
研究团队应用新方法分析公共数据库中的人群基因组数据,重塑了欧亚大陆以及大洋洲现代人类史前与远古人类的基因交流模型,重构了现代人类的史前演化历史。本报约请徐书华教授向读者介绍他们的新发现。
1
新方法有效重构古人类基因渗入
人类作为地球生命演化中很晚近才出现的物种,历史十分短暂,但是过程错综复杂。近年来的研究发现,现代人类的祖先在“走出非洲”向全球探索的征途中,可能与先期抵达的古人类接触并共存了相当长的时期,期间有过密切接触并且产生了基因交流。其中比较有代表性的古人类是目前已知的尼安德特人和丹尼索瓦人。虽然这些古人类作为物种在3万年前都走向了灭绝,但他们的基因片段散布在包括我们自己在内的现存人类的基因组中。
这个有趣的现象吸引了人类学、历史学、地质学、古生物学、考古学、遗传学等众多领域的科学研究者,有趣的甚至令人惊奇的发现也持续出现。然而,几个关键的问题亟待解决或缺乏令人满意的答案:
如何在现代人类基因组中准确地识别出这些古人类的基因片段?
通过对这些基因片段的研究是否可以揭示出现代人类与古人类的族群交融历史?
通过对从古人类遗传交融的分析视角,重新审视长期以来建立的人类演化模型,是否应该修正或者改变我们对现代人类演化历史的认知?
与古人类的遗传交融对现代人类遗传和表型多样性产生哪些影响?特别是这些古人类基因片段具有什么样的进化和医学意义?
曾经发生在史前的基因交流,站在现代人类的立场,可视为远古人类对现代人类的基因渗入。由于基因渗入事件发生的时间比较久远(距今3万至10万年前),古人类的基因片段由于基因重组往往碎片化为平均长度只有几万个核苷酸的DNA序列(人的基因组为30亿核苷酸长度),并且极度分散于现代人类基因组中。相比之下,近期的族群遗传融合(如美国黑人、南美拉丁裔人群)动辄几百万核苷酸大小的祖先片段,比远古人类渗入的基因片段长了近百倍。除此之外,经过现代人类基因库几万年的重组稀释,远古人类基因片段总体上通常只占现代人全基因组序列的1%至2%。极低的频率,极短的长度,和远古人类基因组数据的缺失等诸多因素,都增加了从现代人类基因组序列中搜寻和鉴定远古人类基因片段的难度。而基于这1%至2%的基因渗入信息推断史前人类的历史,则是一个更加富有挑战的问题。这也是长久以来各种方法的尝试都未取得良好效果的重要原因。
出于对这些问题的好奇与研究热情,我们研究团队在前期研究的基础上,专门设计了一种寻找远古人类基因渗入片段,基于渗入片段长度推断远古人类基因渗入历史的方法——ArchaicSeeker 2.0。
相比于其他方法,新方法有如下三个优势:
首先,该方法通过渗入片段搜寻算法,可以从海量的现代人基因组数据中,快速鉴定潜在的渗古人类基因序列,并能精准判定每个片段的大小和确定边界;
其次,该方法在判定基因渗入片段的祖源过程中不依赖于是否具备已知的远古人类基因信息;
第三,基于新方法的历史重构算法,不依赖于海量计算机模拟,即可有效地重构极为复杂的基因渗入历史。
新方法的这些独特优势在计算机模拟数据和实验数据分析中得到了系统的评估与确证。结果表明,在远古人类基因片段的判定方面,新方法达到了超过90%的准确率,而误判率仅为约0.14%。在几乎所有的模拟实验中,至少80%以上的推断的古人类片段都能被匹配至正确的祖先上。同时,新方法在遗传混合事件次数、基因渗入比例和遗传交融发生的时间估计上也有良好的表现。
2
现代人类或至少两次“走出非洲”
我们研究团队借由该方法分析和探讨了东亚、南亚、欧洲及大洋洲的现代人群与尼安德特人、丹尼索瓦人之间基因渐渗、共同演化的历史重构等一系列重要问题。研究团队进一步将该方法应用于分析全球人群基因组公共数据,从现代人类基因组中检测远古人类的基因序列并在更精细的尺度上重构史前人类在欧亚大陆的迁徙和基因交流历史。
早前研究表明,非洲以外的现代人类基因组中存在少量尼安德特人、丹尼索瓦人等远古人类的渗入基因序列。然而不少关键的问题,如这些基因片段是何时、何地以及经由哪种远古人类渗入现代人类基因组,尚有较大争议。
利用ArchaicSeeker 2.0方法,研究团队对东亚、南亚、欧洲、大洋洲以及现代亚欧人类祖先乌斯特-伊斯姆人与尼安德特人、丹尼索瓦人的混合时间、次数进行估计。结合考古学证据,研究人员从时空尺度上重构了现代人类和远古人类的遗传交融历史。通过新方法分析,从现存人群(居住在岛屿上的土著人除外)的基因组数据中能够辨别出两次疑似丹尼索瓦人的基因渗入,以及两次疑似尼安德特人的基因渗入。
之前关于古人类与现代人类遗传混合的研究,大多基于现代人类“单次走出非洲”的模型。然而我们研究团队发现,“单次走出非洲”模型与大洲人群与尼安德特人、丹尼索瓦人的混合时间与次数存在矛盾,目前的数据需要至少两次出非洲迁移事件才能较好地解释。一次较早的“走出非洲”迁徙发生在距今约6万至12万年前,而较晚近的一次发生在距今6万年以后。
早期走出非洲的现代人类祖先,在距今约9.4万年到11.9万年前,在中东、南亚附近,与丹尼索瓦人发生了第一次接触和基因交流。而后,他们继续向东前进,一部分留在南亚,一部分向北到达东亚南部,并分别与本地的丹尼索瓦人发生遗传交融。还有一支继续向东南迁徙,在距今6.2万年至6.4万年前,穿过华莱士线到达大洋洲,与已先期到达的一支丹尼索瓦人融合。
近期走出非洲的现代人类,距今4.8万年至5.9万年前,在中东地区与尼安德特人发生第一次接触和基因交流,之后,他们分别迁徙至欧洲、南亚、东亚,与各地尼安德特人发生了第二次族群融合。随后,南亚对欧洲的迁徙还将极少量的丹尼索瓦人的基因序列带入欧洲。
3
现代人类多样性的形成仍然未解
基于ArchaicSeeker 2.0对古人类基因渗入片段精准高效的估计,研究团队分析了全球近300个现代人群中远古人类基因渗入序列功能及其分布特点,发现它们富集于免疫、体重、心肺功能、紫外线响应和碳水化合物的代谢等相关功能基因区域。除去这些远古人类渗入片段富集区域,研究团队还检测到了84个完全缺乏古人类基因片段的“渐渗沙漠”区域。而在这些“渐渗沙漠”区域中,显著富集了与皮肤发育和角化功能有关的基因。这些发现为揭示远古人类基因序列渗入对现代人类影响提供了线索,并为接下来进一步研究渗入基因片段的生物学功能以及远古人类遗传渐渗对现代人类进化的影响,提供了候选基因和研究靶标。
如今人类足迹已遍布全球,而人群迁徙和族群融合贯穿于人类的演化历史长河中。实际上,世界上大多数族群的形成和发展是迁移、隔离、再接触、再融合的过程。通过大量的研究,现在已经可以初步绘制出史前人类迁徙路线图。对于科学家绘制的人类迁徙路线图,人们往往都有这样的疑问——为何史前的人类能够判断这些如今看来都是最佳的迁徙路线?或者,有什么神秘的力量在给人类指引着方向?
实际上,这是一种“幸存者偏倚”现象,即那些探索失败的路线自然缺乏追随者,因而对现存人类产生的影响很小,从现代的时间回放呈现出的当然只有最终成功了的路线。从这个角度考虑,当科学家在讨论人类“走出非洲”理论的时候,并未排除有一部分人可以“走回非洲”。同样的道理,当探讨人类几次走出非洲时,我们讨论的是定居非洲以外的现存人类的共同祖先,到底是几批人在不同时间段迁移到非洲以外,还是最初一批人的迁移和定居即可解释现存人类的主体基因库构成。
很显然,人类祖先最初“走出非洲”之后有更多机会可以不断走出非洲,直到现今其实反而有更大量的人口流动。所以讨论的焦点在于最初为各地现存人群基因库奠定基础的那些早期迁移事件。即便如此,如今所呈现出的现代人类多样性格局如何形成仍是一个尚未得到完全解决的重大科学问题,这有赖于人类学、遗传学、考古学、地质学等多学科的交叉合作,更依赖于研究方法和技术上的创新甚至研究范式上的突破。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com