"Y染色体与人类谱系”学术报告

来源:百度文库 编辑:超级军网 时间:2024/04/29 22:27:38


北方Y-O3系与汉人Y结构之历史变迁

这个话题比较沉重,或许也会让“大O3主义者”和“皇汉”们沮丧和失望,但这是极有可能的历史真相推测。

话说前几年在一些人的舆论影响下,认为汉族中占据半壁江山的Y-O3系都是汉族原本所有,今天汉人都是5000年前直系中原汉人后裔,汉族血统没有受到北方民族的影响。但是后来Y-DNA的测试结果令人啼笑皆非、苦笑不得。网上帖子话说在著名的原恐龙网,有两位都挺牛的“民科”,一个蒙古族的精英,一个是著名皇汉,都在试图纯洁本民族的血统,结果科学检测以后蒙古族这位变成了汉族“主流血统”的Y-O3系,汉族这位反倒不是汉族主流了,结果一个人开始消沉,另一位就开始喋喋不休地论证起汉族“主流标志性基因”起源于蒙古族或者北方的论点。。。

造成这种杯具的起因或许最早是从复旦李辉的《两个人种论》所肇始,《两个人种论》可以说是基于Y-O系优越论而发表的具有种族主义性质的论调,其主要论点:
(1) 把东亚人分成两个人种,即黄色人种和棕色人种,并简单地把Y-O系等同于黄色人种,把Y-C、D系等同于棕色人种。
(2)把Y-C、D系棕色人种称之为“老亚洲人”,把Y-O系称之为“新亚洲人”,“新亚洲人”是成功民族,“老亚洲人”是“失败民族”,新亚洲人对老亚洲人进行了屠杀与驱赶。

然而最近几年更多更新数据表明,可能事实真相与《两个人种论》的基本观点大相径庭,某些地方可能正好相反。秉持实事求是的科学探索精神,根据大量现象和证据,同时也综合总结某论坛上大牛们的言论,分析如下:

1 人种

黄种人并不是起源于东南亚,Y-O系原本并不是黄种人,O系原本是南方的澳美-马来系人种,只是在5000年前以后,蒙古人种(黄种人)才从中亚方向进入华北,华北和北亚Y-O3系被黄化,后来黄种人南下,蒙古人种才出现在东南亚,这是很近的事情。二战时,法国军团中华人士兵与法国姑娘结婚,只两三代的时间,他们的后代现在都已经白种化。这是很惊人的看得见的事实。“这与蒙古人种出现在东南亚不早于新石器时代考古事实是吻合的,也与古代mtDNA近似澳美人种,而不同于蒙古人种的事实是吻合的。”

黄种人起源于中亚比较可信,参见<<SPAN>关于黄种人来源和东亚人种迁徙再探…>。从2500年前东周时代宁夏彭阳墓葬看,几例遗骨都表现出典型的蒙古人种(黄种人)特征,母系都属于mt-M系, 以mt-D4为主,还有mt-C, mt-M10, 而父系全部是Y-Q。最早的黄种人与Y-O和Y-C都没有关系。另外,我们只要看华北或者汉人母系主成分mt-D4在世界上的分布区域,就能大致心中有个数。mt-D4高频区域,黄种人特征明显,包括东亚地区,美洲印地安人,同时mt-D4也部分在中东(土尔其,伊朗。。。等),也分布中中北欧(乌克兰,芬兰。。。等),这些地区很多人相貌与黄种人也比较接近。考古学证据也表明,在商周以前,中原地区的母系成分主要是以Y-O系所对应的南方系的mt-R系为主,以mt-D4为代表的M系成分是大约从商周开始进入中国,在春秋战国时代爆发。最新的mtDNA树表明,M的年龄也比mt-NR都年轻。


2 “新老亚洲”

Y-CF是一个集团的,Y-C系主要沿海岸迁徙,而Y-F系下的Y-O系的年龄比较古老,推测诞生时间28-41千年,有可能是最早进入东亚大陆的现代人种。 Y-C诞生年代或许与Y-O一样古老,但是Y-C推测应该诞生于印度大陆东南部海岸一带,C系表现出典型的海岸迁徙特征,而东亚大陆的C系主要是Y-C3系,且其主要几个支流年龄可能都比较年轻,根据一份数据显示:
C3c --- 5.9 或者 1.6 千年
C3d --- 2.0 或者 0.5 千年
C3* 某Star Cluster --- 2.8 ± 1.0 或者 0.78 ± 0.27 千年

如果新的年代估算成立,那么以前关于C与O关系的许多观点都会被颠覆。显然才几千年甚至几百年的C3系要比Y-O系年轻多得多。由此,亚洲大陆的Y-O系支系及人口众多,分布广泛就很容易理解了,因为他们诞生扩散的历史久远,Y-O系应该是东亚大陆最早的土著现代人种。而亚洲的大陆的Y-C3系则主要是近期历史时期扩张的结果。所谓黄种人Y-O系对棕种人Y-CD系进行了种族屠杀与驱赶,以及Y-O系抢了Y-CD系女人纯粹是是子虚乌有。

李辉所依据CD系被Y-O系所分割的“逻辑”也是有缺陷。 因为:
第一,事实上, 东亚中间汉人区CD也不少,从绝对数来说不一定比两端少,所谓被分割很难成立
第二,假设,即使,“两端”分布的规律成立,那也不能就此证明是被O系分割的。因为可能正好相反,O系是土著,已经占据了中原,后来者只能沿着边缘发展,除非发展到一定阶段有力量能够强势进入。

3 Y-O3系在北方民族中的分布

以前认为Y-O3系主要是汉人所有,甚至“皇汉”或大O3主义者们直接把汉族等于O3,但是越来越多的数据确实证明Y-O3系也是北方许多民族的重要甚至核心组成部分。

- 中亚咸海南部沿岸地区的居民。自称“卡拉尔帕克人”和“卡尔帕克人”。约30.8万人(1979)。卡拉卡尔帕克人的远祖可追溯为公元前7~前2世纪时就已居住在咸海南岸的萨卡-马萨格特人(即塞种-马萨格特人)。2世纪末到4世纪,部分东来的匈奴部落在咸海草原地带与当地居民结合,6~8世纪又与突厥人结合,形成佩切涅格人和乌古斯人部落。根据一份卡拉卡尔帕克人的Y数据,O3-M117占10%,O3-M134*占4%,C3d占2%,C3(Star Cluster,C3d)占2%,C3c占4%。

- 乃蛮人,古代部落,于11世纪开始居住在蒙古高原西部,牧地在阿尔泰山之阳,操突厥语族语言。但是乃蛮部的主频单倍体群却是Y-O3系的M134*,突变年代大约发生在2.5-3.0万年前旧石器时代。这个遗传标记一直被很多皇汉说成是汉族的“标志基因”。奈蛮人被认为属于突厥系。乃蛮后来融入了哈萨克族人中。哈萨克族分为大、中、小三帐。现在乃蛮人是哈萨克族中帐(中玉兹)中的一个大部落。


- 一篇韩国人的数据证据证明北方草原地区在中古时代是以Y-O系为主,且主要是Y-O3,Y-C3系主要是历史时期后期兴起并扩张,800年前C3比例才开始高速攀升。今天Y-O3与Y-C3也是蒙古人的主要成分,且比例大致相当。

这些数据从一个侧面也说明,“O3-M134这些高频于东亚同时也高频于内蒙古人群的遗传标记,也是很可能大多是北方草原固有的,而非受汉族的影响。而源头或许可以追溯到新石器时代、青铜时代的戎狄人群。”

4 Y-C3系的扩张

东亚地区Y-C3系主要支系有:
C3c
C3d
C3* (Star Cluster)

以前认为汉族中只有C3d没有C3c,蒙古人中只有C3c,没有C3d,这也是当初有些人坚持汉族Y结构没有受到北方民族的影响的依据,然而这种观点正在受到挑战。现在的数据表明无论汉族和蒙古族或满族中以上三个支系都具有,只不过汉族中C3以C3d占据多数。

C3*: 一种观点认为C3*(Star Cluster) 星簇代表了成吉思汗“黄金家族”的扩张。“黄金家族”指的是纯洁出身的蒙古人。在成吉思汗死后,只有他的直系后裔,即术赤、察合台、窝阔台、拖雷四人的后代才被称为“黄金家族”,黄金家族,直到明中后期,才最终在蒙古地区巩固了统治地位,开始大发展,但之前他们互相之间的攻杀,导致了严重的内耗。满都鲁汗死后,没有子嗣,说明这个家族的生殖能力也不是多么惊人,7岁的曾侄孙巴图蒙克成为北元唯一的苗裔。但也有人认为,虽然星簇确实是相当年轻的,但是并不一定与黄金家族相关,至于黄金家族,目前的结果有Y-C3d, O3a2c1-M134*, O3a1c-002611, O3a2-P201*,C3*,R2等几种说法。也有人认为C3*对应了满清的扩张。

C3d: C3d-M407在汉人中分布比较广,有种观点认为匈奴的C3*是C3d,由此有人推测汉人中的C3d是随匈奴或鲜卑而进入,代表匈奴和鲜卑在汉族中扩张。另外,元朝崩溃后,一度掌握蒙古本土局势的是绰罗斯部,C3d-M407被认为也是绰罗斯部主要成分。绰罗斯是清代对西蒙古诸部的总称﹐中国西北地区以畜牧业为主的游牧民族。明称瓦剌﹐清称厄鲁特,国外学者又往往沿袭突厥语族习惯﹐称之为卡尔梅克。

C3c: 而C3c-M48现在被认为可能对应满清皇室(另外也不排除C3*,O3等可能),也可能对应晚期蒙古族扩张。C3c在北通古斯人群、蒙古族、哈萨克族、西蒙古诸部(绰罗斯部或卡尔梅克人中)比例较高。通常认为M48起源自通古斯人群中,随后扩散到现在的状态。“推测C3c真正的扩张大约是在1500年前,其中一支西迁丁零,参与突厥族群的形成,随着突厥的崛起、扩张而扩散开来,但C3c的大本营还是在贝加尔湖某段沿岸,后来大约到了13世纪蒙古族发迹崛起,蒙古族应该起源于C3c的大本营-贝加尔湖的某段沿岸,C3c随着蒙古族的扩张扩散到北亚各地。”

5 北方游牧民族Y组成

中国历史上面对北方民族主要有东胡系和西胡系两大支系,目前看Y-C3(C3*,C3c,C3d)和Y-O3(O3-M134*, O3-M117)是东胡系的主要组成部分。东胡系早期以Y-O3系为主,后期Y-C3系崛起。而西胡系则主要以Y-N和Y-R为主,间杂少量Y-J,G,P,Q等,匈奴等早期西胡系中也有可能有大量O3成分。“蒙古语诸人群正是高原东部(C3, C3c,O)和高原西北部人群(N,R)混合的结果。”

6 客家人Y组成

根据基因测试机构汇泽公司的一些数据,表明客家人高频单倍群主要有Y-N,R,O3-M134*,O3-M117,C3等。而这五种单倍群恰好与北方游牧民族的常见单倍群非常一致。我认为的汉人标志性单倍群Q1a1在客家人父系中缺失,汉人中常见的O2*、南方百越系的O1和北方土著东夷系的O3-002611等在客家人父系中低频或缺失,在新旧石器时期,南方也罕有O3-M134*,O3-M117的踪迹。这样的结果耐人寻味,以前认为客家人是真正的“中原汉人”,而现在分子人类学给出的数据看:
- 可以推测客家人主要源头可能是五胡十六国时期的五胡后裔。
- 至少客家人中的O3-M134*、O3-M117很可能是随N、R、C3一起从北方草原进入的,他们原本是在一起混的。

推测客家人南迁的原因,因为他们既受老汉人(Y-Q+老土著O3+O2*..)的排挤,因为汉人与五胡的历史仇杀相去不远,又受更新的来自北方的O3和C3(辽金,蒙元,满清)的欺负,所以他们选择了南迁成了客家人主要来源。而客家人单倍群组合与北方游牧民族的一致性,这里表现出来的对Y单倍群的选择,又揭示了客家人中O3系来源真相。


7 历史真相推测

结合华夏文明的缘起,如果宁夏彭阳Y-Q案例代表了一支中东文明部落迁徙到黄河上游的遗存,那么很多现象都可以迎然而解。唯一不好解释的Y-Q与mt-D4在中国现状的不平等。不过一个极可能的历史真相是:

Y-Q系在五胡乱华时期,大量消亡,而母系却被大量保留下来。西胡系Y-N和Y-R开始大量进入中国北方。后来又经过元清两朝O3和C3系大爆发,原来进入中原的N和R和部分O3、C3南迁,形成客家人主要来源,最后形成今天我们看到的汉族Y构成。

总的看,我觉得北方O3系的 变化可以分几个历史时期
1. 第一个历史时期,商周以前,华北以O3*,O3-002611,O2*为主。(O2*在当今汉族中低频,复旦研究结果证明三国时名人曹操Y类型应该是O2*,或许那时O2*也并不低频。)
2. 第二个历史时期,商周到两晋,Y-Q, O3-M134, O3-M117在华北比例大幅度上升。一部分O3-M134*和O3-M117也进入到草原。他们也是组成后来东胡系的主要力量部分。原初汉人主要组成部分可能有Y-Q,O2*,O3-002611,以及可能与Y-Q一道进入中原的O3-M134*,O3-M117。
3. 第三个历史时期,五胡到南北宋,北方民族起源的N,R,C3,O3-M134+,O3-M117+几个族群在北方先后建立政权,北方汉人中原初土著O3系成分减少,但又有一批新O3系从北方进入,总体上华北地区O3系趋平,但是Q和D系被大幅度减少。
4. 第四个历史时期,元朝以后, N + R + O3-M134 + O3-M117+ C3 ,主要以五胡后裔为主大部分南迁,成为客家人来源。新O3和C3在元朝以后得到大爆发,这与历史人口增长一致的。汉人中O3系“独大”或许与此有关。

而东胡地区似乎成为O3的补充基地,在历史阶段源源不断地向华北输送O3。华北地区的O3系基本可以分成以上四大波次补充。今天汉族中O3系组成中应是由这几次O3系输入混合组成。

8 蒙元和满清统治造成的影响。

现在一个大家已经基本接受的事实是蒙元和满清是以O3+C3为主的。根据网上透漏的复旦测试统计数据信息,另外一个现象是O3-M134*和O3-M117虽然诞生年龄古老,却又都表现出了某种意义上非常近的历史时期急剧扩张的特点。那么这种爆发与蒙元和满清对汉人的统治有没有关系呢?

到此就不得不提蒙古和满清统治制度了。蒙古和满清都是以少数民族统治绝大多数民族,他们为了能成功统治汉人,一方面对汉人采取了严加防范的政策,比如蒙古人规定汉人十户人才能共用一把菜刀,满清则干脆限制火器发展,因为满人研制不了,就限制汉人研制。另一方面他们在以人口少数统治多数的情况下,在人口方面有没有采取别类措施?以蒙古和满清对汉人的心态和手段看,这是完全可能的。

传说中蒙古人具有初夜特权。即在最基层,每个村子派一个蒙古家庭统治整个村子的汉人,汉族人姑娘要结婚,必须和这家蒙古人的男人睡三天觉,用文绉绉的语言说,就是这位姑娘的处夜权是属于蒙古人的;再有有论坛网友提出蒙古人发明了八八谷制度。即汉人抚养皇亲可免税,但皇亲自此成为受家一员,继承汉人姓氏和财产。

初夜权与八八谷制度结合起来,那么会造成怎样结果,可想而知。八八谷制度似乎不见于历史记载,蒙古满清不会说,汉人恐怕更不会说,但是其历史真实性却是非常可能存在的。

http://blog.sina.com.cn/s/blog_6a4e1c6f0100yl78.html
从孙子推爷爷是不严谨的
李辉从黄金家族族谱记载的某个现存后代身上测出了O3,就以此推论铁木真也是O3太草率,中间变数太大
今天的中国蒙古族有一半是C3 ,欧洲有几千万是C3

相反李辉对曹操家族的推论分析就严谨的多,不但有现代的异地多点检测,测出相关性,还从墓志明确记载的曹操爷爷辈牙齿测出相关性

按李辉说法,今天中国男人有一半是O3,O3历史上有三次分支人数爆发性增长,分别是6700年前,6100年前,5000年前,与史籍典故相对应,很可能对应的就是伏羲氏,神农氏,黄帝建立的三个统治时期

他说石卯的玉器有明显的良渚风格,良渚是同时期世界上最发达的文明,所以石卯可能是建立良渚文化的古百越人建立的边境大城,结合历史时期,推论夏朝可能是古百越人的后代建立的
曾广泛分布在东亚的棕色人种的消退 and 黄色人种的迁徙而来、取代、扩散过程

分子生物学方法是最准确的分析人群的起源的方法,比起沉迷于历史文献和民间传说的传统民族学,显然要准确和真实的多,传统民族学过于幻淫了。

本文主要从分子生物学的角度分析黄色人种的扩散,以及棕色人种迁徙的部分路线

在人类的十八种Y染色体单倍体类型中,一般认为,C—M130和D—YAP是第一批走出非洲的居民,代表了棕色人种的特征。他们曾经广泛分布在东亚地区。

O—M175与N—M231代表了现在黄种人人群的普遍单倍体类型,他们比棕色人种到达东亚时间晚,但他们发展的更快,也更成功。

人类第一批走出非洲的是C—M130,他们沿着海岸线走,是人类的先行者,至少5万年前,他们就已经来到了东亚。此后,黄色人种也从中亚人群中(黄+白)分化出来,并迅速进入东南亚地区(路径可能是穿过印度地区)。

后期伴随着黄色人种的成功,由于高产作物的种植和先进工具的使用,黄色人种人口数量开始爆炸。平原地区和温带地区,黄色人种迅速排除取代了棕色人种,由于过程时间特别短,两种人种甚至没发生融合,所以这些平原地区找不到棕色人种基因;而在高寒地区、高海拔高原山地、边缘海岛,由于气温低、氧气稀薄无法种植农作物或者大海阻隔无法到达,使得黄色人种无法在短时期内取代棕色人种,使得这个取代过程持续了几千甚至上万年,所以两个人种发生了交流,使得高寒地区(如蒙古地区)、高原山地(如西藏)、海岛(如日本),这些地区虽然最终黄色人种占据了优势,但棕色人种的成分却被大量保存了下来。

推测黄色人种和棕色人种扩散的路线(李辉)
4a8015f9dd290a18820b7.jpg

A图. 棕色人种大约10万年前走出非洲,至少在5万年之前已经来到东南亚;黄色人种(此时黄+白人群还没有开始分化)则是大约五万年前的时候开始向东迁徙;

B图. 大约4万年前,棕色人种已散布于东北亚到澳洲的广大地区,而黄色人种则进入了东南亚,路径最可能是中亚经过印度进入东南亚地区;

C图. 大约3万年前,黄色人种在东南亚、印度尼西亚次大陆和中国南方进一步扩张,而棕色人种可能有一部分已经来到美洲,注意:棕色人种此时没有停顿下来,他们也在扩散,但他们扩散的速度很慢,黄色人种扩散速度要快得多,后追过来的黄种人人群并把那些走的慢的部分吞没了;

D图. 大约2年前,黄色人种扩散到了整个东亚和东南亚地区,使该地区的棕色人种,除了高山和高寒地区、海岛地区外,都已经消失,北亚地区的棕色人种主体也被黄色人种大部分融合,成为黄种人;

E图. 大约1万年前,黄种人进入美洲,并成为美洲的主宰(注释:印地安人的mtDNA类型和东亚地区比较接近,而Y染色体介于黄色与白色中间,其中M120类型为印地安人和东亚人独有。);

F图. 在几千时间内,黄种人向中亚、北欧、印度洋和太平洋诸岛扩张,东亚最偏远地区(高山和海岛隔绝地区)的棕色人种也渐渐与黄种人融合,但印度洋上的安达曼群岛、马来群岛部分地区、澳大利亚还保存了棕色人种的基因。玻利尼西亚人都是黄棕混合的过渡类型,部分地区,黄色人种的成分略占优势,如汤加(82%是O—M175,比日本人还高),毛利人。另一支黄色人种则越过乌拉尔山,进入了北欧和东欧,在乌拉尔语系和斯拉夫语族中广泛分布他们的Y染色体(N—M214)。


附一:

地理大发现前的几大主要人种的地理分布图(李辉)
4a8015f90e0f313afc9bf.jpg

附二说明:O、N、C、D四种单倍体类型在现在黄色人种中的大致分布

今天,O—M175类型主要分布在东亚、东南亚、北亚东部、部分太平洋岛屿,人口超过15亿,传统黄色人种国家中,O—M175在除外蒙以外的所有东亚黄色人种国家中出现频率都超过了50%,日本为55.2%,韩国为67%,中国人主体类型就是O—M175,汉族人中超过80%!而且在汉族中O—M175类型中最多的是O3—M122,与周围其他民族并不相同,而与云南地区的许多民族有相似的地方,与羌族和一部分藏族(M122下的M134子类型)最为接近。

N—M231主要分布在,乌拉尔山两侧、北欧北部、东欧北部(主要是俄罗斯、芬兰、匈牙利、爱沙尼亚、萨米等民族)、西伯利亚、北极圈内的爱斯基摩人和汉族人中,在现在汉族人中,也存在N—M231和N—TAT。

今天,C—M130的后代主要分布在印度南部、北亚东部、日本、北美西部、澳大利亚、太平洋诸岛。在东亚地区,外蒙地区比例非常高,达到58%,还有哈萨克人、吉尔吉斯人、布里亚特人、比例都在60%以上,这些人群的类型(包括北美地区)都是C3—M217;M130的其他类型还有,C1-8M,主要在日本人中(6.5%)。C2—M38,主要分布在澳大利亚和太平洋诸岛屿,C4、C5主要分布在南印度地区,在当地民族中能达到20%。在现在汉族人中,M130的比例小于3%。

D—YAP又被称为矮黑人基因。现在D—YAP类型主要分布在印度安答曼群岛的安达曼人(100%)、苏门岛土著(20%)、藏族(58%)、彝族、瑶族中的勉人(50%)、日本(34.7%)、朝鲜、纳西族(31%),普米族(73%)。在汉族人中,D—YAP出现的频率小于1%。


http://blog.sina.com.cn/s/blog_4a8015f9010005ry.html


从Y染色体单倍体类型论证人类非洲起源和汉族的单一起源


第一部分:以Y染色体单倍体类型研究看非洲起源论

我先讲讲Y染色体单倍体类型的方式分析的原理和方法。

人有46条染色体,其中44条为常染色体,X、Y两条为性染色体。XY组合的为男性,XX组合的为女性,所以,Y染色体只能父子相传,我们研究Y染色体,可以比较清晰的发现人群的迁徙和发展。

为了研究Y染色体的单倍体类型,我们绘制了人类Y染色体谱系树,我们按着Y染色体单倍体的不同把全人类(包括非洲)分为18个类型(用从A到R十八个字母代表),出现频率高,数量多的类型单独列出(如O、N),把小概率出现的类型列入上级母类(如F、P),这也就是类型上有逻辑上重合的缘故,这样做是为了使分类清晰,分析方便!

人类Y染色体谱系树(图)
4a8015f9b5a43369293ce.jpg
非洲人是人类的大本营,今天,所有人类的Y染色体单倍体类型都能在非洲找到(M168\YAP\M130)。而非洲以外的居民,他们都是一支出非洲居民的后裔,他们的Y染色体上都带有M168的突变点。
4a8015f9df36bdb46c31b.jpg
从Y染色体单倍体类型论证人类非洲起源和汉族的单一起源


人类刚出非洲,都带有M168的变异点,此后,M168又发展出三个支系,C—M130、D—YAP、F—M89,它们下又有不同的子类型。

F—M89是现代人中占压倒性的类型,大概全世界80%以上的人都有这个变异点。

F—M89有很多子类型,其中,K—M9是最重要的一个支系,亚欧大陆上,除了西亚地区和西伯利亚,世界岛上绝大部分民族都由K—M9的子孙构成,今天中国人(汉族)中,96%的人都是K—M9类型。

K—M9下面也有很多子类型,最重要的有两个,一个是ON—M214,另一个是P—M45。
前者(ON—M214)主要分布在东亚、东南亚、北亚东部、部分太平洋岛屿(以上都是O—M175子类型)和乌拉尔山两侧、北欧北部、东欧北部和北极圈内的爱斯基摩人(以下都是N—M231子类型)。中国人主体类型就是O—M175。

后者(P—M45)主要分布在欧洲大部(R—M173子类型)、西亚的伊朗、南亚的印度(R1a—M17子类型)、美洲印地安人(Q—P36子类型)等地区。其中,R—M173(包括M17),被认为是原始雅利安人的基因。

推测的他们迁徙的路线(图)
4a8015f958397701c6e08.jpg
从Y染色体单倍体类型论证人类非洲起源和汉族的单一起源



回过头来再说最早的一支。

海洋居民,C—M130走的路线大概就是沿着海岸出发,从阿拉伯半岛—伊朗—印度—中南半岛,此后,这批M130的子孙分为两支系,NO.1支系向北进入西伯利亚,并最终进入了北美地区;NO.2支系向南进入澳大利亚,并扩散到整个太平洋诸岛。虽然我们的基因树上C—M130画的比较简单,但实际上C—M130并不单一,他们类型众多。


今天C—M130的后代主要分布在印度南部、北亚东部、日本、北美西部、澳大利亚、太平洋诸岛。在东亚地区,外蒙地区比例非常高,达到58%,还有哈萨克人、吉尔吉斯人、布里亚特人、比例都在60%以上,这些人群的类型(包括北美地区)都是C3—M217。C2—M38,主要分布在澳大利亚和太平洋诸岛屿,C4、C5主要分布在南印度地区,在当地民族中能达到20%。在现在汉族人中,M130的比例小于3%。

D—YAP又被称为小黑矮人基因,是一支非常古老的基因,它和C—M130几乎同时走出非洲。现在D—YAP类型主要分布在印度安答曼群岛的安达曼人(100%)、藏族(58%)、彝族、瑶族中的勉人、日本(34.7%)、朝鲜人。在汉族人中,D—YAP出现的频率小于1%。

推测的他们迁徙的路线(图)
4a8015f9c21427dee686f.jpg
从Y染色体单倍体类型论证人类非洲起源和汉族的单一起源

Y染色体变异数量多少并不能用人口数量来衡量,很多人口众多的大民族都是由一个小人群由于某种原因迅速壮大而来的,如历史上曾建立了强大帝国(典型的是汉人、阿拉伯人),近代的高技术革命和殖民(如英格兰人、西班牙人),这些人群的同源性强,Y染色体的变异类型并不特别丰富,相反,一些非常古老的小民族,其Y染色体变异类型却十分丰富。

亚欧大陆上主要民族(图中的chinese主要指汉族,外国人对中国的民族状态不太了解,和一般人的观念不同,汉族的基因构成恰恰是一个非常单一纯粹的民族,足以证明原来的汉族融合而成的理论是错误的)
4a8015f9c0c15ce25de27.jpg

第二部分,分子生物学的方法研究汉族人的民族起源和基因结构

今天的汉族人,占压倒性主体的是O—M175。

具体分析,在M175下还可以细分为最大三个子支系(其他N多小类型都不算):O1—M119、O2—M95、O3—M122。

这三个子类型地理分布很有意思:

O1—M119广泛分布在从北亚到东南亚,但在最中央的黄河流域竟几乎找不到!在贝加尔湖畔的布里亚特人,其O1—M119的比例最高,达34%,另外,北亚地区的外蒙、满州、朝鲜、日本、堪察加人等民族也有O1—M119类型,但一般比例不超过10%,中国南方,浙江、上海、福建等省份,O1—M119比例也较高。而在黄河流域的山东、河北地区的汉族人中,O1—M119类型的比例都小于5%,在陕西、山西、湖北等省,没有发现这种类型,出现频率为零,M119的分布呈现的是两头大中间少的格局。

O2—M95类型主要分布在东南亚地区,在泰国高达55%,从泰国向北在递减,从泰国向南也在递减,可以推论O2—M95变异最初出现在东南亚地区,并向西周扩散。在东亚地区,只在朝鲜人、日本人、阿穆尔人中有一定分布,其中,在日本人和朝鲜人中,O2为O2b,比例超过30%!在山东、河北、甘肃的汉族人群中,出现频率全部为零,找不到这种类型,在南方汉族人中,能找到出现概率非常低的M95。

O3—M122类型是数量最多,分布最广的一种。从北亚向南到爪哇、新西兰,从日本向西到西藏、哈萨克人,全部能找到O3—M122的分布。

从出现频率上看,O3—M122的出现频率最高地区为中国的云南地区、印度的那加邦土著民族上,很多民族中出现频率为100%,如独龙族等。在黄河流域的河北、陕西、山东,长江流域的湖北、安徽、四川、江西等地区的汉族人中,O3—M122都超过了80%。在北亚地区,O3—M122数量比较少,外蒙人中超过了30%,阿穆尔人也超过了40%,以及朝鲜人,除这三个人群外其他都比较少,在艾温基人出现频率为零,在布里亚特人也为零,在日本人中为22%。在东南亚地区,M122数量比较多,只有泰国、柬埔寨等地区略少,其他地区一般超过50%,出现频率从中国向南逐渐递减,到了爪哇人中出现频率只有20%,在汤加、新西兰的毛利人人也有出现,但比例都不大。

M175这三个子类型的地理分布告诉我们一个信息,我们可以推论出东亚各民族的发展史。


东亚黄种人开始可能分为四个大集团:北亚人群、黄河上游人群、黄河下游人群、中南半岛人群。

北亚人群代表了阿尔泰语系的民族,由于生活在气候寒冷地区,无法种植农作物,其他人群都无法涉足,所以很难取代他们。

黄河上游集团代表了古代汉藏语系民族(先羌,标志性基因O3—M122),黄河下游集团也是一个古老人群,他们特有的是O1—M119。大约在6~5千年前,古代汉藏语系先民开始分化,一支向西、向南发展,成为了藏缅语族、另一支向东发展,就是汉语族。汉语族部落并击败了黄河下游的古老居民,这些具有M119的民族失败后开始分化为两支,北支M119进入了辽河流域,并深深影响了西伯利亚和北亚居民的基因构成,成为阿尔泰语系民族中普遍存在的基因,南支M119向南发展,成为后来的“百越”。从此,M119基因从黄河流域消失,取代他的是带有M122的先羌人(汉语族部落)。

这段部族迁徙史,也许就是我们民间口口相传的著名的黄帝战胜蚩尤的历史传说!虽然我们找不到当年的战争遗迹,但我们完全可以找到吻合的考古和基因的证据:考古上,山东的大汶口文化从此消失了,取代它的正是从陕西河南来的龙山文化,此后山东存在的文化就是山东龙山文化!在基因上,证据更加明显,山东、河北两省的汉族人中M122和M119的比例接近50:1,超过95%人以上都是随黄帝东来者(先羌部落,M122类型)的后代。

经过这次原始的部落战争,汉语族的各部族控制了整个黄河流域,他们建立了数量众多的方国,这种状态持续了大约近2000年。大概在距今3100年前,一支小部落从甘肃天水迁徙到了陕西周原,就是周族人。他们在周武王的带领下,周族人消灭了商朝。灭商后,周武王率领300辆战车和5000虎贲,用了三年时间,消灭了99个方国,征服了652个方国,俘虏了410万战俘《逸周书·世俘解第四十》。在此后的一百多年间,西周分封了大量诸侯国,周族也随着分封扩散到了全国。

周族人称自己国家是“有夏”,此后各诸侯国都自称“有夏”,对外统称自己“诸夏”,夏者,本意是区域广大。周族自称自己的本民族为“华”,称外族为“夷”(异),此后凡是与周族有同源关系的血亲部族都开始自称“华胄”,称外族为“非类”“夷(异)人”,意思是非华族类,华者,本意就是高贵壮丽。从此,“华夏”也就成了这些诸侯国的统称,这也是中华人民共和国中“中华”两字的来历。周族人的语言叫“雅语”(夏语),在全国通行,孔子讲学,学生来自不同的诸侯国,但孔子的话他们都听得懂,因为孔子说的是当时的普通话——“雅语”,这在《论语》里有:“子所雅言”的话,不说“雅语”就是被称为“野言”“非文”,由于有着交流需要和文学推进,“雅语”最终成为了全国通用的语言,也就是后来我们说的汉语。到了公元前221年,秦始皇最终将这些互相强烈认同的割据国家统一起来,后来又经过汉朝的统一和强盛,华夏族终于发展成为汉族。

先秦的发展,使得汉语族各支系语言全部统一到周族的“雅语”下,经过长期的融合,不断的人口迁徙,到今天,长江以北的汉族人,各地之间差异已经非常小了,从山东到甘肃,都没什么差异。

秦汉以后,中原王朝开始了对长江以南地区的军事和政治控制,大量的汉族移民开始迁往南方,今天,南北汉族在Y染色体上差异很小,90%的相似性,也就是南北方汉族父系都是同源的。南北汉族的差异主要体现在mtDNA上,也就是母系来源上。

简单的说,南方汉族基本可以表示为=父系(北方汉族Y染色体)+母系(北方汉族线粒体mtDNA+溶入的南方很多的民族的线粒体mtDNA),南方汉族不但和北方汉族在mtDNA上有差异,其实他们之间也不同,湖南的汉族和福建的汉族mtDNA就不同,甚至同是广东人,广府人和客家人在mtDNA上也不同。

怎么解释11亿南北汉族人在父系上全部同源而母系上差异明显呢?其实也很简单,看看50年代时内地人迁往拉萨的情况,当时的规定,进藏只有部队团级以上干部、地方处级以上干部才可以带家属,那些年青战士和青年工人由于无法带家属,他们娶的都是当地的藏族女青年,今天拉萨、日喀则等地有大量汉藏混血儿,他们青一色都是父汉母藏,就是由于这个原因。

这在汉族南迁的历史也是类似的,迁往南方的汉族主要是由于服兵役、逃避战乱、因罪流放等因素,这些人基本都是男性,带家属的情况不多,所以他们肯定是娶了当地的女性,就造成了南方汉族有着和北方汉族相同的父系祖先,却有不同的母系祖先。(其实总体来看,在南方,来自北方汉族母系的mtDNA还是占多数,也就是一半以上的南方汉族其母系祖先也是来自中原地区的,但个别地区这个比例很少,而南方当地女性的mtDNA部分地区却可以达到85%,如广东的一些地区)。

金力李辉(复旦大学)等人的论文,汉族人迁徙模式,南迁图例
4a8015f98437035478615 (1).gif

http://blog.sina.com.cn/s/blog_4a8015f9010005rx.html

从Y染色体单倍体类型论证人类非洲起源和汉族的单一起源


第一部分:以Y染色体单倍体类型研究看非洲起源论

我先讲讲Y染色体单倍体类型的方式分析的原理和方法。

人有46条染色体,其中44条为常染色体,X、Y两条为性染色体。XY组合的为男性,XX组合的为女性,所以,Y染色体只能父子相传,我们研究Y染色体,可以比较清晰的发现人群的迁徙和发展。

为了研究Y染色体的单倍体类型,我们绘制了人类Y染色体谱系树,我们按着Y染色体单倍体的不同把全人类(包括非洲)分为18个类型(用从A到R十八个字母代表),出现频率高,数量多的类型单独列出(如O、N),把小概率出现的类型列入上级母类(如F、P),这也就是类型上有逻辑上重合的缘故,这样做是为了使分类清晰,分析方便!

人类Y染色体谱系树(图)
4a8015f9b5a43369293ce.jpg
非洲人是人类的大本营,今天,所有人类的Y染色体单倍体类型都能在非洲找到(M168\YAP\M130)。而非洲以外的居民,他们都是一支出非洲居民的后裔,他们的Y染色体上都带有M168的突变点。
4a8015f9df36bdb46c31b.jpg
从Y染色体单倍体类型论证人类非洲起源和汉族的单一起源


人类刚出非洲,都带有M168的变异点,此后,M168又发展出三个支系,C—M130、D—YAP、F—M89,它们下又有不同的子类型。

F—M89是现代人中占压倒性的类型,大概全世界80%以上的人都有这个变异点。

F—M89有很多子类型,其中,K—M9是最重要的一个支系,亚欧大陆上,除了西亚地区和西伯利亚,世界岛上绝大部分民族都由K—M9的子孙构成,今天中国人(汉族)中,96%的人都是K—M9类型。

K—M9下面也有很多子类型,最重要的有两个,一个是ON—M214,另一个是P—M45。
前者(ON—M214)主要分布在东亚、东南亚、北亚东部、部分太平洋岛屿(以上都是O—M175子类型)和乌拉尔山两侧、北欧北部、东欧北部和北极圈内的爱斯基摩人(以下都是N—M231子类型)。中国人主体类型就是O—M175。

后者(P—M45)主要分布在欧洲大部(R—M173子类型)、西亚的伊朗、南亚的印度(R1a—M17子类型)、美洲印地安人(Q—P36子类型)等地区。其中,R—M173(包括M17),被认为是原始雅利安人的基因。

推测的他们迁徙的路线(图)
4a8015f958397701c6e08.jpg
从Y染色体单倍体类型论证人类非洲起源和汉族的单一起源



回过头来再说最早的一支。

海洋居民,C—M130走的路线大概就是沿着海岸出发,从阿拉伯半岛—伊朗—印度—中南半岛,此后,这批M130的子孙分为两支系,NO.1支系向北进入西伯利亚,并最终进入了北美地区;NO.2支系向南进入澳大利亚,并扩散到整个太平洋诸岛。虽然我们的基因树上C—M130画的比较简单,但实际上C—M130并不单一,他们类型众多。


今天C—M130的后代主要分布在印度南部、北亚东部、日本、北美西部、澳大利亚、太平洋诸岛。在东亚地区,外蒙地区比例非常高,达到58%,还有哈萨克人、吉尔吉斯人、布里亚特人、比例都在60%以上,这些人群的类型(包括北美地区)都是C3—M217。C2—M38,主要分布在澳大利亚和太平洋诸岛屿,C4、C5主要分布在南印度地区,在当地民族中能达到20%。在现在汉族人中,M130的比例小于3%。

D—YAP又被称为小黑矮人基因,是一支非常古老的基因,它和C—M130几乎同时走出非洲。现在D—YAP类型主要分布在印度安答曼群岛的安达曼人(100%)、藏族(58%)、彝族、瑶族中的勉人、日本(34.7%)、朝鲜人。在汉族人中,D—YAP出现的频率小于1%。

推测的他们迁徙的路线(图)
4a8015f9c21427dee686f.jpg
从Y染色体单倍体类型论证人类非洲起源和汉族的单一起源

Y染色体变异数量多少并不能用人口数量来衡量,很多人口众多的大民族都是由一个小人群由于某种原因迅速壮大而来的,如历史上曾建立了强大帝国(典型的是汉人、阿拉伯人),近代的高技术革命和殖民(如英格兰人、西班牙人),这些人群的同源性强,Y染色体的变异类型并不特别丰富,相反,一些非常古老的小民族,其Y染色体变异类型却十分丰富。

亚欧大陆上主要民族(图中的chinese主要指汉族,外国人对中国的民族状态不太了解,和一般人的观念不同,汉族的基因构成恰恰是一个非常单一纯粹的民族,足以证明原来的汉族融合而成的理论是错误的)
4a8015f9c0c15ce25de27.jpg

第二部分,分子生物学的方法研究汉族人的民族起源和基因结构

今天的汉族人,占压倒性主体的是O—M175。

具体分析,在M175下还可以细分为最大三个子支系(其他N多小类型都不算):O1—M119、O2—M95、O3—M122。

这三个子类型地理分布很有意思:

O1—M119广泛分布在从北亚到东南亚,但在最中央的黄河流域竟几乎找不到!在贝加尔湖畔的布里亚特人,其O1—M119的比例最高,达34%,另外,北亚地区的外蒙、满州、朝鲜、日本、堪察加人等民族也有O1—M119类型,但一般比例不超过10%,中国南方,浙江、上海、福建等省份,O1—M119比例也较高。而在黄河流域的山东、河北地区的汉族人中,O1—M119类型的比例都小于5%,在陕西、山西、湖北等省,没有发现这种类型,出现频率为零,M119的分布呈现的是两头大中间少的格局。

O2—M95类型主要分布在东南亚地区,在泰国高达55%,从泰国向北在递减,从泰国向南也在递减,可以推论O2—M95变异最初出现在东南亚地区,并向西周扩散。在东亚地区,只在朝鲜人、日本人、阿穆尔人中有一定分布,其中,在日本人和朝鲜人中,O2为O2b,比例超过30%!在山东、河北、甘肃的汉族人群中,出现频率全部为零,找不到这种类型,在南方汉族人中,能找到出现概率非常低的M95。

O3—M122类型是数量最多,分布最广的一种。从北亚向南到爪哇、新西兰,从日本向西到西藏、哈萨克人,全部能找到O3—M122的分布。

从出现频率上看,O3—M122的出现频率最高地区为中国的云南地区、印度的那加邦土著民族上,很多民族中出现频率为100%,如独龙族等。在黄河流域的河北、陕西、山东,长江流域的湖北、安徽、四川、江西等地区的汉族人中,O3—M122都超过了80%。在北亚地区,O3—M122数量比较少,外蒙人中超过了30%,阿穆尔人也超过了40%,以及朝鲜人,除这三个人群外其他都比较少,在艾温基人出现频率为零,在布里亚特人也为零,在日本人中为22%。在东南亚地区,M122数量比较多,只有泰国、柬埔寨等地区略少,其他地区一般超过50%,出现频率从中国向南逐渐递减,到了爪哇人中出现频率只有20%,在汤加、新西兰的毛利人人也有出现,但比例都不大。

M175这三个子类型的地理分布告诉我们一个信息,我们可以推论出东亚各民族的发展史。


东亚黄种人开始可能分为四个大集团:北亚人群、黄河上游人群、黄河下游人群、中南半岛人群。

北亚人群代表了阿尔泰语系的民族,由于生活在气候寒冷地区,无法种植农作物,其他人群都无法涉足,所以很难取代他们。

黄河上游集团代表了古代汉藏语系民族(先羌,标志性基因O3—M122),黄河下游集团也是一个古老人群,他们特有的是O1—M119。大约在6~5千年前,古代汉藏语系先民开始分化,一支向西、向南发展,成为了藏缅语族、另一支向东发展,就是汉语族。汉语族部落并击败了黄河下游的古老居民,这些具有M119的民族失败后开始分化为两支,北支M119进入了辽河流域,并深深影响了西伯利亚和北亚居民的基因构成,成为阿尔泰语系民族中普遍存在的基因,南支M119向南发展,成为后来的“百越”。从此,M119基因从黄河流域消失,取代他的是带有M122的先羌人(汉语族部落)。

这段部族迁徙史,也许就是我们民间口口相传的著名的黄帝战胜蚩尤的历史传说!虽然我们找不到当年的战争遗迹,但我们完全可以找到吻合的考古和基因的证据:考古上,山东的大汶口文化从此消失了,取代它的正是从陕西河南来的龙山文化,此后山东存在的文化就是山东龙山文化!在基因上,证据更加明显,山东、河北两省的汉族人中M122和M119的比例接近50:1,超过95%人以上都是随黄帝东来者(先羌部落,M122类型)的后代。

经过这次原始的部落战争,汉语族的各部族控制了整个黄河流域,他们建立了数量众多的方国,这种状态持续了大约近2000年。大概在距今3100年前,一支小部落从甘肃天水迁徙到了陕西周原,就是周族人。他们在周武王的带领下,周族人消灭了商朝。灭商后,周武王率领300辆战车和5000虎贲,用了三年时间,消灭了99个方国,征服了652个方国,俘虏了410万战俘《逸周书·世俘解第四十》。在此后的一百多年间,西周分封了大量诸侯国,周族也随着分封扩散到了全国。

周族人称自己国家是“有夏”,此后各诸侯国都自称“有夏”,对外统称自己“诸夏”,夏者,本意是区域广大。周族自称自己的本民族为“华”,称外族为“夷”(异),此后凡是与周族有同源关系的血亲部族都开始自称“华胄”,称外族为“非类”“夷(异)人”,意思是非华族类,华者,本意就是高贵壮丽。从此,“华夏”也就成了这些诸侯国的统称,这也是中华人民共和国中“中华”两字的来历。周族人的语言叫“雅语”(夏语),在全国通行,孔子讲学,学生来自不同的诸侯国,但孔子的话他们都听得懂,因为孔子说的是当时的普通话——“雅语”,这在《论语》里有:“子所雅言”的话,不说“雅语”就是被称为“野言”“非文”,由于有着交流需要和文学推进,“雅语”最终成为了全国通用的语言,也就是后来我们说的汉语。到了公元前221年,秦始皇最终将这些互相强烈认同的割据国家统一起来,后来又经过汉朝的统一和强盛,华夏族终于发展成为汉族。

先秦的发展,使得汉语族各支系语言全部统一到周族的“雅语”下,经过长期的融合,不断的人口迁徙,到今天,长江以北的汉族人,各地之间差异已经非常小了,从山东到甘肃,都没什么差异。

秦汉以后,中原王朝开始了对长江以南地区的军事和政治控制,大量的汉族移民开始迁往南方,今天,南北汉族在Y染色体上差异很小,90%的相似性,也就是南北方汉族父系都是同源的。南北汉族的差异主要体现在mtDNA上,也就是母系来源上。

简单的说,南方汉族基本可以表示为=父系(北方汉族Y染色体)+母系(北方汉族线粒体mtDNA+溶入的南方很多的民族的线粒体mtDNA),南方汉族不但和北方汉族在mtDNA上有差异,其实他们之间也不同,湖南的汉族和福建的汉族mtDNA就不同,甚至同是广东人,广府人和客家人在mtDNA上也不同。

怎么解释11亿南北汉族人在父系上全部同源而母系上差异明显呢?其实也很简单,看看50年代时内地人迁往拉萨的情况,当时的规定,进藏只有部队团级以上干部、地方处级以上干部才可以带家属,那些年青战士和青年工人由于无法带家属,他们娶的都是当地的藏族女青年,今天拉萨、日喀则等地有大量汉藏混血儿,他们青一色都是父汉母藏,就是由于这个原因。

这在汉族南迁的历史也是类似的,迁往南方的汉族主要是由于服兵役、逃避战乱、因罪流放等因素,这些人基本都是男性,带家属的情况不多,所以他们肯定是娶了当地的女性,就造成了南方汉族有着和北方汉族相同的父系祖先,却有不同的母系祖先。(其实总体来看,在南方,来自北方汉族母系的mtDNA还是占多数,也就是一半以上的南方汉族其母系祖先也是来自中原地区的,但个别地区这个比例很少,而南方当地女性的mtDNA部分地区却可以达到85%,如广东的一些地区)。

金力李辉(复旦大学)等人的论文,汉族人迁徙模式,南迁图例
4a8015f98437035478615 (1).gif

http://blog.sina.com.cn/s/blog_4a8015f9010005rx.html
从Y染色体的结构看日本的种族起源

对于日本人,国人一般只有两种认识:一是对小日本嗤之以鼻;二是认为日本人来自徐福的3000童男童女。对第一种观点,谁都不便作出肯定或者否定的回答,对与日本来自徐福的观点,我倒是想说上两句。

据民间传说,秦始皇统一中国以后,为了寻求长生不老药,派徐福率领3000名童男、童女,乘由50艘船组成的庞大船队,并携带能射杀鲸鱼的大弩,向东去寻找长生之药。结果徐福东渡日本,什么也没有找到。徐福想打道回府,有手下提醒他,你没有完成始皇帝交办的差事,回去必然被杀,不如干脆留下来,因此,徐福和3000童男女就留下了,发展成为了日本民族。
这种传说无疑是没有根据的,在秦始皇以前,日本地区已经有了人类居住,日本人自己管这段历史叫“绳纹时代”,那是石器时代,当时的人种可能就是现在阿伊努人(Ainu),他们已经在日本生活了超过一万年。
4a8015f96682803fb7cb5.jpg
从Y染色体的结构看日本的种族起源

这些人种的生活习惯介于北极土著民族和澳大利亚土著民族之间,原来没有人知道他们的来源。不过现在,由于分子生物学的发达,通过对Y染色体单倍体的研究,我们终于能够了解到他们的起源,并最终清楚了整个日本人的种族起源。

在人类主干的18个Y染色体类型中,日本人Y染色体结构是:
O—M175    54.2%
D—YAP     34.7%
C—M130     8.5%
其他        1.6%
阿伊努人(Ainu)
D+C         
4a8015f9d15259acee92f.jpg
从Y染色体的结构看日本的种族起源

从这些数据我们可以看出,日本人最早的父系祖先来自石器时代的阿伊努人(Ainu),那些土著居民。

O—M175我们就太熟悉,一目了然,这是亚洲大陆居民的基因。这些和日本自己的考古也能吻合,公元前2世纪至公元3世纪,日本历史进入弥生时代,大陆移民带来了铁器,他们构成了现在日本民族的基础,55%的日本人父系来自这一批移民。   

但O—M175在很多地方都有,这批移民可能来自汉族、朝鲜族、“百越”、马来西亚、印度尼西亚等民族,都有可能,到底来自哪里呢?幸好O—M175有很多变异子类型,我们可以根据子类型鉴别日本人具体的来源。

在O—M175最主要的三个子类型中,分别在日本人中出现的频率是:
O2—M95    31.7%
O3—M122   20.1%
O1—M119    3.4%

从这里,我们就可以明确的看出,日本人中,O2是大于O3的,而且O2是日本人最主要的基因基础。那么我们首先可以排除了汉族和藏族,我们知道,汉藏语系民族主要是O3的发源地,很多汉藏语系的民族O3的出现频率是100%,汉族人中O3普遍高于70%,部分地区高于80%,而在日本人中只有20%。

从30%的O2,20%的O3,这个比例和很多民族相似,如泰国、越南、朝鲜,都很相似,单凭这一点不好判断,但好在还有O2b,这在日本人中出现的频率达到31%,所以不可能来自越南、泰国,这些民族中不存在这么O2b,只有一个可能,那就是来自朝鲜半岛。日本人的Y染色体构成最接近朝鲜人。

那么我们对日本人的种族起源就有了比较明确的答案:
4a8015f9ad6889ebeb70d.jpg
从Y染色体的结构看日本的种族起源

一万年前,日本地区的居民是阿伊努人(Ainu)87%的D,13%的C,他们人数很少,从事着渔猎,他们的近亲属是澳大利亚的棕色人种。他们创造了绳纹文化,带来了陶器,这种状态持续了数千年,并有一部分后来随着朝鲜人的迁入再次进入了日本,今天,分数批到达的D—YAP,他们在日本人的父系成分中占有一定比例,这些居民的近亲是印度洋安达曼群岛的“小黑人”,巴布亚新几内亚的民族。

在公元前2世纪至公元3世纪,带有铁器的大陆黄色人种通过朝鲜半岛,越过海峡进入了日本,他们带来了文化,由于有铁器和进步工具,他们很快就并融合了原来的居民,形成了日本民族的基础,今天日本人一半以上的父系祖先来自这批移民。

此后,来自大陆的汉族人和汉化了的朝鲜人,他们被称为“归化人”,其他部族被称为“化外人”,这些人来到了日本,时间大约是公元三四世纪到六七世纪,他们带来了汉字和先进制度,当然也有先进的武器。日本进入了“古坟文化”,在“归化”程度最深的大和,最终以畿内为中心,依靠先进管理制度和武器,统一了日本,日本民族最终形成。


http://blog.sina.com.cn/s/blog_4a8015f9010005s8.html
“可能”?
可能你说错了
都是什么破东西,用DNA来论证历史,现在可以说还是非常可疑。这几十年来我见得太多了,每几年就抛一个理论,最后都是瞎扯,现在还太早。连非洲起源论等等根本的理论,都没有很强的依据,其他的就更别扯了。
营证 发表于 2016-2-27 09:20
都是什么破东西,用DNA来论证历史,现在可以说还是非常可疑。这几十年来我见得太多了,每几年就抛一个理论 ...

这个文章的意思是,国内网络血统沙文主义者们这十来年的自HIGH理论崩塌了
栏主自己贴的2楼和4楼的东西,本身就是互相矛盾的(黄种人的起源地),不知道能拿来说明什么?

基因的"研究",看看就好,用它来赞成或者反对什么,都谈不上什么定论。这个学科还太年轻,采集的标本数量太少,历史数据太少(绝大多数是当代人的snap shot,和对它的一些片断研究 ,缺乏与之对应的历史样本比较),研究的深度太浅(多少亿的dna片断,研究过多少?都有什么意思?)。



楼主贴的文章屁股问题一看就知道,,内蒙古蒙古族那么多o3,难道不是晋商的原因,草原喜欢用老婆招待中原商人!
我们稍微仔细一点,2楼

黄种人并不是起源于东南亚,。。。,只是在5000年前以后,蒙古人种(黄种人)才从中亚方向进入华北,华北和北亚Y-O3系被黄化,后来黄种人南下,蒙古人种才出现在东南亚,这是很近的事情。


4楼

。。。此后,黄色人种也从中亚人群中(黄+白)分化出来,并迅速进入东南亚地区(路径可能是穿过印度地区)。


这门“科学”,基本上是你可以随便说。老实讲,我也没从中看出用基因怎么证明东亚人来自中亚的?不过考古倒是比较明确的指向这点,那么除此之外,这个基因“科学”,还有什么贡献?胡说一气而已。
snickers 发表于 2016-2-27 10:16
这个文章的意思是,国内网络血统沙文主义者们这十来年的自HIGH理论崩塌了
你可以去看看这个博客是所有文章,屁股坐向游牧民族的倾向特别明显。
游牧民族,历史上无时无刻不掠夺中原人口,有中原人基因很奇怪吗?文章中有很多狗屁不通的说法!譬如史记中匈奴入关掠夺人口记载多少次,拿这个说明匈奴人的基因简直是缘木求鱼。
狗屁不通的文章,历史上游牧民族掠夺中原人口太多,怎么没有考虑对游牧民族dna影响呢?还有,拿新中国大批汉改少后的dna来说明游牧民族的dna,简直是缘木求鱼!


既然瞎说什么初夜权,那么我也说草原上o3很多是晋商的功劳,
藏族喇嘛对蒙古人的o3贡献也不可忽视
栏主自己贴的2楼和4楼的东西,本身就是互相矛盾的(黄种人的起源地),不知道能拿来说明什么?

基因的" ...
这是最容易出大神的时候
就看谁能提出“相对论”
虽然从Y讲,客家人与满人可能来自于一个很近的共同源头,历史就是这么搞笑!”

脸都不要了,不谈y染色体O3-F444和鲜卑屁都联系不起来,现在满八旗o2,c系占多数。

颜射 发表于 2016-2-27 12:51
这是最容易出大神的时候
就看谁能提出“相对论”


别转这种明显屁股决定立场的文章,分子人类学论坛上有很多好文章,不是这种乱扯淡的文章!

你翻看二楼博客其他的文章,都是游牧民族输血论的那套。
颜射 发表于 2016-2-27 12:51
这是最容易出大神的时候
就看谁能提出“相对论”


别转这种明显屁股决定立场的文章,分子人类学论坛上有很多好文章,不是这种乱扯淡的文章!

你翻看二楼博客其他的文章,都是游牧民族输血论的那套。

颜射 发表于 2016-2-27 12:51
这是最容易出大神的时候
就看谁能提出“相对论”


二楼转载的博客中写O3-F444是鲜卑,客家人是鲜卑后裔,看看测量的结果!

1.png

客家人地区怎么还比全国大多数地方的比例低呢
颜射 发表于 2016-2-27 12:51
这是最容易出大神的时候
就看谁能提出“相对论”


二楼转载的博客中写O3-F444是鲜卑,客家人是鲜卑后裔,看看测量的结果!

1.png

客家人地区怎么还比全国大多数地方的比例低呢
hanfu123 发表于 2016-2-27 13:17
别转这种明显屁股决定立场的文章,分子人类学论坛上有很多好文章,不是这种乱扯淡的文章!

你翻看二 ...
在Y染色体上找到了一个可遗传的突变,人类怎么确定这个突变发生的时间?
十五从军征 发表于 2016-2-27 17:39
在Y染色体上找到了一个可遗传的突变,人类怎么确定这个突变发生的时间?
主楼第二个视频41分开始

平均约140年变异一个点
颜射 发表于 2016-2-27 18:07
主楼第二个视频41分开始

平均约140年变异一个点
我去看一下。
hanfu123 发表于 2016-2-27 13:24
二楼转载的博客中写O3-F444是鲜卑,客家人是鲜卑后裔,看看测量的结果!
这是一个新学科诞生不久
各方提出各种假说的时候
颜射 发表于 2016-2-27 18:07
主楼第二个视频41分开始

平均约140年变异一个点
“这500万个点上面呢,按照概率计算的话,应该是每分离140年左右就会产生一个点的差异”
这里面提到的概率是什么概率?怎么计算的?
变异点时间间隔的选取,其内在的科学原理是什么?

以前看走出非洲时就是弄不清怎么计算变异点之间的时间间隔。毕竟人和人所处的环境不一样,基因突变的快慢也不同。


对于Y染色体特征变异对追溯种族起源价值与意义的深层次思考


一、从汉族的起源和扩张说起
几年前,在网上出现了一篇爆炸性的探讨“汉族”起源和扩张过程的学术文章《遗传学证实汉文化的扩散源于人口扩张》。其结论令人惊诧:即汉族起源于北方后,在历史上历经多批次南迁扩张过程,以致在父系遗传方面基本取代南方原住民族成分,不仅从文化而且从血统方面融合并造就出世界最大种族。其数据统计分析结果亦令人震惊!南方各省原住民族父系的遗传贡献无一超过50%,而最南端的广西的仅达到40%!
作为一个对人类学和遗传学有着浓厚兴趣和多年研究的爱好者,一个通晓统计学基本原理的人,理智和直觉都告诉我这其中定有重大问题存在。首先我注意到数据结果下面有一段关键性的解释:
把南方原住民族和北方汉族作为南方汉族的亲本群体估计北方汉族的遗传贡献比例,假定2000 多年前开始的混合过程前后南方原住民族的等位基因频率基本不变,并且南北汉族之间的遗传交流不多。实际上,从北方汉族到南方原住民族的基因流动比反向的流动大得多,所以表中的估计值在没有适当调整前是低估的。因而汉族实际的人口扩张程度应该大于本项研究得出的数值。
从中我们可以注意到几个基本问题:

1. 北方汉族作为南方汉族的亲本之一
也就是说北汉是father,南汉是son。这个主观的假设与我已经知道的从体质人类学(包括牙型)多项研究一致指向的,亚洲人起源于东南亚的结果相违背。

2.把研究的问题框定为2000年前开始的南北民族的融合过程
但是遗传记录的却是自东亚人祖先出非洲以来几万年来基因变异重组的层层叠叠沉积下来的复杂密码,又岂是短短2000年的跨度所能囊括的?

3.认定南北汉族之间的遗传交流不多。
事实上就现在的研究结果已经可以知道汉族是一个很“新”的民族(我不知道用“种族”来描述是否恰当?)。所以这个假设只能是为了使数据统计过程能够“合理”进行下去的必要和必须的前提。我想这个前提的支撑力非常脆弱,几乎不堪一击!另外大力兄透露了很重要的一点,即本文的研究者们的采样范围全部来自城市,这更是一个致命的缺陷。
接下去为了推断各地区人群有多少北汉成分,则根据统计学原理,必须恰当地设定一个纯血统“北方汉族”的参照系。至于这个参照系如何确定,偶不得而知:有可以直接取自被认为华夏起源的河南某地,也有可能取被认为是传统上认为是典型北汉的陕甘冀鲁豫的部分地区。但具体如何选择应该不是最关键性问题。
在薛雅丽的文章中不难看出:所谓北方汉族也好,北方少数民族也好,其实都是南北两大谱系(可能还要加上中亚谱系)的中间过渡形态,只不过北汉混合均匀些,北少混合较少而差异更大些而已。
于是,“汉族”这个参照系就变成了一个“四不象”:无论南来还是北来的成分都被默认为“原本如此”源出中原地区,把son当成了father和grandfather。而事实上华北,特别是传统上认定的汉族起源的河南中原一带恰恰是混血很复杂的地区。照此分析推导,当然大量南方本来固有的可以视为北汉father的成分(如O3和一部分O2)都会被一股脑地计入原“汉族”成分。
所以此文最深层的问题在于出发点就很主观,导致从抽样到分析过程中一系列的问题。只要一旦设定“北汉是南汉的亲本”、“2000年以内的迁徙与融合”、“南汉北汉遗传交流不多”,再外加一个为保证南汉血统可靠而全部从城市采样的隐性缺陷,从统计学的角度来说,即便不做数据分析和推导,其结论的谬误也已经笃定了!

二、极具父系社会特性的Y染色体会说谎吗?
虽然《遗传学证实汉文化的扩散源于人口扩张》的结论如此不堪一击,但是它却引发我思考一个深层次的问题:Y染色体对研究种族形成就那么可靠吗?是Y染色体、mtDNA/线粒体,或是常染色体(如GM血型系统)更有价值呢?
在相关的读物如《出非洲记》里,分子人类学专家已经很精辟地总结了Y染色体遗传标记的种种特性:单一父系遗传,是具有社会性的遗传标记,所以最适合用来追踪种族迁徙演变历程。但是如果是一个历史上经历多次混杂所形成的族群呢?我坚持认为一个Y染色体标记是绝对不能代表全部的!
事实上从以往的日本学者所作的GM血型分布图,卡瓦利"斯福扎和中科院遗传所共同完成的《中国人群基因频率主成分分析》,以及薛雅丽的新近发表的《东亚地区男性统计调查》,都一致说明常染色体(或常染色体和Y染色体共同)的诸多研究一致指向“南、北人群在遗传上存在显著差异”的这个结论,而与Y染色体特征标记O*在东亚的广泛分布的结果(见下图)大相径庭!

4fb8a26143ee4902d6a4b.jpg
4fb8a26143ee490990592.jpg
4fb8a26143ee490aa9a40.jpg
4fb8a26106cb074d6e4bb.jpg
4fb8a26143ee490768ad6.jpg

这里面的问题究竟在哪里呢?难道是Y染色体在说谎吗?

三、对Y染色体的强大覆盖力和盘踞力的探讨
对上面这个问题,我想我不是法官,Y染色体也不会说话,我是没有办法从它那里得到任何有价值的信息的。但是Y染色体因其单一父系遗传而具有其他各种染色体标记均无法比拟的“父系社会性”而引发了我接下来的思考。
随着和各位同好们研讨的深化,我越来越意识到可能犯了个愚蠢的想当然的错误:分子人类学者首先从Y染色体开始入手研究人类大迁徙是没错的,但是(不管是谁!)要是把它当作研究现代族群血统成分构成的准确标记,就大错特错了!《遗传学证实汉文化……》就是一个典型的例子。
受限于自己并非专业学者和现有公开资料的限制,我只能在这里提出两种理论上可能性的假说,有待下一步科学研究的进一步证实。

1.Y染色体覆盖假说
这是我对O3形成的思考。
假设在西南部地区有一群携带O3标记的南亚人,当他们发展出农耕文化后,开始向北方扩张,当他们遇到原始北亚原住民时,将不可避免地发生流血斗争,但O3南亚人凭借先进的生产力最终节节胜利并占领了越来越多的北亚人原住地区,但是交战双方最终都筋疲力尽,需要一段休养生息的时间。此时发生的事情应该与后来中原王朝与北方民族之间的故事应该非常接近——谈判、媾和、和亲。随后双方相互开始有了接触、交往。
此时南方移民必然要开始同化新占领土地上的原住民,但新来者人数肯定较少,如何同化呢?最简单的办法有两个:1.用暴力驱赶、压迫原住民族,但这个方法容易引起激烈的反抗;2.让自己成为更多的新生儿爸爸。这后一种方法较容易做到,也比较快速有效!
我记得美国有一本描写黑奴家族历史的畅销小说《根》,里面有一个情节很引起我的注意:有一个黑人女奴被白人农场主强奸后生下一个男孩,他长大后依然是(他爸爸)的奴隶,有一天因为受到欺压他想反抗并杀死白人农场主,但是他母亲告诉他农场主就是他的生父,于是他只得作罢。个人以为这个故事告诉我们血缘对道德和行为的巨大约束力。
要想实现后一种做法我想并不难,因为新来移民至少有两大优势:1.文化和生产力更先进,对原住民族很有吸引力;2.在政治上处于统治和支配地位,而原住民族则处于不利地位。
接下来就是通过各种手段来实现同化目的了:
*有文的,比如古代中原王朝常用的教化和同化蛮夷和移民屯垦的方式。
*也有武的,这大概与马其顿亚历山大大帝征服波斯和要求几万马其顿士兵强娶当地女子的历史比较类似。拉丁人也有在战胜萨宾人后夺人妻女的故事,而后这些抢来的老婆还抱着新生儿在双方下一场冲突中起到了调停的作用。
于是,南方移民最终可以用他们社会性基因O3完成伟大的“北伐”,似乎已经是祖国山河一片红。但是他们真的完胜了吗?仅看Y染色体的答案肯定是yes,但是如果也看常染色体则答案会是undecided,北方人的大量的常染色体遗传因子仍然顽强地存留在现代族群的血液里,而且越向北就越是如此!

2. Y染色体盘踞假说
但是O1又是另外一种情况。李辉认为上海周边一带仍然有较纯越裔群体存在,但是从他给出的这些越裔群体体质测量数据来看,简直是匪夷所思:这些越裔人群头型较圆,而且竟然比北方移民的后代四肢比例还要短。照此推理,难道一个源于南方热带地区的人群竟然快速进化出比北方移民更能适应温带和寒带气候的体征?
而通过我自己在上海、浙北一带的实地观察,有不少人还保留着百越祖先那些明显的热带、亚热带适应性特征。特别是在参观河姆渡遗址时,对当地人外貌的印象使我坚信百越的血脉仍然在零星、偏僻的地区从历史上无数次北人南迁的狂潮中幸存下来。
综合起来看,在如此临近的地区,绝不可能出现有的越人小群体变异速度极快,而有的基本保持原状的可能性!这其中一定有问题。
最近有帖子提醒了我:他们那里上至政府领导、下至普通教师都是外地人。也就是说,由于政治或是其他方面的原因,偏远地区的居民还是与外地人有接触的,只是机会多少的问题。
那么我就在想,其实诸如马桥一带的地方存在这种选择性基因交流的可能性。即在历史上,越裔居民的聚居地一直在与周边的其他族群和偶然来到的外地人存在少量交往和通婚。一旦通婚则大多数情款下要遵循封建父权社会体系的游戏规则:如果是越裔男性娶外地女子,则大多数情况下并认为是本地人后代会留在越裔聚居区;而要是外地男性娶本地越裔女子,则“嫁鸡随鸡”,她和她的子孙最终多半会跟外地丈夫走。而原住民相对封闭和贫穷的生活方式使得“倒插门”只是极个别的情况。
就是说,很有可能通过这种低频率的、选择性的基因交流方式,越裔原住民顽强地保存了自己的生活方式和语言文化,和最重要的代表夫权和父权的Y染色体标记O1。但在漫长的岁月中,常染色体遗传和线粒体遗传基因慢慢流失和被替换,最终使越裔人群的血统和体征发生了显著变化。
这个过程有点象恐龙化石的形成:经历上亿年的石化过程,有机质和一部分矿物质慢慢从遗骸中流失并被土壤中其他物质替换,而钙元素等仍然存在并维持着哪怕是最细微的骨骼结构,当我们发现它时仍然是那么活灵活现、张牙舞爪的样子,但从其成分看已经与原来骨骼大不相同了。
具体说道百越那些不可思议的体质特征,我个人认为很有可能是与后来的苗瑶系移民(吴人?)的混血,苗瑶系人群常见圆头化和短四肢。
上面这些当然只是我的一种猜想。李辉对于上海越裔起源研究本身还有很多疑点和问题没有解决,如果今后有更多关于华东地区百越的资料出来,我想会更有把握对这个问题进行深层的探讨。

四、结语

总结一下上面的观点,就是:
*   Y染色体遗传标记具有单一父系遗传和高度的社会性,非常适合作为种族迁徙和分化的示踪标记。
*   但是在分析现代种族构成时,由于其父系属性所带来的巨大的覆盖力和盘踞力,难以成为分析种族构成的理想工具,甚至有可能将研究工作引入歧途!
*   个人认为要想弄清现代大族群的种族成分,最佳的方法就是研究常染色体上那些基本不受外界气候环境选择的基因,Y染色体和线粒体DNA只能作为辅助和参考。
*   在研究方法上,本人最推崇美籍意大利裔学者提倡的常染色体基因频率主成分分析,不仅置信度高,而且可以分解和提炼出不同时期由族群混血、分化所产生的多个主成分图,具有很高的学术价值与现实意义。


http://blog.sina.com.cn/s/blog_4fb8a26101000a7f.html

对于Y染色体特征变异对追溯种族起源价值与意义的深层次思考


一、从汉族的起源和扩张说起
几年前,在网上出现了一篇爆炸性的探讨“汉族”起源和扩张过程的学术文章《遗传学证实汉文化的扩散源于人口扩张》。其结论令人惊诧:即汉族起源于北方后,在历史上历经多批次南迁扩张过程,以致在父系遗传方面基本取代南方原住民族成分,不仅从文化而且从血统方面融合并造就出世界最大种族。其数据统计分析结果亦令人震惊!南方各省原住民族父系的遗传贡献无一超过50%,而最南端的广西的仅达到40%!
作为一个对人类学和遗传学有着浓厚兴趣和多年研究的爱好者,一个通晓统计学基本原理的人,理智和直觉都告诉我这其中定有重大问题存在。首先我注意到数据结果下面有一段关键性的解释:
把南方原住民族和北方汉族作为南方汉族的亲本群体估计北方汉族的遗传贡献比例,假定2000 多年前开始的混合过程前后南方原住民族的等位基因频率基本不变,并且南北汉族之间的遗传交流不多。实际上,从北方汉族到南方原住民族的基因流动比反向的流动大得多,所以表中的估计值在没有适当调整前是低估的。因而汉族实际的人口扩张程度应该大于本项研究得出的数值。
从中我们可以注意到几个基本问题:

1. 北方汉族作为南方汉族的亲本之一
也就是说北汉是father,南汉是son。这个主观的假设与我已经知道的从体质人类学(包括牙型)多项研究一致指向的,亚洲人起源于东南亚的结果相违背。

2.把研究的问题框定为2000年前开始的南北民族的融合过程
但是遗传记录的却是自东亚人祖先出非洲以来几万年来基因变异重组的层层叠叠沉积下来的复杂密码,又岂是短短2000年的跨度所能囊括的?

3.认定南北汉族之间的遗传交流不多。
事实上就现在的研究结果已经可以知道汉族是一个很“新”的民族(我不知道用“种族”来描述是否恰当?)。所以这个假设只能是为了使数据统计过程能够“合理”进行下去的必要和必须的前提。我想这个前提的支撑力非常脆弱,几乎不堪一击!另外大力兄透露了很重要的一点,即本文的研究者们的采样范围全部来自城市,这更是一个致命的缺陷。
接下去为了推断各地区人群有多少北汉成分,则根据统计学原理,必须恰当地设定一个纯血统“北方汉族”的参照系。至于这个参照系如何确定,偶不得而知:有可以直接取自被认为华夏起源的河南某地,也有可能取被认为是传统上认为是典型北汉的陕甘冀鲁豫的部分地区。但具体如何选择应该不是最关键性问题。
在薛雅丽的文章中不难看出:所谓北方汉族也好,北方少数民族也好,其实都是南北两大谱系(可能还要加上中亚谱系)的中间过渡形态,只不过北汉混合均匀些,北少混合较少而差异更大些而已。
于是,“汉族”这个参照系就变成了一个“四不象”:无论南来还是北来的成分都被默认为“原本如此”源出中原地区,把son当成了father和grandfather。而事实上华北,特别是传统上认定的汉族起源的河南中原一带恰恰是混血很复杂的地区。照此分析推导,当然大量南方本来固有的可以视为北汉father的成分(如O3和一部分O2)都会被一股脑地计入原“汉族”成分。
所以此文最深层的问题在于出发点就很主观,导致从抽样到分析过程中一系列的问题。只要一旦设定“北汉是南汉的亲本”、“2000年以内的迁徙与融合”、“南汉北汉遗传交流不多”,再外加一个为保证南汉血统可靠而全部从城市采样的隐性缺陷,从统计学的角度来说,即便不做数据分析和推导,其结论的谬误也已经笃定了!

二、极具父系社会特性的Y染色体会说谎吗?
虽然《遗传学证实汉文化的扩散源于人口扩张》的结论如此不堪一击,但是它却引发我思考一个深层次的问题:Y染色体对研究种族形成就那么可靠吗?是Y染色体、mtDNA/线粒体,或是常染色体(如GM血型系统)更有价值呢?
在相关的读物如《出非洲记》里,分子人类学专家已经很精辟地总结了Y染色体遗传标记的种种特性:单一父系遗传,是具有社会性的遗传标记,所以最适合用来追踪种族迁徙演变历程。但是如果是一个历史上经历多次混杂所形成的族群呢?我坚持认为一个Y染色体标记是绝对不能代表全部的!
事实上从以往的日本学者所作的GM血型分布图,卡瓦利"斯福扎和中科院遗传所共同完成的《中国人群基因频率主成分分析》,以及薛雅丽的新近发表的《东亚地区男性统计调查》,都一致说明常染色体(或常染色体和Y染色体共同)的诸多研究一致指向“南、北人群在遗传上存在显著差异”的这个结论,而与Y染色体特征标记O*在东亚的广泛分布的结果(见下图)大相径庭!

4fb8a26143ee4902d6a4b.jpg
4fb8a26143ee490990592.jpg
4fb8a26143ee490aa9a40.jpg
4fb8a26106cb074d6e4bb.jpg
4fb8a26143ee490768ad6.jpg

这里面的问题究竟在哪里呢?难道是Y染色体在说谎吗?

三、对Y染色体的强大覆盖力和盘踞力的探讨
对上面这个问题,我想我不是法官,Y染色体也不会说话,我是没有办法从它那里得到任何有价值的信息的。但是Y染色体因其单一父系遗传而具有其他各种染色体标记均无法比拟的“父系社会性”而引发了我接下来的思考。
随着和各位同好们研讨的深化,我越来越意识到可能犯了个愚蠢的想当然的错误:分子人类学者首先从Y染色体开始入手研究人类大迁徙是没错的,但是(不管是谁!)要是把它当作研究现代族群血统成分构成的准确标记,就大错特错了!《遗传学证实汉文化……》就是一个典型的例子。
受限于自己并非专业学者和现有公开资料的限制,我只能在这里提出两种理论上可能性的假说,有待下一步科学研究的进一步证实。

1.Y染色体覆盖假说
这是我对O3形成的思考。
假设在西南部地区有一群携带O3标记的南亚人,当他们发展出农耕文化后,开始向北方扩张,当他们遇到原始北亚原住民时,将不可避免地发生流血斗争,但O3南亚人凭借先进的生产力最终节节胜利并占领了越来越多的北亚人原住地区,但是交战双方最终都筋疲力尽,需要一段休养生息的时间。此时发生的事情应该与后来中原王朝与北方民族之间的故事应该非常接近——谈判、媾和、和亲。随后双方相互开始有了接触、交往。
此时南方移民必然要开始同化新占领土地上的原住民,但新来者人数肯定较少,如何同化呢?最简单的办法有两个:1.用暴力驱赶、压迫原住民族,但这个方法容易引起激烈的反抗;2.让自己成为更多的新生儿爸爸。这后一种方法较容易做到,也比较快速有效!
我记得美国有一本描写黑奴家族历史的畅销小说《根》,里面有一个情节很引起我的注意:有一个黑人女奴被白人农场主强奸后生下一个男孩,他长大后依然是(他爸爸)的奴隶,有一天因为受到欺压他想反抗并杀死白人农场主,但是他母亲告诉他农场主就是他的生父,于是他只得作罢。个人以为这个故事告诉我们血缘对道德和行为的巨大约束力。
要想实现后一种做法我想并不难,因为新来移民至少有两大优势:1.文化和生产力更先进,对原住民族很有吸引力;2.在政治上处于统治和支配地位,而原住民族则处于不利地位。
接下来就是通过各种手段来实现同化目的了:
*有文的,比如古代中原王朝常用的教化和同化蛮夷和移民屯垦的方式。
*也有武的,这大概与马其顿亚历山大大帝征服波斯和要求几万马其顿士兵强娶当地女子的历史比较类似。拉丁人也有在战胜萨宾人后夺人妻女的故事,而后这些抢来的老婆还抱着新生儿在双方下一场冲突中起到了调停的作用。
于是,南方移民最终可以用他们社会性基因O3完成伟大的“北伐”,似乎已经是祖国山河一片红。但是他们真的完胜了吗?仅看Y染色体的答案肯定是yes,但是如果也看常染色体则答案会是undecided,北方人的大量的常染色体遗传因子仍然顽强地存留在现代族群的血液里,而且越向北就越是如此!

2. Y染色体盘踞假说
但是O1又是另外一种情况。李辉认为上海周边一带仍然有较纯越裔群体存在,但是从他给出的这些越裔群体体质测量数据来看,简直是匪夷所思:这些越裔人群头型较圆,而且竟然比北方移民的后代四肢比例还要短。照此推理,难道一个源于南方热带地区的人群竟然快速进化出比北方移民更能适应温带和寒带气候的体征?
而通过我自己在上海、浙北一带的实地观察,有不少人还保留着百越祖先那些明显的热带、亚热带适应性特征。特别是在参观河姆渡遗址时,对当地人外貌的印象使我坚信百越的血脉仍然在零星、偏僻的地区从历史上无数次北人南迁的狂潮中幸存下来。
综合起来看,在如此临近的地区,绝不可能出现有的越人小群体变异速度极快,而有的基本保持原状的可能性!这其中一定有问题。
最近有帖子提醒了我:他们那里上至政府领导、下至普通教师都是外地人。也就是说,由于政治或是其他方面的原因,偏远地区的居民还是与外地人有接触的,只是机会多少的问题。
那么我就在想,其实诸如马桥一带的地方存在这种选择性基因交流的可能性。即在历史上,越裔居民的聚居地一直在与周边的其他族群和偶然来到的外地人存在少量交往和通婚。一旦通婚则大多数情款下要遵循封建父权社会体系的游戏规则:如果是越裔男性娶外地女子,则大多数情况下并认为是本地人后代会留在越裔聚居区;而要是外地男性娶本地越裔女子,则“嫁鸡随鸡”,她和她的子孙最终多半会跟外地丈夫走。而原住民相对封闭和贫穷的生活方式使得“倒插门”只是极个别的情况。
就是说,很有可能通过这种低频率的、选择性的基因交流方式,越裔原住民顽强地保存了自己的生活方式和语言文化,和最重要的代表夫权和父权的Y染色体标记O1。但在漫长的岁月中,常染色体遗传和线粒体遗传基因慢慢流失和被替换,最终使越裔人群的血统和体征发生了显著变化。
这个过程有点象恐龙化石的形成:经历上亿年的石化过程,有机质和一部分矿物质慢慢从遗骸中流失并被土壤中其他物质替换,而钙元素等仍然存在并维持着哪怕是最细微的骨骼结构,当我们发现它时仍然是那么活灵活现、张牙舞爪的样子,但从其成分看已经与原来骨骼大不相同了。
具体说道百越那些不可思议的体质特征,我个人认为很有可能是与后来的苗瑶系移民(吴人?)的混血,苗瑶系人群常见圆头化和短四肢。
上面这些当然只是我的一种猜想。李辉对于上海越裔起源研究本身还有很多疑点和问题没有解决,如果今后有更多关于华东地区百越的资料出来,我想会更有把握对这个问题进行深层的探讨。

四、结语

总结一下上面的观点,就是:
*   Y染色体遗传标记具有单一父系遗传和高度的社会性,非常适合作为种族迁徙和分化的示踪标记。
*   但是在分析现代种族构成时,由于其父系属性所带来的巨大的覆盖力和盘踞力,难以成为分析种族构成的理想工具,甚至有可能将研究工作引入歧途!
*   个人认为要想弄清现代大族群的种族成分,最佳的方法就是研究常染色体上那些基本不受外界气候环境选择的基因,Y染色体和线粒体DNA只能作为辅助和参考。
*   在研究方法上,本人最推崇美籍意大利裔学者提倡的常染色体基因频率主成分分析,不仅置信度高,而且可以分解和提炼出不同时期由族群混血、分化所产生的多个主成分图,具有很高的学术价值与现实意义。


http://blog.sina.com.cn/s/blog_4fb8a26101000a7f.html

十五从军征 发表于 2016-2-27 19:24
“这500万个点上面呢,按照概率计算的话,应该是每分离140年左右就会产生一个点的差异”
这里面提到的概 ...


40%的中国人的Y染色体来自3个新石器时代的超级祖先



2013年10月15日,我在arXiv文章数据库挂出了一篇文章(http://arxiv.org/abs/1310.3897 ,带附件的下载地址见http://vdisk.weibo.com/s/qGPNPvCSIf0t ),题目是«Y Chromosomes of 40% Chinese Are Descendants of Three Neolithic Super-grandfathers»,即《40%的中国人的Y染色体来自三个新石器时代的超级祖先》,基本内容如下:首先是对110个东亚样本做Y染色体测序,得到质量可以接受的序列共78个。从里面找到了4000多个新的SNP位点,命名以F(复旦)打头。因为我们捕获来测序的范围是随机的(取的Y染色体上没有重复的约4 Mbp的很多不连续片段的集合,与已知支系信息无关),范围又比较大,所以可以画一棵明确且没有偏向的演化树(因为绝大多数位点都是没有回复突变的),然后就能按传统的分子钟方法计算时间了。



计算相对时间只要数每支的突变个数再相比就行了(因为有波动,具体时间还是按最大似然法综合算的),但绝对时间,就是说平均一个突变到底需要多少年,是需要标定的。这里我们先只用了一个1×10-9/年/碱基的突变率。文里用SNP算的相对时间能比用STR算出来的准很多(文中说了,准确度的误差范围和用于计算时间的SNP数开根号成反比)。标定的绝对年代(即SNP的绝对突变率)也许还有些误差,但至少结果也在以往各种方法估出来的范围之中(以往算出走出非洲年龄最小的不到4万年,最大的8万年,我们算出5.4万)。
465ddf79gx6Dw77hN5wa2&amp;690.jpg
465ddf79gx6Dw78kEhl53&amp;690.jpg
文章的结论
文章最大的亮点有两个,一个是能相对以往准确得多地算出分支时间,至少是相对时间,另一个是发现O3下面的三个大的星状扩张(下面具体谈到)。以往用Y-SNP不能算时间是因为实验是特地挑的已知SNP来做的,数量少,且本身带有偏向性。而本实验是不带任何人群方面的预设来找的SNP,是不带偏向性的。线粒体全测能算时间也是同样道理。当然因为Y染色体位点多,平均每100年左右就能有一个突变(用全序,即10Mbp左右的范围),而线粒体平均要2000多年才能在全长上有一次突变,因此Y染色体算出的时间精度能比线粒体好很多。


支系方面比较重要的结论有以下几点:
1. 走出非洲的C、DE、F三大支的分支年代在5万多年。虽然C和F在一起而DE是早分出的,而因为E主体的分布是在非洲,本来有人提出CF和D可能是两批分别走出非洲的,但我们发现CF共有的SNP只有3个,对应大概不到1000年,这样C, DE和F仍是准三叉,根据奥卡姆剔刀原理,还是M168+整体迁出非洲然后E那支再回流非洲的可能性稍大一些。


2. F支经历过极强的瓶颈,以致于和C分开后过了差不多2万年才再一次产生下游分支G, H, IJ, K,K下面的分化也很快(NO, P和LT目前来看也是个准三叉,M和S因为没有样本,现在拓扑关系还不明朗),也就是说,F支下面按字母分的单倍群从树干上分出的时间大体都在3.6 – 2.4万年前之间,尤其3.6 – 3万年前是一个快速扩张的时期。O3-M122与O1-M119、O2-M268分开后不久,O1、O2再分开。而下游的分化总的次序是O2最早,其次O3,而O1最晚(不过可能和这次测序的O1样本多数取自华东有关,多取一些南方少数民族的O1样本可能会有一些更早的分支。)


3. O系的地理布散,尤其是O3a-M324(占中国人口的一半以上),主要发生在1.9 – 1万年前,即末次冰盛期(2.3 – 1.8万年前)之后的旧石器时代。这段时间全球气候逐渐回暖,海平面从现在海面以下上百米一直升到和目前海平面接近的高度,人类的可活动范围大大扩展,技术上也有了一些创新,比如陶器的发明,农业也出现了萌芽。


4. 在树上观察到,5000到6000多年前左右,在中国出现了三个超级祖先,一个在M117下,一个在M134的另一个分支,即F444下,还有一个在002611的下游F11下。这三个超级祖先出现的年代很接近(次序按不同方法算出来有所区别)。我把他们分别称为Oα, Oβ和Oγ,算作对现有单倍群命名系统的一个改进。这三个大约6000年前的人的后代构成了现在汉族人群的40%以上。之所以很特别(因为一个人群往上推总会推到某个时候有个祖先的后代占了一大半),是因为在这三个扩张以前的Y染色体树的所有分支,都是二叉,而这三个扩张是星状扩张,即突然从一个人演化出难以分出先后(这篇文章的测序精度是平均250年一个突变)的5 – 7个支系,而且这5 – 7支是都有后代一直延续到现在的。长支或二叉当中的那些古人当然不是说那些人都没有兄弟,而是说无数辈的兄弟都没能传下男性后代,当时的人口扩张也相对缓慢,只有这几支幸运儿的后代终于活到了现代。


5. C3-M217是占中国10%左右的大支系,很清楚分为南北两支,2.6万年前分开,比O3和O1’2分开还略早。结合STR结果来看,汉族的C3基本都是南支,且存在一个6000多年前的扩张(可能比O3下的三大簇略早)。汉族和北方民族都常见的C3d-M407属于南支那个扩张下游的。而星簇(star cluster,以前Zerjal et al.说是成吉思汗生出来的)、448-del两个重要支系(应该也有C3c-M48)属于北支。C3的北支基本在汉族里不存在。关于C单倍群的更多细节,我的同事兰海应该会发表一篇paper来说明。


6. N单倍群的最早分化也在1.6万年前。也分为南北两支。结合STR来看,原先的N1a-M128和N1c-M46(应该也有N1b-P43)都是北支的。关于N的更多细节,我也会另外写一篇paper来讲。




文章里没写的(因为文章本来要投大杂志的,因篇幅有限或说了会被审稿人挑刺所以没放在文章里,或者被别人抢去的,或是证据不足的猜想):


7. 时间估计的不精确性。因为原先文章里的用STR计算突变率有一些问题,在后来投的稿里这部分被砍掉了。但相对的STR时间计算是没有问题的。这里给出两张散点图,比较相同的两个样本用17-STR得出的时间和直接数相差的SNP数的对比。前一张图是所有样本间的两两比较。后一张图是Oγ星状扩张中每对共祖于星点的两个样本的STR计算时间和相差的SNP数的对比。因为是同一个星,理论上两个样本的共祖时间几乎相同。可见SNP算出的时间精度远好于STR算出的,而STR得到的结果经常可能差出一个数量级以上。或者说,两个样本STR很远的可以排除近期的共祖,但STR近的,实际共祖时间可能很晚但也不排除实际很早但是因为巧合而STR接近了。经常有人问,我们两个人STR差4个点,到底能差多少年,我说100年到1万年都没准,这确实不是搪塞。
465ddf79gx6Dw7nHzCSae&amp;690.jpg
465ddf79gx6Dw7nBi106e&amp;690.jpg
8. 这三个超级祖先到底是什么人。首先,这个扩张年代正好在五六千年前,属新石器时代晚期,对应的文化包括仰韶时代晚期和大汶口文化晚期等(我知道有人认为这三个扩张不是发生于黄河流域的,留以后发现更多证据,尤其是古DNA证据来回答了。)这个时代我知道的有两个大的变革,一个是农业的大发展,谷类从采集、狩猎的辅助食物变成了食物的主体部分,人们的食物开始严重依赖农业,同时聚落的分布密度大大增加,说明人口增加。同时又有一个社会结构的变化,墓葬从群体葬逐渐发展出了单人葬和对偶葬,说明社会从母系社会变成了父系社会。因此,对于这三个超级祖先,有两种解释:其一,他们是最早的集约化农民,因为生产力(谷物和人口的)大幅发展,成了超级祖先,因此称Oα, Oβ和Oγ分别为“农民甲”、“农民乙”和“农民丙”。有人不相信这种解释,认为他们肯定是很伟大的部落首领,有巨大的权力而能占有很多女人,建议用三皇来称呼,我按照计算出的时间,分别把Oγ, Oβ和Oα分别称作“天皇”、“地皇”和“泰皇”。(还有建议把他们称作“炎帝”、“黄帝”和“蚩尤”的,因为时间不符合,而且因为可能有历史原型而对应支系可能被证伪,再加上“蚩尤”从民族学上看大概对应苗瑶的O3a2b-M7而不属这三大簇,所以我觉得还是用纯神化的三皇更合适一些。)当然用三皇命名有些人会觉得神棍一些,宁可用“农民”,不过其实把人类父系共祖称作“Y染色体亚当”同样神棍。我觉得反正这三簇是客观存在的,短时间也不容易证明到底他们是什么样的人物,那称作农民还是三皇就看个人信仰了。


9. 除了三个O3下面的超级祖先,另有两支也需要关注,一个是C3下面F1144的下游扩张,即南支,扩张时间可能比O3的三大簇略早,另一个是O1a1下面F78的下游扩张,年代可能只有4000年不到。这两支的人口大概也各占了汉族的10%上下,但因为高通量测序时没有足够的样本或有的样本测序质量不好,尚未能表现出星状扩张,但我相信如果能扩大测序样本的数目,也是能找到类似星簇的扩张的。(我还暂时没有给这两支起名字。)这样,把这两支也加上,这五个新石器祖先的后代就能占到汉族及中国人60%的比例了。
(上图是五支祖先大致的分布范围和所占人口比例。不是严格计算,汉族之外的支系判断可能有错。)
001hTuQNgy6GcilGpwt01&amp;690.jpg
001hTuQNgy6Gcilr9lg82&amp;690.jpg
001hTuQNgy6GcilTJBF2b&amp;690.jpg
001hTuQNgy6Gcimao4K56&amp;690.jpg
001hTuQNgy6GcimmWBa58&amp;690.jpg

10. 关于华夏的起源。因为这篇文章计算了时间,所以明确了,汉族(或中华民族)的大多数姓氏的都起源于一个几千年前叫黄帝的共同父系祖先必然是不可能的。新石器时代晚期最大的簇(Oα)也不过占汉族父系的16%。不过,这篇文章同样也说明了,史前不远的时代,华夏确实有少数几个超级祖先,他们短时间繁殖出了大量的后代,也就是说这些有关共同祖先的传说确实是有其原型的,只不过其重要程度被夸大了。


http://blog.sina.com.cn/s/blog_465ddf790101ff19.html
十五从军征 发表于 2016-2-27 19:24
“这500万个点上面呢,按照概率计算的话,应该是每分离140年左右就会产生一个点的差异”
这里面提到的概 ...


40%的中国人的Y染色体来自3个新石器时代的超级祖先



2013年10月15日,我在arXiv文章数据库挂出了一篇文章(http://arxiv.org/abs/1310.3897 ,带附件的下载地址见http://vdisk.weibo.com/s/qGPNPvCSIf0t ),题目是«Y Chromosomes of 40% Chinese Are Descendants of Three Neolithic Super-grandfathers»,即《40%的中国人的Y染色体来自三个新石器时代的超级祖先》,基本内容如下:首先是对110个东亚样本做Y染色体测序,得到质量可以接受的序列共78个。从里面找到了4000多个新的SNP位点,命名以F(复旦)打头。因为我们捕获来测序的范围是随机的(取的Y染色体上没有重复的约4 Mbp的很多不连续片段的集合,与已知支系信息无关),范围又比较大,所以可以画一棵明确且没有偏向的演化树(因为绝大多数位点都是没有回复突变的),然后就能按传统的分子钟方法计算时间了。



计算相对时间只要数每支的突变个数再相比就行了(因为有波动,具体时间还是按最大似然法综合算的),但绝对时间,就是说平均一个突变到底需要多少年,是需要标定的。这里我们先只用了一个1×10-9/年/碱基的突变率。文里用SNP算的相对时间能比用STR算出来的准很多(文中说了,准确度的误差范围和用于计算时间的SNP数开根号成反比)。标定的绝对年代(即SNP的绝对突变率)也许还有些误差,但至少结果也在以往各种方法估出来的范围之中(以往算出走出非洲年龄最小的不到4万年,最大的8万年,我们算出5.4万)。
465ddf79gx6Dw77hN5wa2&amp;690.jpg
465ddf79gx6Dw78kEhl53&amp;690.jpg
文章的结论
文章最大的亮点有两个,一个是能相对以往准确得多地算出分支时间,至少是相对时间,另一个是发现O3下面的三个大的星状扩张(下面具体谈到)。以往用Y-SNP不能算时间是因为实验是特地挑的已知SNP来做的,数量少,且本身带有偏向性。而本实验是不带任何人群方面的预设来找的SNP,是不带偏向性的。线粒体全测能算时间也是同样道理。当然因为Y染色体位点多,平均每100年左右就能有一个突变(用全序,即10Mbp左右的范围),而线粒体平均要2000多年才能在全长上有一次突变,因此Y染色体算出的时间精度能比线粒体好很多。


支系方面比较重要的结论有以下几点:
1. 走出非洲的C、DE、F三大支的分支年代在5万多年。虽然C和F在一起而DE是早分出的,而因为E主体的分布是在非洲,本来有人提出CF和D可能是两批分别走出非洲的,但我们发现CF共有的SNP只有3个,对应大概不到1000年,这样C, DE和F仍是准三叉,根据奥卡姆剔刀原理,还是M168+整体迁出非洲然后E那支再回流非洲的可能性稍大一些。


2. F支经历过极强的瓶颈,以致于和C分开后过了差不多2万年才再一次产生下游分支G, H, IJ, K,K下面的分化也很快(NO, P和LT目前来看也是个准三叉,M和S因为没有样本,现在拓扑关系还不明朗),也就是说,F支下面按字母分的单倍群从树干上分出的时间大体都在3.6 – 2.4万年前之间,尤其3.6 – 3万年前是一个快速扩张的时期。O3-M122与O1-M119、O2-M268分开后不久,O1、O2再分开。而下游的分化总的次序是O2最早,其次O3,而O1最晚(不过可能和这次测序的O1样本多数取自华东有关,多取一些南方少数民族的O1样本可能会有一些更早的分支。)


3. O系的地理布散,尤其是O3a-M324(占中国人口的一半以上),主要发生在1.9 – 1万年前,即末次冰盛期(2.3 – 1.8万年前)之后的旧石器时代。这段时间全球气候逐渐回暖,海平面从现在海面以下上百米一直升到和目前海平面接近的高度,人类的可活动范围大大扩展,技术上也有了一些创新,比如陶器的发明,农业也出现了萌芽。


4. 在树上观察到,5000到6000多年前左右,在中国出现了三个超级祖先,一个在M117下,一个在M134的另一个分支,即F444下,还有一个在002611的下游F11下。这三个超级祖先出现的年代很接近(次序按不同方法算出来有所区别)。我把他们分别称为Oα, Oβ和Oγ,算作对现有单倍群命名系统的一个改进。这三个大约6000年前的人的后代构成了现在汉族人群的40%以上。之所以很特别(因为一个人群往上推总会推到某个时候有个祖先的后代占了一大半),是因为在这三个扩张以前的Y染色体树的所有分支,都是二叉,而这三个扩张是星状扩张,即突然从一个人演化出难以分出先后(这篇文章的测序精度是平均250年一个突变)的5 – 7个支系,而且这5 – 7支是都有后代一直延续到现在的。长支或二叉当中的那些古人当然不是说那些人都没有兄弟,而是说无数辈的兄弟都没能传下男性后代,当时的人口扩张也相对缓慢,只有这几支幸运儿的后代终于活到了现代。


5. C3-M217是占中国10%左右的大支系,很清楚分为南北两支,2.6万年前分开,比O3和O1’2分开还略早。结合STR结果来看,汉族的C3基本都是南支,且存在一个6000多年前的扩张(可能比O3下的三大簇略早)。汉族和北方民族都常见的C3d-M407属于南支那个扩张下游的。而星簇(star cluster,以前Zerjal et al.说是成吉思汗生出来的)、448-del两个重要支系(应该也有C3c-M48)属于北支。C3的北支基本在汉族里不存在。关于C单倍群的更多细节,我的同事兰海应该会发表一篇paper来说明。


6. N单倍群的最早分化也在1.6万年前。也分为南北两支。结合STR来看,原先的N1a-M128和N1c-M46(应该也有N1b-P43)都是北支的。关于N的更多细节,我也会另外写一篇paper来讲。




文章里没写的(因为文章本来要投大杂志的,因篇幅有限或说了会被审稿人挑刺所以没放在文章里,或者被别人抢去的,或是证据不足的猜想):


7. 时间估计的不精确性。因为原先文章里的用STR计算突变率有一些问题,在后来投的稿里这部分被砍掉了。但相对的STR时间计算是没有问题的。这里给出两张散点图,比较相同的两个样本用17-STR得出的时间和直接数相差的SNP数的对比。前一张图是所有样本间的两两比较。后一张图是Oγ星状扩张中每对共祖于星点的两个样本的STR计算时间和相差的SNP数的对比。因为是同一个星,理论上两个样本的共祖时间几乎相同。可见SNP算出的时间精度远好于STR算出的,而STR得到的结果经常可能差出一个数量级以上。或者说,两个样本STR很远的可以排除近期的共祖,但STR近的,实际共祖时间可能很晚但也不排除实际很早但是因为巧合而STR接近了。经常有人问,我们两个人STR差4个点,到底能差多少年,我说100年到1万年都没准,这确实不是搪塞。
465ddf79gx6Dw7nHzCSae&amp;690.jpg
465ddf79gx6Dw7nBi106e&amp;690.jpg
8. 这三个超级祖先到底是什么人。首先,这个扩张年代正好在五六千年前,属新石器时代晚期,对应的文化包括仰韶时代晚期和大汶口文化晚期等(我知道有人认为这三个扩张不是发生于黄河流域的,留以后发现更多证据,尤其是古DNA证据来回答了。)这个时代我知道的有两个大的变革,一个是农业的大发展,谷类从采集、狩猎的辅助食物变成了食物的主体部分,人们的食物开始严重依赖农业,同时聚落的分布密度大大增加,说明人口增加。同时又有一个社会结构的变化,墓葬从群体葬逐渐发展出了单人葬和对偶葬,说明社会从母系社会变成了父系社会。因此,对于这三个超级祖先,有两种解释:其一,他们是最早的集约化农民,因为生产力(谷物和人口的)大幅发展,成了超级祖先,因此称Oα, Oβ和Oγ分别为“农民甲”、“农民乙”和“农民丙”。有人不相信这种解释,认为他们肯定是很伟大的部落首领,有巨大的权力而能占有很多女人,建议用三皇来称呼,我按照计算出的时间,分别把Oγ, Oβ和Oα分别称作“天皇”、“地皇”和“泰皇”。(还有建议把他们称作“炎帝”、“黄帝”和“蚩尤”的,因为时间不符合,而且因为可能有历史原型而对应支系可能被证伪,再加上“蚩尤”从民族学上看大概对应苗瑶的O3a2b-M7而不属这三大簇,所以我觉得还是用纯神化的三皇更合适一些。)当然用三皇命名有些人会觉得神棍一些,宁可用“农民”,不过其实把人类父系共祖称作“Y染色体亚当”同样神棍。我觉得反正这三簇是客观存在的,短时间也不容易证明到底他们是什么样的人物,那称作农民还是三皇就看个人信仰了。


9. 除了三个O3下面的超级祖先,另有两支也需要关注,一个是C3下面F1144的下游扩张,即南支,扩张时间可能比O3的三大簇略早,另一个是O1a1下面F78的下游扩张,年代可能只有4000年不到。这两支的人口大概也各占了汉族的10%上下,但因为高通量测序时没有足够的样本或有的样本测序质量不好,尚未能表现出星状扩张,但我相信如果能扩大测序样本的数目,也是能找到类似星簇的扩张的。(我还暂时没有给这两支起名字。)这样,把这两支也加上,这五个新石器祖先的后代就能占到汉族及中国人60%的比例了。
(上图是五支祖先大致的分布范围和所占人口比例。不是严格计算,汉族之外的支系判断可能有错。)
001hTuQNgy6GcilGpwt01&amp;690.jpg
001hTuQNgy6Gcilr9lg82&amp;690.jpg
001hTuQNgy6GcilTJBF2b&amp;690.jpg
001hTuQNgy6Gcimao4K56&amp;690.jpg
001hTuQNgy6GcimmWBa58&amp;690.jpg

10. 关于华夏的起源。因为这篇文章计算了时间,所以明确了,汉族(或中华民族)的大多数姓氏的都起源于一个几千年前叫黄帝的共同父系祖先必然是不可能的。新石器时代晚期最大的簇(Oα)也不过占汉族父系的16%。不过,这篇文章同样也说明了,史前不远的时代,华夏确实有少数几个超级祖先,他们短时间繁殖出了大量的后代,也就是说这些有关共同祖先的传说确实是有其原型的,只不过其重要程度被夸大了。


http://blog.sina.com.cn/s/blog_465ddf790101ff19.html
颜射 发表于 2016-2-27 19:53
40%的中国人的Y染色体来自3个新石器时代的超级祖先

按照分子钟方法计算进化速率的。就这一句是我最需要的,谢谢。