给文化认同论泼一下冷水:遗传学证实汉文化的扩散源于人 ...

来源:百度文库 编辑:超级军网 时间:2024/04/29 10:36:36


http://www.xinhuanet.com/chinanews/2004-09/16/content_2883407.htm

遗传学研究支持汉文化扩散源于人口扩张

新华网上海频道记者 张学全 仇逸9月16日报道:上海复旦大学生命科学学院现代人类学研究中心和摩尔根-谈家桢国际生命科学中心的文波、李辉等科研人员通过系统地分析汉族群体的Y染色体和线粒体DNA多态性,揭开了全世界最大的民族汉族的文化扩散模式的神秘面纱,研究结果表明:汉文化向南扩散的机制符合人口扩张模式,而且在扩张中男性占主导地位。论文《遗传学证据支持汉文化的人口扩张模式》在英国今天出版的《自然》(《NATURE》)杂志发表。   

语言和文化的扩散存在两种模式:一为人口扩张、即人口迁徙模式;另一为文化传播模式,人群中有文化传播、基因交流却很有限。历史记载,汉族源于古代中国北方的华夏部落,在过去的两千多年间,汉文化扩散到了中国南方,而中国南方的原住民族则是说侗台、南亚和苗瑶语的人群。经典遗传标记和微卫星位点研究显示:汉族可以以长江为界,分为两个遗传亚群,南方汉族和北方汉族。两个亚群之间虽然方言和习俗差异很显著,但是有着许多共同的Y染色体和线粒体类型。   

研究人员将南方汉族的遗传结构和北方汉族、南方原住民族两个亲本群体进行比较,分析了来自中国28个地区汉族群体的Y染色体非重组区和线粒体DNA,这些样本覆盖了我国绝大部分的省份。   

南方汉族与北方汉族的Y染色体类型及频率分布非常相近,说明南方汉族在父系上与北方汉族非常相似,受到南方原住居民的影响很小。母系方面,北方汉族与南方汉族的线粒体类型的分布非常不同,南北汉族之间有极其显著的差异,南方汉族受到南方原住民族的影响较大。总体上北方汉族对南方汉族的遗传贡献父系比母系高得多,南方汉族中北方汉族的贡献比例由北向南递减。

复旦大学生命科学学院院长金力教授认为:汉文化的扩散中确实发生了大规模的人群迁徙。首先,几乎所有的汉族群体的Y染色体单倍群分布极为相似;其次,北方汉族对南方汉族的遗传贡献无论从父系还是母系方面都十分可观。在汉族的扩张过程中,南方汉族与南方原住民族发生了基因融合,但这一融合具有性别偏向性:融入到南方汉族中的南方原住民族女性远远多于男性,而北方汉族的男性对南方汉族做出了更大的贡献。

遗传学的研究与历史记载相吻合:受到北方战乱和饥荒的影响,汉人不断南迁,大量的北方移民改变了中国南方的遗传构成,而汉族人口扩张的同时也带动了汉文化的扩散。北方汉族、南方汉族和南方原住民族之间基因交流造成的族群混合也在很大程度上改变了中国人群的遗传结构。(完)








http://www.nature.com/nature/journal/v431/n7006/full/nature02878.html


遗传学证实汉文化的扩散源于人口扩张

文波1,2,李辉1,卢大儒1,宋秀峰1,张锋1,何云刚1,李峰1,高扬1,毛显赟1,张良1,钱
吉1,谭婧泽1,金建中1,黄薇2,Ranjan Deka3, 宿兵1,3,4,Ranajit Chakraborty3, 金力1,3
1. 复旦大学 现代人类学研究中心 遗传工程国家重点实验室 生命科学学院 摩尔根—谈国际生命科学中心,上海 200433,中国
2. 国家人类基因组南方研究中心,上海 201203,中国
3. 辛辛纳提大学 环境健康系 基因组信息中心,辛辛纳提,俄亥俄州45267,美国
4. 中国科学院昆明动物研究所 细胞与分子进化重点实验室,昆明 650223,中国


语言和文化在人群间的扩散有两种不同的模式:一种是人口扩张、人群迁徙模式;
另一种是文化传播模式,人群之间有文化传播,而基因交流却很有限。同一语系的欧
洲人群的形成机制争议颇多,争论的焦点在于来自近东的农业文明和语言的扩散是否
伴随着大量的农业人口的迁移[1-3]。有着共同的文化和语言的汉族,人口超过了十一亿
六千万(2000 年人口统计),无疑是全世界最大的民族。因此汉文化的扩散过程广受各
领域研究者的关注。通过系统地对汉族群体的Y 染色体和线粒体DNA 多态性进行分析,
我们发现汉文化向南扩散的格局符合人口扩张模式,而且在扩张过程中男性占主导地
位。


史载汉族源于古代中国北方的华夏部落,在过去的两千多年间,汉文化(汉语和相关的文
化传统)扩散到了中国南方,而中国南方原住民族则是说侗台、南亚和苗瑶语的人群(百越、
百濮和荆蛮)[4-5]。经典遗传标记和微卫星位点研究显示,汉族和其他东亚人群一样都可以以
长江为界分为两个遗传亚群,南方汉族和北方汉族[6-9]。两个亚群之间的方言和习俗差异也很
显著[10]。这些现象看似支持文化传播模式,即汉族向南扩张主要是文化传播和同化的结果。
然而,两个亚群之间有着许多共同的Y 染色体和线粒体类型[11-12],历史记载的汉族移民史[5]
也与汉族的文化传播模式假说相矛盾。本研究对这两种假说进行了检验,证实汉文化的扩散
中的确发生了大规模的人群迁徙(人口扩张模式)。

图1 调查群体的地理分布。图中标出了历史记载中自北而南的三次迁徙浪潮。各群体的详细信息见补充材料
1。群体1-14 是北方汉族,15-28 是南方汉族。实线、段线和虚线依次表示三次迁徙浪潮。第一次发生于西晋
时期(公元265-316 年),迁徙人口约90 万(大约当时南方人口的六分之一);第二次发生于唐代(公元618-907
年)规模比第一次大得多;第三次发生于南宋(公元1127-1279 年),迁徙人口近500 万


为了验证这些假说,我们把南方汉族的遗传结构与两个亲本群体作比较,其一是北方汉
族,其二是南方原住民族,即现居于中国境内和若干邻国的侗台、苗瑶和南亚语群体。我们
分析了来自中国28 个地区汉族群体的Y 染色体非重组区(NRY)和线粒体DNA(mtDNA)遗传多
态[13-16],这些样本覆盖了中国绝大部分的省份(详见图1 和补充信息表1)。

父系方面,南方汉族与北方汉族的Y 染色体单倍群频率分布非常相近(见补充信息表2),
尤其是具有M122-C 突变的单倍群 (O3-M122 和O3e-M134) 普遍存在于我们研究的汉族群体
中(北方汉族在37-71%之间,平均53.8%;南方汉族在35-74%之间,平均54.2%)。南方原
住民族中普遍出现的单倍群M119-C(O1)和M95-T(O2a)在南方汉族中的频率(3-42%,平均
19%)高于北方汉族(1-10%,平均5%)。而且,南方原住民族中普遍存在的单倍群
O1b-M110,O2a1-M88 和O3d-M7[17], 在南方汉族中低频存在(平均4%),而北方汉族中却没观
察到。如果我们假定起始于两千多年前的汉文化扩散[5]之前南方原住民族的Y 类型频率与现
在基本一致的话,南方汉族中南方原住民族的成分应该是不多的。分子方差分析(AMOVA)进
一步显示北方汉族和南方汉族的Y 染色体单倍群频率分布没有显著差异(Fst=0.006,P>0.05),
说明南方汉族在父系上与北方汉族非常相似。


母系方面,北方汉族与南方汉族的线粒体单倍群分布非常不同(补充信息表3)。东亚北
部的主要单倍群(A,C,D,G,M8a,Y,Z)在北方汉族中的频率(49-64%,平均55%)比在南方汉族
中(19-52%,平均36%)高得多。另一方面,南方原住民族的主要单倍群(B,F,R9a,R9b,N9a)[12,14,18]
在南方汉族中的频率(36-72%,平均55%)要比在北方汉族(18-42%,平均33%)高得多。线
粒体类型的分布在南北汉族之间有极显著差异(Fst=0.006,P<10-5)。虽然南北汉族之间线粒体和
Y 染色体的Fst 值相近,但线粒体的南北差异Fst 值占群体间总方差的56%,而Y 染色体仅仅
占18%。


用汉族群体的单倍群频率数据所做的主成分(PC)分析与以上结果相一致。对NRY 分析
发现,几乎所有的汉族群体都聚在图2a 的右上方。北方汉族和南方原住民族在第2 主成分上
分离,南方汉族的第2 主成分值处于北方汉族和南方原住民族之间,但是更接近于北方汉族
(北方汉族0.58±0.01;南方汉族0.46±0.03;南方原住民族-0.32±0.05),这表明南方汉族
在父系上与北方汉族相近,受到南方原住民族的影响很小。就mtDNA 而言,北方汉族和南方
原住民族仍然被第2 主成分分开(图2b),南方汉族也在两者之间但稍微接近南方原住民族(北
方汉族0.56±0.02;南方汉族0.09±0.06;南方原住民族-0.23±0.04),表明南方汉族的女
性基因库比男性基因库有更多的混合成分。


图2 主成分散点图。a 为Y 染色体单倍群散点图,b 为线粒体单倍群散点图。群体标记:▲北方汉族,△南
方汉族,+侗台语民族,×南亚语民族,*苗瑶语民族。
我们进一步用两种不同的统计方法[19-20]来估计两个亲本(北方汉族和南方原住民)对南
方汉族基因库的相对贡献(表1),这两个统计量用于单位点(single-locus)分析时比其它的
方法更为准确[21]。两种方法得到的混合系数估计值(M,北方汉族的贡献比例)高度一致(Y
染色体,r=0.922,P<0.01;线粒体,r=0.970,P<0.01)。就Y 染色体而言,所有的南方汉族都包
含很高比例的北方汉族混合比率(MBE:0.82 ± 0.14, 范围0.54-1 ;MRH:0.82 ± 0.12,范围
0.61-0.97)(MBE 和MRH 的定义分别见参考文献20 和19),这表明南方汉族男性基因库的主
要贡献成分来自北方汉族。相反,南方汉族的线粒体基因库中北方汉族和南方原住民族的贡
献比例几乎相等(MBE:0.56±0.24[0.15,0.95]; MRH:0.50±0.26[0.07,0.91])。总体上北方汉
族对南方汉族的遗传贡献父系比母系高得多(t-test,P<0.01);各群体分别看也是这样:绝
大部分南方汉族群体中北方汉族的贡献在父系上大于母系(MBE ,11/13, MRH,13/13, P<0.01,
零假设为男女的贡献相等为二项式分布),这表明南方汉族的群体混合过程有很强的性别偏
向。南方汉族中北方汉族贡献的比例(M)呈现出由北向南递减的梯度地理格局。南方汉族线粒
体的M 值与纬度正相关(r2=0.569,P<0.01),但Y 染色体的相关性不显著(r2=0.072,P>0.05),
因为南方汉族父系的M 值差异太小,不足以导致统计上的显著性。




综上所述,我们提出了两项证据支持汉文化扩散的人口扩张假说。首先,几乎所有的汉
族群体的Y 染色体单倍群分布都极为相似,Y 染色体主成分分析也把几乎所有的汉族群体都
集合成一个紧密的聚类。再有,北方汉族对南方汉族的遗传贡献无论父系方面还是母系方面
都是可观的,在线粒体DNA 分布上也存在地理梯度。北方汉族对南方汉族的遗传贡献在父系
(Y 染色体)上远大于母系(线粒体),表明这一扩张过程中汉族男性处于主导地位;换个角
度看,在汉族和南方原住民的融合过程中有相对较多的当地女性融入南方汉族中。性别偏向
的混合格局也同样存在于藏缅语人群中
[22]。


据历史记载,受北方战乱和饥荒的影响,汉人不断的南迁,图1 中画出了三次大规模移
民的浪潮。在两千多年间,除了这三次大潮,各个时期几乎都有小规模的南迁。所以,我们
的遗传研究也与历史记载相吻合。大量的北方移民改变了中国南方的遗传构成,而汉族人口
扩张的同时也带动了汉文化的扩散。除了大规模的人群迁徙,北方汉族、南方汉族和南方原
住民族之间的基因交流造成的族群混合也在很大程度上改变了中国人群的遗传结构。

方法
样本

采集中国各地的17 个汉族群体871 个随机不相关个体的血样。用酚-氯仿法抽提基因组DNA。结合文献
报道的Y 染色体和线粒体多态性数据,总共分析的样本量是:Y 染色体23 个群体1289 人,线粒体23 个群体
1119 人。这些样本涉及了中国的大部分省份(图1 和补充材料表1)。

遗传标记
通过聚合酶链式反应—限制性片断长度多态性(PCR-RFLP)的方法[11]分型Y 染色体上的13 个双等位标记:
YAP,M15,M130,M89,M9,M122,M134,M119,M110,M95,M88,M45,M120。根据Y 染色体委员会的命名系统
(YCC)[24],这些标记构成13 个单倍群,在东亚人群中具有较高的信息量[23]。
线粒体上,对高变1 区(HVS-1)进行测序,对编码区8 个多态位点作了分型(9-bp 缺失, 10397 AluI, 5176
AluI, 4831 HhaI, 13259 HincII, 663 HaeIII, 12406 HpaI , 9820 HinfI),有关方法已有报道[22]。根据东
亚线粒体系统树[18],用高变1 区突变结构和编码区多态性构建单倍群。

数据分析
根据线粒体和Y 染色体单倍群频率,用SPSS10.0 软件(SPSS 公司)作主成分分析,研究群体间关系。南
北汉族的遗传差异用ARLEQUIN 软件[26]做AMOVA 检验[25]。南方汉族中北方汉族和南方原住民族的混合比
例估计用两种不同的统计方法[19-20]:ADMIX 2.0[27]和LEADMIX[21]软件。亲本群体的选择对混合比例的适当
估计很重要[28-29],我们通过扩大东亚的参考数据来减小偏差。分析中,10 个北方汉族群体的各单倍群频率(Y
染色体和线粒体标记分别分析)的算术平均作为北方亲本群体。南方原住民族的频率平均了三个族群:侗台
语群(NRY,22 群体;线粒体,11 群体),南亚语群(NRY,6 群体;线粒体,5 群体),苗瑶语群(NRY,
18 群体;线粒体,14 群体)。通过样本的混合比例与纬度[1,3]的线性回归分析揭示汉族群体的地理格局。

2004 年4 月28 日收稿;7 月20 日定稿;doi:10.1038/nature02878.

参考文献
1. Cavalli-Sforza, L. L.,Menozzi, P. & Piazza, A. The History and Geography of Human Genes (Princeton Univ. Press,
Princeton, 1994).
2. Sokal, R., Oden, N. L. &Wilson, C. Genetic evidence for the spread of agriculture in Europe by demic diffusion.
Nature 351, 143–145 (1991).
3. Chikhi, L. et al. Y genetic data support the Neolithic demic diffusion model. Proc. Natl Acad. Sci. USA 99,
11008–11013 (2002).
4. 费孝通. 中华民族多元一体格局. (中央民族大学出版社, 北京, 1999).
5. 葛剑雄, 吴松弟, 曹树基. 中国移民史(福建人民出版社,福州, 1997).
6. Zhao, T. M. & Lee, T. D.Gmand Kmallotypes in 74 Chinese populations: a hypothesis of the origin of the Chinese
nation. Hum. Genet. 83, 101–110 (1989).
7. Du, R. F., Xiao, C. J. & Cavalli-Sforza, L. L. Genetic distances calculated on gene frequencies of 38 loci. Science
in China Ser. C 40, 613 (1997).
8. Chu, J. Y. et al. Genetic relationship of populations in China. Proc. Natl Acad. Sci. USA 95,11763–11768 (1998).
9. Xiao, C. J. et al. Principal component analysis of gene frequencies of Chinese populations. Sci.China C,43,
472–481 (2000).
10. Xu, Y. T. A brief study on the origin of Han nationality. J. Centr. Univ. Natl 30, 59–64 (2003).
11. Su, B. et al. Y chromosome haplotypes reveal prehistorical migrations to the Himalayas. Hum. Genet.107,
582–590 (2000).
12. Yao, Y. G. et al. Phylogeographic
13. Cavalli-Sforza, L. L. & Feldman, M.W. The application of molecular genetic approaches to the study of human
evolution. Nature Genet. 33, 266–275 (2003).
14. Wallace, D. C., Brown, M. D. & Lott, M. T. Nucleotide mitochondrial DNA variation in human evolution and
disease. Gene 238, 211–230 (1999).
15. Underhill, P. A. et al. Y chromosome sequence variation and the history of human populations. Nature Genet. 26,
358–361 (2000).
16. Jobling, M. A. & Tyler-Smith, C. The human Y chromosome: an evolutionary marker comes of age. Nature Rev.
Genet. 4, 598–612 (2003).
17. Su, B. et al. Y-chromosome evidence for a northward migration of modern humans into eastern Asia during the
last ice age. Am. J. Hum. Genet. 65, 1718–1724 (1999).
18. Kivisild, T. et al. The emerging limbs and twigs of the East Asian mtDNA tree. Mol. Biol. Evol. 19, 1737–1751
(2002).
19. Roberts, D. F. & Hiorns, R.W.Methods of analysis of the genetic composition of a hybrid population. Hum. Biol.
37, 38–43 (1965).
20. Bertorelle, G.& Excoffier, L. Inferring admixture proportions from molecular data. Mol. Biol. Evol. 15,
1298–1311 (1998).
21. Wang, J. Maximum-likelihood estimation of admixture proportions from genetic data. Genetics 164, 747–765
(2003).
22. Wen, B. et al. Analyses of genetic structure of Tibeto-Burman populations revealed a gender-biased admixture in
southern Tibeto-Burmans. Am. J. Hum. Genet. 74, 856–865 (2004).
23. Jin, L. & Su, B. Natives or immigrants: modern human origin in East Asia. Nature Rev. Genet. 1, 126–133
(2000).
24. The Y Chromosome Consortium, A nomenclature system for the tree of human Y-chromosomal binary
haplogroups. Genome Res. 12, 339–348 (2002).
25. Excoffier, L., Smouse, P. E. & Quattro, J. M. Analysis of molecular variance inferred from metric distances
among DNA haplotypes: application to human mitochondrial DNA restriction data. Genetics 131, 479–491 (1992).
26. Schneider, S., et al. Arlequin: Ver. 2.000. A software for population genetic analysis. (Genetics and Biometry
Laboratory, Univ. of Geneva, Geneva, 2000).
27. Dupanloup, I. & Bertorelle, G. Inferring admixture proportions from molecular data: extension to any number of
parental populations. Mol. Biol. Evol. 18, 672–675 (2001).
28. Chakraborty, R. Gene admixture in human populations:Models and predictions. Yb. Phys. Anthropol.29, 1–43
(1986).
29. Sans,M. et al. Unequal contributions of male and female gene pools from parental populations in the African
descendants of the city of Melo, Uruguay. Am. J. Phys. Anthropol. 118, 33–44 (2002).
补充信息本论文的补充信息置于
www.nature.com/nature.

致谢感谢所有为本研究提供样品的志愿者。样本采集得到
NSFC和
STCSM基金给予复旦大学的资助。金力、
Ranjan Deka和
Ranajit Chakraborty得到
NIH和
NSF基金的资助。

争取利益声明作者声明其并无争取经济利益之意向。

通讯以及获取数据资料可致信金力
(lijin@fudan.edu
li.jin@uc.edu). 15个汉族群体的
711个体线粒体高

1区序列已提交
GenBank, 序列号
AY594701-AY595411。



http://www.xinhuanet.com/chinanews/2004-09/16/content_2883407.htm

遗传学研究支持汉文化扩散源于人口扩张

新华网上海频道记者 张学全 仇逸9月16日报道:上海复旦大学生命科学学院现代人类学研究中心和摩尔根-谈家桢国际生命科学中心的文波、李辉等科研人员通过系统地分析汉族群体的Y染色体和线粒体DNA多态性,揭开了全世界最大的民族汉族的文化扩散模式的神秘面纱,研究结果表明:汉文化向南扩散的机制符合人口扩张模式,而且在扩张中男性占主导地位。论文《遗传学证据支持汉文化的人口扩张模式》在英国今天出版的《自然》(《NATURE》)杂志发表。   

语言和文化的扩散存在两种模式:一为人口扩张、即人口迁徙模式;另一为文化传播模式,人群中有文化传播、基因交流却很有限。历史记载,汉族源于古代中国北方的华夏部落,在过去的两千多年间,汉文化扩散到了中国南方,而中国南方的原住民族则是说侗台、南亚和苗瑶语的人群。经典遗传标记和微卫星位点研究显示:汉族可以以长江为界,分为两个遗传亚群,南方汉族和北方汉族。两个亚群之间虽然方言和习俗差异很显著,但是有着许多共同的Y染色体和线粒体类型。   

研究人员将南方汉族的遗传结构和北方汉族、南方原住民族两个亲本群体进行比较,分析了来自中国28个地区汉族群体的Y染色体非重组区和线粒体DNA,这些样本覆盖了我国绝大部分的省份。   

南方汉族与北方汉族的Y染色体类型及频率分布非常相近,说明南方汉族在父系上与北方汉族非常相似,受到南方原住居民的影响很小。母系方面,北方汉族与南方汉族的线粒体类型的分布非常不同,南北汉族之间有极其显著的差异,南方汉族受到南方原住民族的影响较大。总体上北方汉族对南方汉族的遗传贡献父系比母系高得多,南方汉族中北方汉族的贡献比例由北向南递减。

复旦大学生命科学学院院长金力教授认为:汉文化的扩散中确实发生了大规模的人群迁徙。首先,几乎所有的汉族群体的Y染色体单倍群分布极为相似;其次,北方汉族对南方汉族的遗传贡献无论从父系还是母系方面都十分可观。在汉族的扩张过程中,南方汉族与南方原住民族发生了基因融合,但这一融合具有性别偏向性:融入到南方汉族中的南方原住民族女性远远多于男性,而北方汉族的男性对南方汉族做出了更大的贡献。

遗传学的研究与历史记载相吻合:受到北方战乱和饥荒的影响,汉人不断南迁,大量的北方移民改变了中国南方的遗传构成,而汉族人口扩张的同时也带动了汉文化的扩散。北方汉族、南方汉族和南方原住民族之间基因交流造成的族群混合也在很大程度上改变了中国人群的遗传结构。(完)








http://www.nature.com/nature/journal/v431/n7006/full/nature02878.html


遗传学证实汉文化的扩散源于人口扩张

文波1,2,李辉1,卢大儒1,宋秀峰1,张锋1,何云刚1,李峰1,高扬1,毛显赟1,张良1,钱
吉1,谭婧泽1,金建中1,黄薇2,Ranjan Deka3, 宿兵1,3,4,Ranajit Chakraborty3, 金力1,3
1. 复旦大学 现代人类学研究中心 遗传工程国家重点实验室 生命科学学院 摩尔根—谈国际生命科学中心,上海 200433,中国
2. 国家人类基因组南方研究中心,上海 201203,中国
3. 辛辛纳提大学 环境健康系 基因组信息中心,辛辛纳提,俄亥俄州45267,美国
4. 中国科学院昆明动物研究所 细胞与分子进化重点实验室,昆明 650223,中国


语言和文化在人群间的扩散有两种不同的模式:一种是人口扩张、人群迁徙模式;
另一种是文化传播模式,人群之间有文化传播,而基因交流却很有限。同一语系的欧
洲人群的形成机制争议颇多,争论的焦点在于来自近东的农业文明和语言的扩散是否
伴随着大量的农业人口的迁移[1-3]。有着共同的文化和语言的汉族,人口超过了十一亿
六千万(2000 年人口统计),无疑是全世界最大的民族。因此汉文化的扩散过程广受各
领域研究者的关注。通过系统地对汉族群体的Y 染色体和线粒体DNA 多态性进行分析,
我们发现汉文化向南扩散的格局符合人口扩张模式,而且在扩张过程中男性占主导地
位。


史载汉族源于古代中国北方的华夏部落,在过去的两千多年间,汉文化(汉语和相关的文
化传统)扩散到了中国南方,而中国南方原住民族则是说侗台、南亚和苗瑶语的人群(百越、
百濮和荆蛮)[4-5]。经典遗传标记和微卫星位点研究显示,汉族和其他东亚人群一样都可以以
长江为界分为两个遗传亚群,南方汉族和北方汉族[6-9]。两个亚群之间的方言和习俗差异也很
显著[10]。这些现象看似支持文化传播模式,即汉族向南扩张主要是文化传播和同化的结果。
然而,两个亚群之间有着许多共同的Y 染色体和线粒体类型[11-12],历史记载的汉族移民史[5]
也与汉族的文化传播模式假说相矛盾。本研究对这两种假说进行了检验,证实汉文化的扩散
中的确发生了大规模的人群迁徙(人口扩张模式)。

图1 调查群体的地理分布。图中标出了历史记载中自北而南的三次迁徙浪潮。各群体的详细信息见补充材料
1。群体1-14 是北方汉族,15-28 是南方汉族。实线、段线和虚线依次表示三次迁徙浪潮。第一次发生于西晋
时期(公元265-316 年),迁徙人口约90 万(大约当时南方人口的六分之一);第二次发生于唐代(公元618-907
年)规模比第一次大得多;第三次发生于南宋(公元1127-1279 年),迁徙人口近500 万


为了验证这些假说,我们把南方汉族的遗传结构与两个亲本群体作比较,其一是北方汉
族,其二是南方原住民族,即现居于中国境内和若干邻国的侗台、苗瑶和南亚语群体。我们
分析了来自中国28 个地区汉族群体的Y 染色体非重组区(NRY)和线粒体DNA(mtDNA)遗传多
态[13-16],这些样本覆盖了中国绝大部分的省份(详见图1 和补充信息表1)。

父系方面,南方汉族与北方汉族的Y 染色体单倍群频率分布非常相近(见补充信息表2),
尤其是具有M122-C 突变的单倍群 (O3-M122 和O3e-M134) 普遍存在于我们研究的汉族群体
中(北方汉族在37-71%之间,平均53.8%;南方汉族在35-74%之间,平均54.2%)。南方原
住民族中普遍出现的单倍群M119-C(O1)和M95-T(O2a)在南方汉族中的频率(3-42%,平均
19%)高于北方汉族(1-10%,平均5%)。而且,南方原住民族中普遍存在的单倍群
O1b-M110,O2a1-M88 和O3d-M7[17], 在南方汉族中低频存在(平均4%),而北方汉族中却没观
察到。如果我们假定起始于两千多年前的汉文化扩散[5]之前南方原住民族的Y 类型频率与现
在基本一致的话,南方汉族中南方原住民族的成分应该是不多的。分子方差分析(AMOVA)进
一步显示北方汉族和南方汉族的Y 染色体单倍群频率分布没有显著差异(Fst=0.006,P>0.05),
说明南方汉族在父系上与北方汉族非常相似。


母系方面,北方汉族与南方汉族的线粒体单倍群分布非常不同(补充信息表3)。东亚北
部的主要单倍群(A,C,D,G,M8a,Y,Z)在北方汉族中的频率(49-64%,平均55%)比在南方汉族
中(19-52%,平均36%)高得多。另一方面,南方原住民族的主要单倍群(B,F,R9a,R9b,N9a)[12,14,18]
在南方汉族中的频率(36-72%,平均55%)要比在北方汉族(18-42%,平均33%)高得多。线
粒体类型的分布在南北汉族之间有极显著差异(Fst=0.006,P<10-5)。虽然南北汉族之间线粒体和
Y 染色体的Fst 值相近,但线粒体的南北差异Fst 值占群体间总方差的56%,而Y 染色体仅仅
占18%。


用汉族群体的单倍群频率数据所做的主成分(PC)分析与以上结果相一致。对NRY 分析
发现,几乎所有的汉族群体都聚在图2a 的右上方。北方汉族和南方原住民族在第2 主成分上
分离,南方汉族的第2 主成分值处于北方汉族和南方原住民族之间,但是更接近于北方汉族
(北方汉族0.58±0.01;南方汉族0.46±0.03;南方原住民族-0.32±0.05),这表明南方汉族
在父系上与北方汉族相近,受到南方原住民族的影响很小。就mtDNA 而言,北方汉族和南方
原住民族仍然被第2 主成分分开(图2b),南方汉族也在两者之间但稍微接近南方原住民族(北
方汉族0.56±0.02;南方汉族0.09±0.06;南方原住民族-0.23±0.04),表明南方汉族的女
性基因库比男性基因库有更多的混合成分。


图2 主成分散点图。a 为Y 染色体单倍群散点图,b 为线粒体单倍群散点图。群体标记:▲北方汉族,△南
方汉族,+侗台语民族,×南亚语民族,*苗瑶语民族。
我们进一步用两种不同的统计方法[19-20]来估计两个亲本(北方汉族和南方原住民)对南
方汉族基因库的相对贡献(表1),这两个统计量用于单位点(single-locus)分析时比其它的
方法更为准确[21]。两种方法得到的混合系数估计值(M,北方汉族的贡献比例)高度一致(Y
染色体,r=0.922,P<0.01;线粒体,r=0.970,P<0.01)。就Y 染色体而言,所有的南方汉族都包
含很高比例的北方汉族混合比率(MBE:0.82 ± 0.14, 范围0.54-1 ;MRH:0.82 ± 0.12,范围
0.61-0.97)(MBE 和MRH 的定义分别见参考文献20 和19),这表明南方汉族男性基因库的主
要贡献成分来自北方汉族。相反,南方汉族的线粒体基因库中北方汉族和南方原住民族的贡
献比例几乎相等(MBE:0.56±0.24[0.15,0.95]; MRH:0.50±0.26[0.07,0.91])。总体上北方汉
族对南方汉族的遗传贡献父系比母系高得多(t-test,P<0.01);各群体分别看也是这样:绝
大部分南方汉族群体中北方汉族的贡献在父系上大于母系(MBE ,11/13, MRH,13/13, P<0.01,
零假设为男女的贡献相等为二项式分布),这表明南方汉族的群体混合过程有很强的性别偏
向。南方汉族中北方汉族贡献的比例(M)呈现出由北向南递减的梯度地理格局。南方汉族线粒
体的M 值与纬度正相关(r2=0.569,P<0.01),但Y 染色体的相关性不显著(r2=0.072,P>0.05),
因为南方汉族父系的M 值差异太小,不足以导致统计上的显著性。




综上所述,我们提出了两项证据支持汉文化扩散的人口扩张假说。首先,几乎所有的汉
族群体的Y 染色体单倍群分布都极为相似,Y 染色体主成分分析也把几乎所有的汉族群体都
集合成一个紧密的聚类。再有,北方汉族对南方汉族的遗传贡献无论父系方面还是母系方面
都是可观的,在线粒体DNA 分布上也存在地理梯度。北方汉族对南方汉族的遗传贡献在父系
(Y 染色体)上远大于母系(线粒体),表明这一扩张过程中汉族男性处于主导地位;换个角
度看,在汉族和南方原住民的融合过程中有相对较多的当地女性融入南方汉族中。性别偏向
的混合格局也同样存在于藏缅语人群中
[22]。


据历史记载,受北方战乱和饥荒的影响,汉人不断的南迁,图1 中画出了三次大规模移
民的浪潮。在两千多年间,除了这三次大潮,各个时期几乎都有小规模的南迁。所以,我们
的遗传研究也与历史记载相吻合。大量的北方移民改变了中国南方的遗传构成,而汉族人口
扩张的同时也带动了汉文化的扩散。除了大规模的人群迁徙,北方汉族、南方汉族和南方原
住民族之间的基因交流造成的族群混合也在很大程度上改变了中国人群的遗传结构。

方法
样本

采集中国各地的17 个汉族群体871 个随机不相关个体的血样。用酚-氯仿法抽提基因组DNA。结合文献
报道的Y 染色体和线粒体多态性数据,总共分析的样本量是:Y 染色体23 个群体1289 人,线粒体23 个群体
1119 人。这些样本涉及了中国的大部分省份(图1 和补充材料表1)。

遗传标记
通过聚合酶链式反应—限制性片断长度多态性(PCR-RFLP)的方法[11]分型Y 染色体上的13 个双等位标记:
YAP,M15,M130,M89,M9,M122,M134,M119,M110,M95,M88,M45,M120。根据Y 染色体委员会的命名系统
(YCC)[24],这些标记构成13 个单倍群,在东亚人群中具有较高的信息量[23]。
线粒体上,对高变1 区(HVS-1)进行测序,对编码区8 个多态位点作了分型(9-bp 缺失, 10397 AluI, 5176
AluI, 4831 HhaI, 13259 HincII, 663 HaeIII, 12406 HpaI , 9820 HinfI),有关方法已有报道[22]。根据东
亚线粒体系统树[18],用高变1 区突变结构和编码区多态性构建单倍群。

数据分析
根据线粒体和Y 染色体单倍群频率,用SPSS10.0 软件(SPSS 公司)作主成分分析,研究群体间关系。南
北汉族的遗传差异用ARLEQUIN 软件[26]做AMOVA 检验[25]。南方汉族中北方汉族和南方原住民族的混合比
例估计用两种不同的统计方法[19-20]:ADMIX 2.0[27]和LEADMIX[21]软件。亲本群体的选择对混合比例的适当
估计很重要[28-29],我们通过扩大东亚的参考数据来减小偏差。分析中,10 个北方汉族群体的各单倍群频率(Y
染色体和线粒体标记分别分析)的算术平均作为北方亲本群体。南方原住民族的频率平均了三个族群:侗台
语群(NRY,22 群体;线粒体,11 群体),南亚语群(NRY,6 群体;线粒体,5 群体),苗瑶语群(NRY,
18 群体;线粒体,14 群体)。通过样本的混合比例与纬度[1,3]的线性回归分析揭示汉族群体的地理格局。

2004 年4 月28 日收稿;7 月20 日定稿;doi:10.1038/nature02878.

参考文献
1. Cavalli-Sforza, L. L.,Menozzi, P. & Piazza, A. The History and Geography of Human Genes (Princeton Univ. Press,
Princeton, 1994).
2. Sokal, R., Oden, N. L. &Wilson, C. Genetic evidence for the spread of agriculture in Europe by demic diffusion.
Nature 351, 143–145 (1991).
3. Chikhi, L. et al. Y genetic data support the Neolithic demic diffusion model. Proc. Natl Acad. Sci. USA 99,
11008–11013 (2002).
4. 费孝通. 中华民族多元一体格局. (中央民族大学出版社, 北京, 1999).
5. 葛剑雄, 吴松弟, 曹树基. 中国移民史(福建人民出版社,福州, 1997).
6. Zhao, T. M. & Lee, T. D.Gmand Kmallotypes in 74 Chinese populations: a hypothesis of the origin of the Chinese
nation. Hum. Genet. 83, 101–110 (1989).
7. Du, R. F., Xiao, C. J. & Cavalli-Sforza, L. L. Genetic distances calculated on gene frequencies of 38 loci. Science
in China Ser. C 40, 613 (1997).
8. Chu, J. Y. et al. Genetic relationship of populations in China. Proc. Natl Acad. Sci. USA 95,11763–11768 (1998).
9. Xiao, C. J. et al. Principal component analysis of gene frequencies of Chinese populations. Sci.China C,43,
472–481 (2000).
10. Xu, Y. T. A brief study on the origin of Han nationality. J. Centr. Univ. Natl 30, 59–64 (2003).
11. Su, B. et al. Y chromosome haplotypes reveal prehistorical migrations to the Himalayas. Hum. Genet.107,
582–590 (2000).
12. Yao, Y. G. et al. Phylogeographic
13. Cavalli-Sforza, L. L. & Feldman, M.W. The application of molecular genetic approaches to the study of human
evolution. Nature Genet. 33, 266–275 (2003).
14. Wallace, D. C., Brown, M. D. & Lott, M. T. Nucleotide mitochondrial DNA variation in human evolution and
disease. Gene 238, 211–230 (1999).
15. Underhill, P. A. et al. Y chromosome sequence variation and the history of human populations. Nature Genet. 26,
358–361 (2000).
16. Jobling, M. A. & Tyler-Smith, C. The human Y chromosome: an evolutionary marker comes of age. Nature Rev.
Genet. 4, 598–612 (2003).
17. Su, B. et al. Y-chromosome evidence for a northward migration of modern humans into eastern Asia during the
last ice age. Am. J. Hum. Genet. 65, 1718–1724 (1999).
18. Kivisild, T. et al. The emerging limbs and twigs of the East Asian mtDNA tree. Mol. Biol. Evol. 19, 1737–1751
(2002).
19. Roberts, D. F. & Hiorns, R.W.Methods of analysis of the genetic composition of a hybrid population. Hum. Biol.
37, 38–43 (1965).
20. Bertorelle, G.& Excoffier, L. Inferring admixture proportions from molecular data. Mol. Biol. Evol. 15,
1298–1311 (1998).
21. Wang, J. Maximum-likelihood estimation of admixture proportions from genetic data. Genetics 164, 747–765
(2003).
22. Wen, B. et al. Analyses of genetic structure of Tibeto-Burman populations revealed a gender-biased admixture in
southern Tibeto-Burmans. Am. J. Hum. Genet. 74, 856–865 (2004).
23. Jin, L. & Su, B. Natives or immigrants: modern human origin in East Asia. Nature Rev. Genet. 1, 126–133
(2000).
24. The Y Chromosome Consortium, A nomenclature system for the tree of human Y-chromosomal binary
haplogroups. Genome Res. 12, 339–348 (2002).
25. Excoffier, L., Smouse, P. E. & Quattro, J. M. Analysis of molecular variance inferred from metric distances
among DNA haplotypes: application to human mitochondrial DNA restriction data. Genetics 131, 479–491 (1992).
26. Schneider, S., et al. Arlequin: Ver. 2.000. A software for population genetic analysis. (Genetics and Biometry
Laboratory, Univ. of Geneva, Geneva, 2000).
27. Dupanloup, I. & Bertorelle, G. Inferring admixture proportions from molecular data: extension to any number of
parental populations. Mol. Biol. Evol. 18, 672–675 (2001).
28. Chakraborty, R. Gene admixture in human populations:Models and predictions. Yb. Phys. Anthropol.29, 1–43
(1986).
29. Sans,M. et al. Unequal contributions of male and female gene pools from parental populations in the African
descendants of the city of Melo, Uruguay. Am. J. Phys. Anthropol. 118, 33–44 (2002).
补充信息本论文的补充信息置于
www.nature.com/nature.

致谢感谢所有为本研究提供样品的志愿者。样本采集得到
NSFC和
STCSM基金给予复旦大学的资助。金力、
Ranjan Deka和
Ranajit Chakraborty得到
NIH和
NSF基金的资助。

争取利益声明作者声明其并无争取经济利益之意向。

通讯以及获取数据资料可致信金力
(lijin@fudan.edu
li.jin@uc.edu). 15个汉族群体的
711个体线粒体高

1区序列已提交
GenBank, 序列号
AY594701-AY595411。

“得到NIH和NSF基金的资助”——看有没有人来口诛笔伐
兰州文章还是排版一下吧,分段很着急啊!还有大字报是要扣分的。
个人认为不冲突,否则那些小比例基因怎么来的。
5号字体也算大字报?现在显示器基本没有20寸以下的了吧?字小了了眼睛不累吗?好吧,我改成3号的了。
人口扩张,自然文化也就随之扩张了
现代西方文化发达,世界认同感强,扩散广也是西方人口扩张造成的?
从此说汉族血统不纯正的人可以闭嘴了。
汉文化的扩散和人口迁移相关,这是很自然的事情,在DNA发现之前,许多学者也是这种看法。
关键是,这和文化认同论有什么关系?这种标题和内容不一致。
我能说此文从一个侧面证明了匈奴、氐、羯、羌、鲜卑、突厥、契丹、渤海、女直等古民族的基因与汉族相同吗?
古往今来如此
大怯懦鸡 发表于 2014-5-8 10:46
现代西方文化发达,世界认同感强,扩散广也是西方人口扩张造成的?
语言和文化在人群间的扩散有两种不同的模式:一种是人口扩张、人群迁徙模式;
另一种是文化传播模式,人群之间有文化传播,而基因交流却很有限。————显然西方文化传播属于第二种
汉族今天这么多的人口,是历史上汉人的人口扩张造成的,还是原来非汉人认同汉文化因而汉化成汉人造成的?这 ...
中国历史上在汉代以后北方至少有三次民族大融合大迁徙期:1、两晋南北朝时期,2、五代十国期,3、宋元明清时期。这点你承认吧?假如你不承认的话,那就没有探讨必要了。如果你承认的话,那么该篇文章证明了现代北方汉族与南方汉族Y染色体基本一致,证明了南方汉族就是由于北方汉族迁徙形成的。而北方汉族历史上是存在着与我上面回复中提到的那些古民族漫长融合的过程。那么在这数次民族大迁徙中,迁徙的主体北方汉民族的基因中必定包含着那些古民族的基因,而北方汉族又将这些基因带到了南方,形成了现代南方汉族。那么只有两种可能:1、古汉族基因与其他古民族十分相似,也就是证明了史书上那些古民族宣称的他们是黄帝的后裔是接近事实的。2、古汉族已经被彻底的融合了,我们都是古汉族与那些古民族通婚后的后裔,世界上在血统上已不存在纯粹的汉族了。做为一位大汉族主义者,一定不希望这种结论的得出吧?
现在汉人扩张到美国去了,你说说他们是中国人还是美国人?
整天强调这些干嘛,想搞分裂啊来自: Android客户端
我能说此文从一个侧面证明了匈奴、氐、羯、羌、鲜卑、突厥、契丹、渤海、女直等古民族的基因与汉族相同吗?
突厥人例外,他们是今天的土耳其人,是维吾尔族的先祖。
laziji001 发表于 2014-5-10 19:37
汉族今天这么多的人口,是历史上汉人的人口扩张造成的,还是原来非汉人认同汉文化因而汉化成汉人造成的?这 ...
汉族人口众多,当然离不开自身的繁衍和扩张,这还用怀疑吗?
朝鲜人曾有一段时间相当认同儒学等汉族文化 ,也没有人因此而认定朝鲜人也是汉族。

阡阡陌 发表于 2014-5-11 04:15
整天强调这些干嘛,想搞分裂啊


第一种,整天搞汉族是纯文化民族,否认有其形成的主体,将汉民族彻底虚无化。
第二种,一味强调汉民族绝对纯净,搞种族主义,这个明眼人一看就破。

第二种有危害,但第一种更隐蔽,并且还能迷惑不少汉族内部的糊涂蛋。
阡阡陌 发表于 2014-5-11 04:15
整天强调这些干嘛,想搞分裂啊


第一种,整天搞汉族是纯文化民族,否认有其形成的主体,将汉民族彻底虚无化。
第二种,一味强调汉民族绝对纯净,搞种族主义,这个明眼人一看就破。

第二种有危害,但第一种更隐蔽,并且还能迷惑不少汉族内部的糊涂蛋。
可笑所以哈哈 发表于 2014-5-10 12:22
我能说此文从一个侧面证明了匈奴、氐、羯、羌、鲜卑、突厥、契丹、渤海、女直等古民族的基因与汉族相同吗?
所以我一直说华夷皆汉族来着……
如果非要从现代民族论来看古代史的话,只能说汉文化扩张是在汉族内部的文化统一过程了
草原野狼 发表于 2014-5-11 04:47
突厥人例外,他们是今天的土耳其人,是维吾尔族的先祖。
维吾尔的祖先是回鹘,而攻灭东突厥的时候,回鹘可以算是最后下杀手的……
佛利萨 发表于 2014-5-11 14:33
第一种,整天搞汉族是纯文化民族,否认有其形成的主体,将汉民族彻底虚无化。
第二种,一味强调汉民族 ...
民族本来就是西方玩出来的伪概念而已,跟中国有什么关系?
St_Satan 发表于 2014-5-12 17:26
民族本来就是西方玩出来的伪概念而已,跟中国有什么关系?
嘿嘿,文化认同的那部份现在已经是外国了。血缘那部份就是那几十朵花了(除了色目人哈),其实啊血统啊什么现在已经落后了,要像老美那样以立场来论才好的,呵呵,胡,赵?,江,胡,习,?
汉族整体来说本来就在血统上就是一个民族,纯文化论跟纯血统论来划分是不是汉族都是片面的。