当代拥有近12亿人口的汉族,是世界上最大的族群。汉族在其形成的漫长历史中,向四处不断的迁移,与周边民族的交往,外族基因不断地流入,不同地区文化的互动,地理环境的影响和隔离,方言林立且差异悬殊,经济发展的不均衡,形成了许多各具社会文化特色的汉族亚群体。
我国汉族的亚群体确确实实是存在的,但从来没有一个统一的划分依据和标准,而是各学科根据各自的需要制定自己的标准来划分的。官方的划分中,最著名的为语言学的划分,语言学家根据方言,把汉族分为北方、湘、赣、吴、闽、粤和客家七大方言区人群,每一方言区再被细分若干亚方言区。而其他学科因没有相应的标准,往往以长江为界,把汉族简单地分为南方人和北方人。更多的情况下,以省(区、直辖市)行政区划为单位来区分汉族亚群体,如河南人、山东人、上海人等。也有以大行政区划为单位结合人类文化学的特征来区分汉族亚群体,如华北人、华南人等。
民间存在着不正规的划分现象,主要表现以家谱或几姓联谱的形式存在,这在我国的东南和南方地区、港澳台地区和海外华侨中十分盛行。民间的家谱类的传统资料是研究中国汉族亚群体的重要材料,以美国犹他州国际家谱研究中心为代表的一批国际研究机构,长期以来一直十分重视收集中国人的家谱,一直结合各种学科的需要。研究着中国人家谱的历史、今天和将来。我国国家图书馆和上海图书馆等收藏了中国年代最古、质量最高的家谱,全国图书馆收藏的家谱种类达2万多种,总数大约有20万册,这还不包括民间收藏的和1949年以后重修和新修的家谱。这是一笔巨大的财富和具有持续研究价值的宝贵资源。
华夏民族在迁移和进化的过程中,北方地区主要交往和融合的是北方地区的少数民族,如匈奴、鲜卑、突厥、羌、蒙古等属北蒙古人种的民族;两广、闽、台地区主要交往和融合的是南方地区的少数民族,如南越、交趾等属南蒙古人种的民族。北方地理地形平坦,人群迁移容易,人群间的同化和语言统一要比南方地区快;南方丘陵起伏,地形复杂,气候恶劣,人群迁移困难,人群间的同化时间长,互相交往困难,造成地理上的隔离状态,语言变化很大,形成无数的"族群岛"。近12亿人口的汉族,分布于全国各地,虽同为汉族,南北之间方言杂乱,几乎到不能通话的地步;几千年的汉族进化历史也证明了南北地区的汉族存在差异,而且是一种群体遗传基因进化上的差异。因为文化上的差异,包括语言上的差异,政府通过政策法令,可以在不长的时间改变或缩小这类差异,这类差异不是根本性的;几千年的不同程度的隔离和遗传基因进化中所造成的不同地区汉族亚群体之间的差异才是本质上的区别。
中国汉族姓氏在历史上的传递是连续和稳定的,在历史的进程中所展现的血缘文化的痕迹与生命遗传物质,特别是代表男性的Y染色体的遗传具有基本相同和平行的表现。因此,用群体遗传学的分析方法可以分析汉族姓氏。并发现汉族从宋朝开始已经形成了南北两大群体。
南北两大人群的异源性,其地理分界线应在中国南部福建省与江西省交界的武夷山和广东省与湖南省交界的南岭一带。北部14个省又明显的划分为两块,其中浙江、江苏、江西和安徽四省形成了东南地区人群,其聚类的顺序也很合理,反映了古吴越民族与中原地区南下人群混合的历史痕迹。剩下的10省进一步可划分成两块,其中湖南和广西二省组合在一起,在宋朝时该地区是一块很荒凉的"蛮"地,其余的8个省包括了全部北方省份和西南省份,其特点是,北方省区和西北省区的人群之间的姓氏遗传距离都较小,反映了该地区人群经历了长期频繁的迁移、混居和融合,形成了互相依存的北方人群。而西南省份的人群在历史上一直主要与北方省份的人群进行交流,四川地区(包括贵州和云南)的聚类位置也反映了这一历史。湖北是一个十分特殊的省份,它处于长江的中游,北面河南和陕西,西接四川,东临安徽和江西,南靠湖南,是中国历史上兵家必争之地。
明朝的人群地理分布特征已与当代的分布基本一致,其南北两大异源汉族的地域分界线也应在武夷山和南岭一带,而不是在长江。与宋朝的地域人群分布相比较,广西已与湖南分离而与广东、福建聚类。长江中上游的江西、湖南、湖北和四川形成了一块更接近于北方的区域,而江苏、浙江和安徽形成长江下游区域,但仍与南方人群血缘较远,更接近北方人群。
当代中国汉族的南北两大人群的异源性,以及明显的分界地域在南部的武夷山和南岭一带。29个省市区分为南北两大块,而且其遗传距离很大。南方汉族包括福建、台湾、广东、广西三省一区(包括海南省、香港、澳门)。北方地区的东北三省、内蒙古和河北、北京和天津、以及山东和河南之间的遗传距离很近,都聚集在一起。随后,西北地区的陕西、甘肃、宁夏、山西、新疆聚在一起。安徽的姓氏分布表明其属于北方,但又接近长江流域的省份,所以安徽最后与北方的省份聚类。长江中上游的省份湖北、四川、湖南、贵州、江西、云南先后聚类在一起,形成一个亚群体,然后与北方的人群聚类,这是十分合理的。东部的浙江、江苏、上海聚类在一起,与南方的群体有一定的渊源,但几千年的进化使这一地区的人群更接近北方,所以最终与北方地区聚类。青海最后与北方聚类在一起,而不是先与陕甘宁聚类,这可能与青海的姓氏样本有关。
总而言之,宋、明、今三个时期的姓氏遗传距离分析结果表明,在中国1 000年前的宋朝已经形成了南北两大区域的人群,从姓氏遗传信息上明显地显示出南北两大区域人群结构的区别,表明南北两大区域人群的不同源性,其明显的地域分界线在南方的武夷山和南岭,而不是长江。中国人姓氏的历史至少已有4000年以上,主要起源于中国西北和中原地区的民族,融合并同化了各个时期周边各民族的姓氏,形成了中国几千年来一直在使用的汉字姓氏。根据1 000年来的中国人姓氏分布和对人群迁移、混居和融合情况的分析,基本上反映了当时的民族联合和进化的历史,也说明了中原地区的人群是组成中华民族的主体,它融合了南北各个时期的民族成分,尤其是北方地区的民族成分,形成了互相依存不可分割的当代的中华民族的整体。当代人群分布的情况基本上与明朝、宋朝人群分布具有很高相似性和渐变的过程,它们之间的区别点正是反映了这1000年期间人群进一步迁移与分化的结果。