當代擁有近12億人口的漢族,是世界上最大的族群。漢族在其形成的漫長歷史中,向四處不斷的遷移,與周邊民族的交往,外族基因不斷地流入,不同地區文化的互動,地理環境的影響和隔離,方言林立且差異懸殊,經濟發展的不均衡,形成了許多各具社會文化特色的漢族亞群體。
我國漢族的亞群體確確實實是存在的,但從來沒有一個統一的劃分依據和標準,而是各學科根據各自的需要制定自己的標準來劃分的。官方的劃分中,最著名的為語言學的劃分,語言學家根據方言,把漢族分為北方、湘、贛、吳、閩、粵和客家七大方言區人群,每一方言區再被細分若干亞方言區。而其他學科因沒有相應的標準,往往以長江為界,把漢族簡單地分為南方人和北方人。更多的情況下,以省(區、直轄市)行政區劃為單位來區分漢族亞群體,如河南人、山東人、上海人等。也有以大行政區劃為單位結合人類文化學的特徵來區分漢族亞群體,如華北人、華南人等。
民間存在着不正規的劃分現象,主要表現以家譜或幾姓聯譜的形式存在,這在我國的東南和南方地區、港澳台地區和海外華僑中十分盛行。民間的家譜類的傳統資料是研究中國漢族亞群體的重要材料,以美國猶他州國際家譜研究中心為代表的一批國際研究機構,長期以來一直十分重視收集中國人的家譜,一直結合各種學科的需要。研究着中國人家譜的歷史、今天和將來。我國國家圖書館和上海圖書館等收藏了中國年代最古、質量最高的家譜,全國圖書館收藏的家譜種類達2萬多種,總數大約有20萬冊,這還不包括民間收藏的和1949年以後重修和新修的家譜。這是一筆巨大的財富和具有持續研究價值的寶貴資源。
華夏民族在遷移和進化的過程中,北方地區主要交往和融合的是北方地區的少數民族,如匈奴、鮮卑、突厥、羌、蒙古等屬北蒙古人種的民族;兩廣、閩、台地區主要交往和融合的是南方地區的少數民族,如南越、交趾等屬南蒙古人種的民族。北方地理地形平坦,人群遷移容易,人群間的同化和語言統一要比南方地區快;南方丘陵起伏,地形複雜,氣候惡劣,人群遷移困難,人群間的同化時間長,互相交往困難,造成地理上的隔離狀態,語言變化很大,形成無數的"族群島"。近12億人口的漢族,分布於全國各地,雖同為漢族,南北之間方言雜亂,幾乎到不能通話的地步;幾千年的漢族進化歷史也證明了南北地區的漢族存在差異,而且是一種群體遺傳基因進化上的差異。因為文化上的差異,包括語言上的差異,政府通過政策法令,可以在不長的時間改變或縮小這類差異,這類差異不是根本性的;幾千年的不同程度的隔離和遺傳基因進化中所造成的不同地區漢族亞群體之間的差異才是本質上的區別。
中國漢族姓氏在歷史上的傳遞是連續和穩定的,在歷史的進程中所展現的血緣文化的痕跡與生命遺傳物質,特別是代表男性的Y染色體的遺傳具有基本相同和平行的表現。因此,用群體遺傳學的分析方法可以分析漢族姓氏。並發現漢族從宋朝開始已經形成了南北兩大群體。
南北兩大人群的異源性,其地理分界線應在中國南部福建省與江西省交界的武夷山和廣東省與湖南省交界的南嶺一帶。北部14個省又明顯的劃分為兩塊,其中浙江、江蘇、江西和安徽四省形成了東南地區人群,其聚類的順序也很合理,反映了古吳越民族與中原地區南下人群混合的歷史痕跡。剩下的10省進一步可劃分成兩塊,其中湖南和廣西二省組合在一起,在宋朝時該地區是一塊很荒涼的"蠻"地,其餘的8個省包括了全部北方省份和西南省份,其特點是,北方省區和西北省區的人群之間的姓氏遺傳距離都較小,反映了該地區人群經歷了長期頻繁的遷移、混居和融合,形成了互相依存的北方人群。而西南省份的人群在歷史上一直主要與北方省份的人群進行交流,四川地區(包括貴州和雲南)的聚類位置也反映了這一歷史。湖北是一個十分特殊的省份,它處於長江的中游,北面河南和陝西,西接四川,東臨安徽和江西,南靠湖南,是中國歷史上兵家必爭之地。
明朝的人群地理分布特徵已與當代的分布基本一致,其南北兩大異源漢族的地域分界線也應在武夷山和南嶺一帶,而不是在長江。與宋朝的地域人群分布相比較,廣西已與湖南分離而與廣東、福建聚類。長江中上游的江西、湖南、湖北和四川形成了一塊更接近於北方的區域,而江蘇、浙江和安徽形成長江下游區域,但仍與南方人群血緣較遠,更接近北方人群。
當代中國漢族的南北兩大人群的異源性,以及明顯的分界地域在南部的武夷山和南嶺一帶。29個省市區分為南北兩大塊,而且其遺傳距離很大。南方漢族包括福建、台灣、廣東、廣西三省一區(包括海南省、香港、澳門)。北方地區的東北三省、內蒙古和河北、北京和天津、以及山東和河南之間的遺傳距離很近,都聚集在一起。隨後,西北地區的陝西、甘肅、寧夏、山西、新疆聚在一起。安徽的姓氏分布表明其屬於北方,但又接近長江流域的省份,所以安徽最後與北方的省份聚類。長江中上游的省份湖北、四川、湖南、貴州、江西、雲南先後聚類在一起,形成一個亞群體,然後與北方的人群聚類,這是十分合理的。東部的浙江、江蘇、上海聚類在一起,與南方的群體有一定的淵源,但幾千年的進化使這一地區的人群更接近北方,所以最終與北方地區聚類。青海最後與北方聚類在一起,而不是先與陝甘寧聚類,這可能與青海的姓氏樣本有關。
總而言之,宋、明、今三個時期的姓氏遺傳距離分析結果表明,在中國1 000年前的宋朝已經形成了南北兩大區域的人群,從姓氏遺傳信息上明顯地顯示出南北兩大區域人群結構的區別,表明南北兩大區域人群的不同源性,其明顯的地域分界線在南方的武夷山和南嶺,而不是長江。中國人姓氏的歷史至少已有4000年以上,主要起源於中國西北和中原地區的民族,融合併同化了各個時期周邊各民族的姓氏,形成了中國幾千年來一直在使用的漢字姓氏。根據1 000年來的中國人姓氏分布和對人群遷移、混居和融合情況的分析,基本上反映了當時的民族聯合和進化的歷史,也說明了中原地區的人群是組成中華民族的主體,它融合了南北各個時期的民族成分,尤其是北方地區的民族成分,形成了互相依存不可分割的當代的中華民族的整體。當代人群分布的情況基本上與明朝、宋朝人群分布具有很高相似性和漸變的過程,它們之間的區別點正是反映了這1000年期間人群進一步遷移與分化的結果。