【转帖】汉语起源之谜:汉藏语真是同源吗?

http://culture.ifeng.com/guoxue/200811/1117_4087_880957_1.shtml

汉语起源之谜:汉藏语真是同源吗?
2008年11月17日 09:40津报【大 中 小】 【打印】

分子人类学关于东亚人群DNA的研究,给了语言学家们莫大的启示,这也许为破解汉语起源之谜提供更多的线索。

汉语从哪里来?一直是个谜团。

17世纪,一名叫作韦伯的学者写道,“汉语是伊甸园中所讲的最初语言。” 而另一位想象力丰富的学者干脆说,汉语是“被称为中国的那个伟大国家的某位圣贤一下子发明出来的,其目的是为了居住在周围的不同民族的人群之间能够用这种语言进行口头交际。”

实际上,在中国人内部,这样富有想象力的说法也同样代代相传。直到最近100多年,由于现代语言学的兴起,汉语才被用来和其他语言类比分析,但有关汉语起源的种种假设却总是扑朔迷离。而近年来,分子人类学者们有关东亚人群迁徙的分析,似乎正在接近这个谜底的答案。

语言的足迹

1600年,一艘荷兰商船路经马达加斯加前往印尼。在经过了数月的航行后,他们到达了目的地,令船员们感到意外的是,他们发现,虽然相聚遥远,但当地的马来语与他们途经的马达加斯加的土著语有着惊人的相似之处。

难道在大航海时代开始之前,这些分布在各个海岛上的人群就早已横渡大洋,穿梭在广袤的海域中了吗?难道这些相隔万里的海岛居民竟然是比自己更加能干的航海者?水手们百思不得其解。

水手们并不知道,自己无意中的这个发现,竟然触碰到了语言的核心秘密。400年来,一代一代的语言学家追随着这个秘密,开始了伟大的发现历程。

1786年,英国的琼斯爵士通过对比研究关注到:意大利语、凯尔特语、日耳曼语以及波罗的语、斯拉夫语,与远在亚洲的印度雅利安语有某种程度上的相似之处,会不会这些语言有同一个源头?他提出了自己大胆的假设——这些广泛分布在欧洲和印度的语言有一个共同的祖先,这个假说被称为“印欧语系假说”。

琼斯的假设,让语言学家们开始尝试着对比、分析这些有着共同关系的语言之间的亲疏远近。1861年,德国语言学者施莱歇尔在达尔文的进化论的启发下,推导出语言也有着类似生物进化的过程,并给印欧语系画出了一棵“谱系树”,在这棵语言的谱系树上,原始的“印欧语”处于最底端,是“树干”,这个树干分出两个“树枝”,一枝是“斯拉夫-日耳曼语支”,另一枝是“雅利安-希腊-意大利-凯尔特语支”,这两个“树枝”再分别分出众多“ 小树杈”,如日耳曼语、立陶宛语、斯拉夫语、凯尔特语、意大利语、希腊语、伊朗语等等语言。

尽管施莱歇尔推导的这棵“印欧语系大树”并不完全精确,但他的方法立刻成为语言学家们观察这个纷繁复杂世界的利器。他们反过来去研究印欧语系之外的语言。

1600年那些荷兰水手们的疑惑,也得到了部分的解答。在北到台湾岛,南到新西兰,西到马达加斯加,东达复活节岛,横跨印度洋和太平洋的广袤海域上,的确存在一种共同渊源的海岛语系,尽管这种覆盖2亿人口,有着959种语言的语系内部形态千差万别,但它们却有着明确的同源关系,学者们将之称为“南岛语系”。在欧洲人进行海外殖民扩张之前,“南岛语”是世界上分布最广的语系。

那么古老而神秘的汉语是否也遵循这样的规律——同样是另外一种更加古老的语言分化而来,还是像学者们最初想象的那样,是由中国的某位圣贤独立创制而来?

从19世纪开始,语言学家们逐步发现,这个地球上人口最多的国度里面的语言也能像其它语系一样,描绘出一棵“谱系树”。在这棵谱系树上,汉语、藏语、缅语等有着亲缘关系,语言学者们提出了“汉藏语系”的假说。

东亚同源?

如果汉语真的和藏缅语有同源关系,那么它们来自何方,又是如何分化而成的呢?

1950年代,美国语言学者斯瓦迪士从统计学的角度分析不同语言,得出了约200个核心词,几乎每种语言都包括这些核心词汇,它们具有超强的稳定性。根据对比分析不同语言之间核心词的同源关系,就能大致判断出语言之间的亲疏远近,同时,这些核心词汇的变化具有一定的速率,而分析两种语言中核心词汇的不同比率,则可以推算出它们之间分化的大致时间。

在对比汉藏之间的同源词时,学者们发现,汉语和藏缅语之间有共同的数词一至十,但“千”和“万”却各并不相同,而在汉语中,“千”和“万”在殷商时期就已经出现,那么汉语与藏缅语与的分化必定早于殷商时期。语言学家们大致推断,这个时间距今约4000-5000年左右。

但在这种粗略的勾勒中,依然有很多矛盾难解之处。东亚地区语言的复杂性,远远超过了印欧语系。尽管经过长达一个多世纪的研究,语言学家们大致能够接受“汉藏语系”这种假说,但其间的分歧依然很大。

中国的语言学家李方桂早在1934年就提出,汉语不但与藏缅语有亲缘关系,同时和苗瑶语、侗台语也有亲缘关系,而美国学者本尼迪克特则认为,苗瑶语、侗台语与汉语关系不大,反而与日语、南岛语有着亲缘关系。

颠覆性的观点来自1990年。当年,第23届国际汉藏语会议召开。就在会议正有条不紊地进行时,法国东亚语言学研究中心的学者沙加尔提交了一篇名为《汉语南岛语同一起源论》的文章。这个文章刚刚公布,就立即引发轩然大波。对于普通公众来说,这份标记有各种语音符号及绕口的学术名词的论文不亚于一篇“天书”,但在座的学者们却明白,这份论文的观点一旦成立,将是对传统的“汉藏语系假说”的最大挑战。

沙加尔认为,汉语与南岛语之间存在着不少的同源词,而这些同源词有着规则的对应关系。换句话说,汉语与广布在太平洋和印度洋海岛上的南岛语系,也就是400年前荷兰水手发现的马达加斯加和印尼人所讲的语言都来自于一种更加古老的“母语”。

沙加尔的观点极富挑战性——如果按照传统的理解,各个语系独立起源,互不隶属,那么该如何解释汉语和南岛语之间这种千丝万缕的联系?

沙加尔的观点得到了中国学者邢公畹的支持。他认为存在一种“汉藏—南岛”的同源关系。中国学者潘悟云也注意到,不仅仅是汉语存在这种联系,在东亚这片大陆上,侗台语就像是各种语系的交集,它既与汉藏语系有关,又与南岛语系、南亚语系有密切关系。沙加尔的汉语南岛语同源的说法,让潘悟云产生了一个更大胆的联想——这些语言会不会都拥有一个共同的起源?

稻米的密码

在如此广大的语言区域内,有一个词语引起了语言学者们的关注,那就是“稻米”。在东亚人群中,稻米与人们的饮食和生产息息相关,占据着不可或缺的地位。

语言学家们发现,稻米在南岛语系中有着相同的来源,这个范围覆盖了马来-印尼语、西太平洋上帛琉群岛帛琉语、台湾的赛德语、卑南语、鲁凯语、越南的雷德语,菲律宾马诺波语,台湾巴则海语,道卡斯语,阿美语。而它们又与藏语的稻米有着明显的同源关系。另外,上古汉语的“稻 ”,则与侗台语和南亚语同源。

语言学家郑张尚芳也发现,在汉语里,“粝”本意为“粗米”,其同音词“疬”有“恶疮、麻风”的意思,而藏语中相对应的词,同样有两个含义,一个是“米”、一个是“疮、疖”,同样,印尼语中“米”与“麻风”也几乎同音。这种大跨度地区里连续出现的相似性难道只是一种偶然吗?

但是,如果单单凭借语言学本身来破解这些谜团,似乎是不可能的事情。语言总是在不断变动中,根据测算,每1000年左右,就能独立分化出来一种语言。尽管那些语言的核心词汇具有很强的稳定性,但超出2000年,甚至更加久远的时间,要想判断它们之间的亲缘关系,就非常困难了。

这也就是为什么语言学家总在争吵之中的原因——那些在一名语言学家眼中,看上去具有密切关联的词汇,在另一名语言学家眼中,可能会是毫无意义。

这时候,其他学科的介入就变得不可避免。考古学的研究发现,在这些拥有稻米同源词汇的语言区域,存在着悠久的稻米种植历史。在浙江河姆渡遗址,曾经出土了距今约7000年的稻米遗存,长江中下游也因此被认为是稻米的起源地之一。而在其他区域同样也发现了稻米的遗存,在中国台湾和云南分别是距今5000年和4000年;泰国距今4000年,菲律宾距今3700年。考古学家们推测,会不会存在两条稻米传播路线,一条从长江中下游——台湾——菲律宾,一条是长江中下游——云南——缅甸、泰国?如果是这样,这又和语言学家推断的南岛和南亚语系的发展路线有许多重合之处。

语言学家解释说,之所以会出现稻米的传播与语言的传播有相似之处,是因为农业社会比采猎社会更能有效而稳定地增加人口。而随着人口的增加,就不可避免地带来种群的分化和迁徙,这也就是语言传播的动力之一。

除此之外,早在1959年,哈佛大学考古学家张光直就曾根据出土的早期考古资料论证,黄河流域前石器文化当中有一个尚未显出差别的“汉藏南岛综合体”。他认为从这个群体从新石器时代起,开始向中国南部移民的活动,结果分化出“汉藏群”和“南岛群”。难道这依然是个巧合?

来自基因的答案

越来越多的发现似乎在暗示着,在远古时期,东亚语言的确是从一种最古老的“母语”分化发展而来。但是由此产生的疑问却更多,如果存在这样一种假说的话,那么,这个“母语”的起源地到底在哪里?内部这种千差万别的语言又是从什么时候开始分化?它们之间的亲疏远亲如何?这似乎又完全超出了语言学目前所能解释的能力。

同时,语言学家内部反对这种假说的声音也从来没有停止过,每当支持东亚同源的证据多一分,似乎就会出现更多的相反意见。

1999年,一个偶然的机会,潘悟云看到了一篇文章。这是一个生物学家介绍分子人类学家们关于东亚人群起源的最新观点。在这篇文章中,遗传学者用DNA证实,东亚人群是距今4万年左右由非洲迁徙而来,然后从南向北迁徙分化,最后形成东亚大地丰富的的民族。而此前,学界的普遍看法是,东亚现代人是由本土直立人、智人连续进化而来。

潘悟云马上联想到,这与语言学家争论的东亚语言的问题息息相关。“同源”、“自南向北”这两个来自DNA的结论,居然和之前语言学界的那个东亚语言同源的假设一致。

早在1859年,达尔文就曾在《物种起源》中写到,“如果我们拥有一份完备的人类谱系图表,那么人种的形成序列将为全世界使用的各种不同的语言提供最好的分类。”而这句话,现在听上去,就好像是在为分子人类学家们今天所作的工作做注解。

随后不久,一篇从分子人类学角度更加详细的论述东亚人群起源和迁徙的论文出现了。在这篇文章中,学者们认为,东亚族群的祖先最初达到了东亚南部,约在在约20000到40000年前开始分化,一支自越南进入中国,并沿海岸线向北,成为百越和东夷的先祖,其中一个亚群在北部湾一带就转而南下,最终成为南岛语族的先祖。

而另一支则向自云南穿过四川一直到达黄河中上游盆地,成为汉藏羌的祖先。其中一个亚群在约8000-6000年左右向东向南扩展,最终成为华夏族群的先祖。而另外的一些亚群则调头向西南发展,最终成为藏缅语族的祖先。

尽管这个来自基因的迁徙路线也仅仅是一个草图,但那些在语言学界长期悬而未决的难题似乎都能得到合理解释了。

例如,为什么差异巨大的东亚各个语系之间,却存在千丝万缕的联系?按照基因图谱来解释,那的确是因为他们拥有共同的祖先,但由于早在数万年前就开始分化,所以才会呈现出迥然相异的面貌。

而曾经长期存在归属争论的苗瑶语和侗台语看上去也各自有了结论——苗瑶语族群是约1.5万年前从北上过程中的汉藏羌那一支分化而来,最终达到了中国中部。而侗台语则是从沿海岸线北上那一支中分化而来,自然会与南岛语系有更紧密的关系。

那么汉语呢?那支从古汉藏羌分化而出,沿黄河流域而下的亚群所讲的语言就是上古的汉语吗?显然没那么简单!还记得有一支沿南中国沿海一直上行达到山东的族群吗,他们成为东夷部落的先祖,而东夷部落的一部分沿黄河流域上行。最终两个族群在中原地区遭遇,在这其间,甚至还不可避免地遇到了从南方北上而来的部分苗瑶族群,以及从北方南下而来的部分阿尔泰语系的族群,他们征战并相互融合,无论是族群还是语言。

语言学者李葆嘉是这样描述这个复杂的过程的,“原始的华夏汉语就是一种伴随着多种文化撞击整合为强大中原文明的历史互动过程中,所产生的多元性,层叠性混合语言。”

而这就是为什么语言学家们在汉语中,既能与藏缅,又能与苗瑶、侗台、甚至与南岛、阿尔泰都找到亲缘关系的原因。

这听上去似乎清晰了不少。但对于那些仍然还未能解答的谜团来说,显然还有更漫长的路要走。
Tshṳ̂-pui Avalokiteśvara Phŏ-sat pó-hō tshuân-ke-nâng jît-jît phêng-an!
蹉跎莫遣韶光老 人生唯有讀書好 學須靜也  才須學也

--------------------------------------------
潮州话八调代表字:
1胎tho 2讨thó 3退thò 4托thoh
5逃tô 6在tŏ 7袋tō 8夺tôh
潮罗特殊变体:[ɯ]=ṳ=ur;[ã]=aⁿ=an;
[aʔ8]=âh=a̍h;[ts]=ts=ch;[tsʰ]=tsh=chh
玄乎哉?玄也。
鹭水芗南-闽南语部落(http://hokkienese.com/)  ·
甘願做牛,毋驚無犁通拖

補充使者的主題(看看人類學家的猜想)

東亞的古人類學界至今還有人不相信。北京猿人竟然不是我們的祖先。但是在這裏,的確沒有找到十萬年到四萬年前的人類化石,看起來這裏的古人種,在約十萬年前就滅亡了。在之後的幾萬年冰河時期,東亞大地寒冷而寂寞,直到四萬多年前,來自非洲的現代人重新發現了這塊大地。從一九九九年宿兵等人研究了幾千分亞太地區的樣品的NRY,到二000 年柯越海等人研究近一萬二千分中中國各族樣品,涉及到的所有個體的NRY 單倍型都在非洲起源的譜系樹上,沒有一個人是可能來自北京猿人或其他東亞的古人種。既然東亞人群也是來自非洲,他們又是從哪個方向進入東亞大地的呢?有兩個可能的地方,中亞和中國西北或中南半島。由於前一地區考古研究的深入,大量現代人的早期遺址被發現,所以很多人開始相信東亞人是由西北方向進入,而後由北向南散佈開來的。但實際上東南亞發現的現代人遺址的年代也不晚。宿兵等對亞太人群的NRY 分析證實了後一種可能。他們的研究物件包括人群和西伯利亞人群,由於每個部分包含相當數量的群體,所以保了大區域結構的可靠性。結果發現,這四個區域中的NRY 的SNP 單倍型種數由南向北梯度下降,而且南部區域包含了所有北部區域的種類。因為SNP 單倍型的主要種類早在人類在東亞分化前就形成了,所以隨著長時間的擴散遷徙,人群的單倍型在途中可能丟失,造成單倍型種類沿遷徙方向從豐富變為單調.故而東亞人由東南亞進入東亞大陸。隨者冰川漸漸消融, 人群開始向北擴散,遍及各地。還有部分群體通過亞洲和北美之間的白令陸橋進入美洲。除此之外,在北方還發現了很少量的單倍型,在人群中占的比例很小,這個比例在新疆地區大概是17%,蒙古高音大概占6%-8%之間,東北維持於4%上下,而到日本就驟升為約30%,而這些類型顯然與約十萬年前由非洲遷移到中亞的群體有關。所以,遷移的主線雖是由南向北,但還有少量人口由西北進入。從亞洲到美洲的移民至少可分三批。第一批是約三萬年前,由中亞來的那部分人先走過白令陸橋,到達美洲後迅速南下,成為南美和北美南部大部分的印第安人(American Indian)。第二批在約一萬年前,從南向經中國東北到白令陸橋的人群佔據了北美的北部,成為現代納丁語系(Na-Dene)的明珠,大約三千年前度過白令海峽的愛斯基摩人和阿留申人
可以算是第三批美洲人。亞洲南端的安達曼――巴布亞語系(Anadaman-Papua)、泛新幾內亞語系(Trans-NewGuinea)和澳大利亞語系的棕色人種的遷徙路線還沒有頭緒、但他們與東亞的其他人群系統差距很遙遠。
ʔ  ħ  ç  β  θ  ʃ ʒ         |       ø  œ  ɔ  ɛ  ɪ ʊ     |     æ  ə  ɑ  ɯ|
阴平1边  阳平2便(~宜    阴上3丙 阴去5变 阳去6辨  阴入7鳖 阳入8别
除了古老的SNP 單倍型隨著人群的分化而散佈和佚失,在分化過程中的不同時代不同分枝上也會產生新的SNP 單倍型。新的單倍型成為這些分枝的標誌性特徵。不同時期產生的單倍型在人群中的分佈提示了圖五中的東亞人群系統發生的可能關係。對於這張圖有幾點要說明。首先,由於現代人群雖然調查分析得已相當大量,但是還是有限,所以各突變的年代估計只是個大概資料。其次,族群發生樹狀結構雖然比較可靠,但不能排除新的材料改變樹的局部結構的可能。另外還有一點更重要的說明,是我們這裏用到的族群年代都是借用於語言學,但是這課發生樹卻是遺傳學的結果,與語言學的對應只是個梗概。族群的血統分化,完全可能不與語言分化同步,甚至相去甚遠。再加上群體語言轉用的影響,使遺傳結構與語言結構差距更大。但是,另用一套新的遺傳名詞的話,對於人類學研究的各領域的交流和理解會造成障礙,更使普通讀者一頭霧水。所以只要明確這裏講的是(在一定時期)大致講某類語言的人群的遺傳分化過程,就不必強求名詞的嚴格界定了。現代東亞的人群分別講大致留個語系的語言,即:漢藏語系(Sino-Tibetan,包括漢、藏、羌、彝等族)、侗台語系(Daic,包括侗、壯、泰、黎、僚、仡佬等族,亦稱百越)、苗瑤語系(Hmong-Mien,包括苗、瑤、畲等族,又稱荊蠻)、南亞語系(Austro-asiatic,包括越南、高棉、芒、孟、門達等族,又稱百濮)、南島語系(Austronesian,包括馬來、爪哇、占城、馬拉加什等遍及太平洋和印度洋的大多數民族, 主要是馬來―― 波利尼西亞語族Malayo-Ploynesian),另外是北方草原的主體阿勒泰語系(Altaic,分為突厥、蒙古、通古斯三個語族和朝鮮、日本、蝦夷三種獨立語種,從土耳其分佈到日本),這六個語系的祖先從非洲來到中亞時,完全沒有分化。大約在八萬年前,一支人群開始向東南亞方向拓進,這一過程應該不是舉族的長途遷徙,而更可能時隨著人口的增長而漸漸向東南延伸,而最終由於東南亞宜人的氣候使到達這裏的人口大增,文化速度、遺傳結構也由於特定的機制發生了漂變(Genetic Draft), 形成了南方系民族(Austirc),這一征程持續了幾萬年,實際上也可能不是單一方向一次完成的,而可能使回回復複地隨機移動著地族群地一個長期移進地方向而已。
東亞人遺傳系統及其年代構擬

東亞人系統的地理分化

進入東南亞發現新天地的先祖們,由於這裏複雜的地形被漸漸隔離,經過很長時間後,忘卻了大山那邊的親戚們。他們隨著地理的分離而分化的過程展示於圖六中。首先,東南亞中南半島的西北部和東南亞的人群產生了差異,西北部以緬甸為中心開始形成後來的百濮等族系,東南部以柬埔寨為中心開始形成後來的百越等族系。東南群不久分出了一支人群,不知通過何種途徑到達中國東北(可能是冰期露出的大陸架),與中國西北進來的另一支人群融合,形成了阿勒泰語系的各民族。其他留下的部分,也開始分別向南向北分化。向北到廣東廣西間的人群形成後來的百越族群,向南到馬來亞、蘇門答臘和婆羅洲之間大陸架的人群形成後來的南島馬來族群、西北部的人群也開始向雲貴高原的各個河谷擴張。東南亞各條南北向的大河河谷成了他們的走廊。有一批人走的最快,迅速到達了川西
北和黃河河套地區,形成了後來講漢藏語系語言的氐羌民族和漢族。之後又有一支人沿長江進入川東、湖北和湘北,形成後來的苗瑤民族。這就是東亞幾個族系的大致分化過程,在考古發現上也在相應的年代和地點,找到了開拓者的足跡。
東亞人系統的早期區系

這種早期分化後基本形成了圖中的地理區系。圖中的東夷只見過歷史記載,考古文化上也獨特,但由於已很難尋找後代,所以遺傳上還不清楚。而中國西北的吐火羅(Tocharian)則屬於西來的印歐語系,現已不存。
ʔ  ħ  ç  β  θ  ʃ ʒ         |       ø  œ  ɔ  ɛ  ɪ ʊ     |     æ  ə  ɑ  ɯ|
阴平1边  阳平2便(~宜    阴上3丙 阴去5变 阳去6辨  阴入7鳖 阳入8别
澳台民族源流的推測
語言學家白保羅(Paul Benedict)認為侗台語系和南島語系的語言有很大程度的共性,所以可以合為一個語系,即澳台語系(Austro-Tai)。事實上,這兩個語系的NRY 主要SNP單倍型基本一致。他們的共同祖先是拓進東南亞的先頭部隊。在印度支那共同生活了很長一段時間以後,他們向南向北兩個方向擴張,並在兩廣和馬來亞形成了兩個中心。不知何時,緬甸的南亞語先民也開始了向東南方向擴張,並從澳台語先民手中接管了印度支那,使得南向和北向的澳台語先民基本失去聯繫,於是分別形成南島語系馬來語族和侗台語系先民,即後來的馬來族群和百越族群。
     百越族群先民是最早進入兩廣的現代人類,當地的『柳江人』可能就是屬於這個族群。這支人群在當地又居住了幾萬年,人口緩慢地增長起來。大約在一萬多年前,末期冰川消融,於是其中一部分人穿越南嶺進入江西,百越族群開始分成南北兩群。大約同時,另一群完全不同的人也從怒江、瀾滄江流域進入長江流域,向同一方向拓進。後來兩支人群相遇會產生衝突。
      南越和北越分化後,各自產生了新的SNP 單倍型,使我們今天能看到這約一萬年前發生的事件。北越在江西長期留居的人群在後來的記載中被稱為『干越』。今天江西一帶和相鄰的皖南和閩西的漢族中保留的一定比例的百越結構與侗族幾乎完全一致。太湖流域七千多年就開始出現的現代人可能來自江西的越人先民。後來的良渚文化、馬橋文化和於越、揚越的遺傳結構也與江西越人相連。除了沿江而下的移民,可能還有一部分人是從江西溯江而上,一直到達貴州。這一支人可能就是仡央語族(Kadai)的先民。在東下的越人建立春秋時期越國之前,西上的越人建立了強大的夜郎國,並在商王朝的歷史舞臺上頻頻出場。在夜郎國治下的許多其他族群也改變了仡央語。我們今天看到的仡央語族中的許多小部族的遺傳結構完全不屬於百越類型。
     楚國的強大影響到南方許多部族,大約在商末,楚國發動了對江西干越的征伐。在頑強抵抗之後,終因技術落後,干越戰敗退逃。大部分的人可能退到兩廣之間的梧州一帶,在歷史記載中稱為『駱越』。可能這些名稱當時的發音都相同,可能為Klam-Daic。屬於北系的『駱越』與南系當地的『西甌』比鄰而居。但卻已不一樣,駱越在梧州一帶大概一直居住到宋代。在大約秦漢時候,部分人遷到了廣西北部的融水一帶,又漸向貴州移動成為今天的水語支各部族(Sui)。宋代受越南侵略軍的侵擾,駱越從梧州北上廣西、湖南、貴州三省交界地帶,成為今天侗語各部族(Kam)。
      南越部分也在北越離開後一段時間開始內開始東進,到達福建和浙南,形成後來的閩越和東甌。而南寧一帶的南越人被稱為西甌。所以與『駱』為北越代稱相對應,南越的代稱可能是『甌』。秦末南越國的主體民族可能就是南越。漢代南越滅國後,一大部分人由廣東退向僚國、泰國方向,形成今天的僚族、泰族等民族。雲南的傣族又是由泰國遷來。泰系民族在東南亞陸續建立了好幾個政權。十三世紀,猛昂國(現雲南德宏)向印度阿薩姆省(Assam)地帶遠征,建立了阿含王國(Ahom)。海南的黎族很晚還在廣西廣東之間,什麼時候分化形成還未知。
      臺灣原住民被分在南島語系,但卻分成與馬來語族完全不同的三個語族。語言學家認為一類語言中最複雜的地區是分化時間最長的發源地。如果臺灣原住民語言是屬於南島語系,則臺灣就是語言最複雜的南島語發源地。在臺灣之外的南島語系近兩千種語種都屬於馬來-玻利尼西亞語族(Malayo-Polynesian)。所以語言學家提出一種『南島快車假說』,認為南島語各族起源於臺灣,迅速散佈到幾乎整個太平洋和印度洋。
     但是,從NRY 結構看來,臺灣與玻利尼西亞完全不相關,『南島快車假說』完全不成立。其實,如果不看臺灣,其他南島語言中最複雜的在蘇門答臘(Sumandra)一帶,與遺傳學家推測的南島發源地一致。或許南島語系馬來族群的先民於百越先民分離後,在馬來亞和蘇門答臘一帶一直住下來,直到千多年前,航海技術的發展,使他們得以在廣渺的大洋上駕著『拉比塔』(Lapita)小舟自由航行。
      而臺灣原住民的遺傳結構看來與百越族群很相似,可能是不同時期不同路線從大陸來到臺灣的,有的屬於南越,更多可能屬於北越。雖然侗台語的結構與臺灣語言看來很不一樣,但是侗台語是在秦漢以後受漢語影響而發生過了類型轉變,也很難否認轉型前侗台語與臺灣語言相似,而符合遺傳學的不可轉變的結構。
百越的遷徙


漢族和氐羌民族
       在多數漢族人的眼中,異己文化的少數民族都是相同的『蠻夷』。其實,相對其他系統的民族,漢族與氐羌系統的少數民族更近,甚至可以說漢族就屬於氐羌民族。語言學研究估計其間有六千年左右的分離,而遺傳學分析他們的分化發生在約五千年前,相差無幾。
       如前所述,氐羌的先民可能來源於雲貴的百濮先民,在一、二萬年前末期冰川消退時,他們可能趁著夏季冰雪消融,從瀾滄江流域越過雪山進入金沙江流域,然後又沿著雅礱江、嘉陵江等河谷走廊北上,一直到達黃河上游河套地區。今天在長江支流的幾個河谷中分佈的羌語支的許多部落不知是當時留下的還是後來再重新回來的。在很長一段時間內,這群人都過著遊牧的生活,而且許多民族保存這種生活方式至今。
       也就是在五、六千年前,漢族的前身華族學會了種植小米的農業技術。糧食漸漸充足,不再向遊牧民族那樣缺乏食物,使得華族的人口很快的增長,超過了其他羌人。於是華族開始為生存空間而擴張,向四方的其他民族掠奪土地。在他們眼裏,羌族已不在是同類,所以專稱其為『西戎』,土地的爭奪也發生在華戎之間。但是對華族更有吸引力的是東方適於農作的肥沃土地。然而不巧的是三苗已經先他們一步到達中原沃土。在那種文明起源的『部落英雄時代』,部族戰爭是人群間競爭的唯一辦法。掠奪、驅逐、消滅外族的人會被本族人奉為英雄,這是那個階段所有部落的『道德標準』。所以打敗蚩尤驅逐三苗的英雄——黃帝誕生了。華族佔據了中原,開始創造華夏文明。在中原更東的山東一帶,還有許多小部族,被稱為夷族。華人稱夷族為『東夷』,而被趕到南方的三苗為『南蠻』。華夷之間的爭鬥貫穿了整個夏商時代,這種爭鬥的膠著使兩族之間產生了大量的交流,到周代以後,東夷族被徹底同化,退出歷史舞臺,華人又取得了勝利。

羌、華族系的分化和遷徙

到了秦始皇統一六國,華族的擴張目標又指向了長江以南更廣闊的百越之地。雖然秦軍堅甲銳兵,但在越族頑強的抵抗下傷亡極重,所設的桂林等三郡也是空有其名。於是秦朝只好對百越採用『懷柔政策』,直到漢朝前期還是『北拒胡而南懷越』。最終,漢人的足跡終於到了南海之濱。
      華族也沒有忘記西邊的羌人之地,秦穆公時發生秦羌之戰,使秦國的疆域大為西拓,後來蜀、巴也相繼落入秦人之手。多次戰敗使羌人失去了原有土地,開始散向西南。正如圖九所示,許多人群一路走到雲南、緬甸和泰國等地,形成了一個氐羌文化和當地環境相結合的新的民族,藏族也是當時羌人流散而來,但是在其發展過程中又吸收了很大部分中亞的成分。從遺傳結構上很清晰地看到這些遷徙路線上一個個民族之間的淵源關係,正如他們把逝者的靈魂送回北方老家的送魂歌所唱的那樣。
      各地的漢族至今保持著相當一致的NRY 結構。有人認為漢族人口龐大是由於像滾雪球一樣加上了大量外族成分,但是看來外族成分是很少量的。

荊蠻的源流
      荊蠻是苗瑤語的先民。他們與百濮的血緣關係比其他任何一個族系更近。根據其特性突變M7 的年代估算,他們也是在大約一萬二千年前,從貴州的百濮中分化出來,來到三峽地區。經過一段的發展,漸漸向洞庭湖移動。他們同百越一樣,也在很早的時候開始稻作。其中一支人很快發現了北面不遠的中原空地,於是搶先佔據了這塊地盤。然而不久之後,就發生了前文所述的與華族的衝突。三苗戰敗後退回南部。如果苗族真是三苗後裔的話,三苗應該是退到了黔東。現代苗語的湘西、黔東和川滇黔三個方言區中,唯有黔東最為複雜,其他兩種可能是黔東苗人向東西兩側分化出的。川滇黔的苗族還是經雲南一路南下游耕到了中南半島各國。布努語的部族可能是未隨三苗北上中原的苗人部分。
      瑤族長期在洞庭湖周遍耕作,被稱為長沙蠻、武陵蠻。從遺傳結構看,瑤族在苗瑤族群中最為古老。他們曾經是楚國的一部分。現在大部分的瑤族已從湖南遷到了廣西。還有一些從廣西南部直接進入了越南。另一支人從廣西進入雲南文山,又從西雙版納到老撾和泰國,還有部分人到了廣東西北部,就是今天廣東連南的八排瑤。由此又遷鳳凰山到廣東東南部,形成了畲族,在唐宋時期畲族經過幾次北遷,沿武夷山等路線散佈到了福建和浙江等地。
       春秋戰國時期的楚國也稱為荊楚,連楚王也承認自己是荊蠻。現在的湖北人中,有很大一部分人的遺傳結構與苗瑤一致,可見史書所言不虛。另外,江蘇的吳人也保留有苗瑤的遺傳結構。史書稱『句吳』時,最早也說她是荊蠻。周初『太伯奔吳』,使這個荊蠻部族融入了華人成分和華夏文化,並向長江下遊移動,到達南京一帶。到春秋時代,吳人已從越人手中奪得了蘇州地區。從考古上看,應當對應于湖熟文化向馬橋文化地區的推進。所以可見吳越兩國的人民是傳上無關的不同民族,只是後來用同一種漢語方言交流,地域文化有趨同,才被並稱為『吳越』而誤認為『一族兩國』。其實,至今吳越之間遺傳上的異源性還是很明顯。圖十畫出了荊蠻的大致源流。
三苗的分化和遷徙

除此之外,現在漢族中的客家人和贛語人群也保存了七分之一左右的荊蠻血統,可能他們最早的來源也是荊蠻,陸續加入漢族移民而成了現在的結構。

雖然只有短短幾年的歷史,但是遺傳學對人群演化的闡述已讓人興奮不已。東亞人群的許多不為人知的歷史脈絡也漸漸清晰。隨著對大量民族群體的遺傳分析的深入,更精細更明確的演化歷史將勾勒出來,為人類學、民族學、考古學和歷史學等提供自然科學的依據。對考古遺址中發現的各個時期的遺駭的遺傳分析,更能構建出人類發展的時空網路,讓我們共同期待這一激動人心的時刻的到來。


※參考:《東亞人的遺傳系統初識》/李輝
(作者任職于復旦大學生命科學學院現代人類學研究中心)
ʔ  ħ  ç  β  θ  ʃ ʒ         |       ø  œ  ɔ  ɛ  ɪ ʊ     |     æ  ə  ɑ  ɯ|
阴平1边  阳平2便(~宜    阴上3丙 阴去5变 阳去6辨  阴入7鳖 阳入8别
不詳 很難這個問題
漢以漢字來說估計還包括越壯等 文化影響大造成的共同詞多 文法和聲調都類似的語言 都有這些
吾乃東風也 初次見面 請多關照
吾名前者東風候 初候而目掛枡 何卒宜相願候
僕의 名銜은 東風이다. 잘 付託합니다