全站搜尋 電子雜誌搜尋

AD

ad970250

不錯過任何知識訊息,立即加入國家地理官方Twitter

防疫期間遠端工作,請利用客服信箱聯繫。

Mar. 30 2018

這棵由1300萬人組成的系譜樹告訴我們什麼?

  • 這棵由1300萬人組成的系譜樹告訴我們什麼?

    這棵由1300萬人組成的系譜樹告訴我們什麼?

1

首先,這棵新的樹質疑用來解釋人類為何不再近親通婚的主流理論。

這棵系譜樹從新的龐大資料集搜集而來,顯示包含6000人在內的七個世代,其中以紅色標示婚姻。/ COURTESY COLUMBIA UNIVERSITY

收存在系譜樹分支裡的資訊可以幫助人們了解祖先如何在世界上移動、他們的體質特徵,甚至包括感染疾病的風險。

現在,科學家畫出了一棵涵蓋1300萬人、跨越11個世代的巨大系譜樹,試圖從中解答人口相關的大哉問,從長壽的遺傳率到整個家族在過去幾世紀內如何散布與通婚等問題都包含在內。

AD

ads-parallax

紐約基因組中心(New York Genome Center)的資料科學家與計算生物學家雅尼夫.厄利希(Yaniv Erlich)說,這組新的龐大資料集是目前根據公開資料建立且經過科學驗證的第一大系譜樹。他的團隊於3月初在《科學》(Science)期刊上發表了他們的研究。

↑↑↑↑↑系譜之外——你是誰? 你的祖先從何而來?你的遺傳系譜為何?基因地理計畫(Genographic Project)旨在回答比這些更多的問題。該計畫正在解開我們是誰以及我們如何相關聯的謎題。

這些資料很難使用,因為團隊無法利用任何已經存在的研究方法。「基因組資料集有特定的工具、資料結構、研究方法,但是這些資料完全沒有類似工具,」厄利希說:「我們得邊做邊想辦法。」

就現況而言,資料中的個人檔案有地理限制,其中85%來自北美洲和歐洲。大體而言,確保如此龐大的資料集(特別是從獨立個體收集而來的資料集)的精確性是一項挑戰。任何從中獲得的結論都應該被謹慎看待,波士頓大學公共衛生學院(Boston University School of Public Health)的生物統計學教授寶拉.塞巴斯蒂亞尼(Paola Sebastiani)說。

「從科學的角度看,必須有非常乾淨的資料才能生產非常好又可靠的科學發現。」塞巴斯蒂亞尼表示。不過她仍讚許研究團隊驗證與分析複雜資料的努力。「他們所做的令人印象深刻。」

擴增系譜樹

厄利希和他的團隊使用從系譜網站Geni.com取得的資料來建立系譜樹(厄利希現在是Geni.com的母公司MyHeritage的首席科學長)。團隊從8600萬份個人檔案著手,刪去明顯不可能的資料——例如有人看似有三名親生父母,或有人的雙親同時是他們的孩子。

將樣本過濾為有效資料以後,他們得到530萬棵系譜樹,其中最大的即是由1300萬人組成的資料集。

新系譜樹的這個部分顯示7萬人經由婚姻(紅色)與共同祖先相互連結。/ COURTESY COLUMBIA UNIVERSITY

手動做出完整的系譜既耗時又困難,厄利希說,這也是為何群眾外包的資料這麼有價值。其資料來源的範圍也比過去研究廣:「(以前)通常使用特定地點的教會紀錄。」厄利希說。

為了確認上傳自己資料的人不只來自特定社會經濟階層,團隊將資料和美國弗蒙特州(Vermont)的死亡證明做比對。資料集裡大約有1000人的檔案和弗蒙特州的紀錄重疊,而且這千人囊括全州人口的特徵。對研究團隊而言,這顯示他們的資料至少在該州大致反應出人口分布。

團隊接著挑選關於壽命和家族散布的問題,用以測試系譜樹的效用,厄利希說。首先,他們比較配偶之間出生地的距離以及兩人所屬家族跨世代的關係。1650至1850年間,配偶之間平均都是三從表堂兄弟姐妹。

演化研究的各種理論認為,配偶之間的出生地距離愈遠,彼此間的遺傳關聯度愈低。然而由於1800年代早期鐵路旅行興起,讓1800至1850年間出生的配偶出生地距離變遠,但血緣關係卻更加相近。不過配偶之間的遺傳相關性卻在接下來幾十年內下降了。

根據這些結果,研究作者認為遏止人們和表親通婚的原因是文化變遷而非運輸變遷,雖然作者群尚未能推測這些文化因素是什麼。

解碼長壽

研究團隊也分析了資料集裡(有明確出生和死亡日期的)300萬對親戚,以尋找長壽的模式。他們發現大約16%的長壽有遺傳現象——比一般長壽研究採用的25%還要低了大約十個百分點。

但是專事長壽與老化研究的塞巴斯蒂亞尼說,不要過度詮釋這個結論。「長壽的定義相當紛亂。」她說。

如果廣泛定義且只看活到8、90歲的人,確實通常會得出遺傳影響有限的結果。然而,考慮超過100歲的人們,基因就成為顯然更加重要的變因了,塞巴斯蒂亞尼說。但是活到這把歲數的人很少。

「這就是為什麼用大數據研究長壽或許不是最好的方法。」她說。

最近Geni.com和MyHeritage建立了自己的DNA檢測,厄希利說未來可以將用戶經由檢測產品提供的遺傳資訊對應到既存的系譜資料。

此外,厄利希和他的團隊建立的系譜樹向大眾公開,他也期待看到其他研究者利用這項資源來解答更多系譜及科學問題。

「我們希望大家使用它。」他說:「你可以研究地方性疾病、個別家族、人類學問題、生育率——這些資料都派得上用場。」

↑↑↑↑↑109歲的退役軍人分享長壽訣 在這部國家地理短片百寶箱(National Geographic Short Film Showcase)的影片中,這名愛喝威士忌又愛抽雪茄的超級人瑞揭露他長壽的祕密。

 

撰文:NICOLE WETSMAN

編譯:石頤珊

延伸閱讀:發現世上最早壁畫——由尼安德塔人所繪

APR. 2024

真菌潛力無限的奇妙世界

這個鮮為人知的龐大生命網路,如何影響地球萬物與人類未來

真菌潛力無限的奇妙世界

AD

熱門精選

AD

AD

Subscribe
立即訂閱
keyboard_arrow_up

AD

ad970250