图片来源:Science(DOI: 10.1126/science.aam9309)

       最新刊登在Science上的一项研究发表了可能是有史以来最大的家谱:这一里程碑式的数据集关联了有血缘或婚姻关系的1300万人,平均跨越11代。而正是基于这一庞大的家谱,科学家们得出了以上结论。

       在这篇题为“Quantitative analysis of population-scale family trees with millions of relatives”的论文中,哥伦比亚大学的计算生物学家Yaniv Erlich及其同事分析了这一家谱上的人的出生和死亡日期,并评估了如果他们是近亲,是否更有可能死于相似的年龄。

       结果显示,遗传只解释了这些人寿命差异的不到五分之一。大部分的差异都归结于其他因素,如,人们的居住地和生活方式。同时,研究还表明,影响长寿的基因是独立起作用,而不是相互作用。

       Erlich说:“‘好的’基因可能会使一个人的寿命平均延长5年,但一些环境因素对长寿的影响更大,例如,吸烟能够减去10年寿命。”

       尽管先前科学家们已经怀疑,环境对人类寿命的影响要大于基因(2001年的一项研究曾估计,基因决定了人类寿命变化的约四分之一),但这项新成果表明,基因的作用可能比研究人员想象得更少。对于致力于寻找长寿基因的科学家们来说,这意味着,实现他们的目标或许要加困难了。

       This 6,000-person family tree was cleaned and organized using graph theory. Individuals are shown in green, spanning seven generations; marriages are depicited in red.Credit: Columbia University

Science重大成果:我们的寿命多大程度由基因决定?只有16%!

       庞大数据

       事实上,遗传学家们利用家谱来研究遗传特征如何影响性状(如,疾病风险)已经有很长时间了。但是,要形成包含大量人口的家庭记录数据集,成本很高,且难度很大。目前,有很多科学家小组正在开展相关研究,其中,一些已经鉴定出了与癌症和阿尔茨海默症等疾病相关的基因。

       Erlich的研究使用的是来自在线家谱工具Geni.com(全球最大的合作家谱网站之一,用户在Geni上分享他们的家谱)的数据。他现在是Geni母公司MyHeritage的首席科学官。

       Erlich关于这一研究的最初想法要追溯到7年前。当时,他通过Geni.com从一个远房亲戚那里收到了一封电子邮件,然后联系了该公司的首席技术官,获得了下载该网站上数千万公开资料的权利。这些资料包括用户的姓名、性别、出生日期和地点、死亡日期以及直系亲属,但没有DNA信息。最终,他们分析了来自约8600万人的数据。

       加州大学旧金山分校的计算基因组学专家Atul Butte说:“这种级别的参与者数量是疯狂的。科学家们也只能通过众包(crowdsourcing)获得这样的数据集。这真是太令人印象深刻了。”

       图片来源:网络