国际千人基因组计划
简介
国际千人基因组计划依托:中国深圳华大基因研究院(、英国桑格研究所、美国国立人类基因组研究所,2008年正式启动。
“国际千人基因组计划”自2008年启动,旨在绘制迄今为止最详尽、最有医学应用价值的人类基因组遗传多态性图谱。深圳华大基因研究院作为发起单位之一,不仅承担了400个黄种人全基因组样本的测序和分析工作,而且还帮助完成了非洲人群的全部测序和分析任务。该计划的中方协调人、深圳华大基因研究院副院长王俊说:“我们将开放全部数据供科研机构使用,以更好地理解人类生老病死的秘密。我们正全力以赴与国际同仁紧密合作,解读导致癌症和糖尿病等疾病的基因密码。千人基因组计划为未来个体化医学时代的到来奠定了坚实的科学基础。”
发起机构这一国际合作计划的主要发起者和承担者包括英国的Sanger研究所,中国的深圳华大基因研究院(BGI Shenzhen),以及美国的国立卫生研究院(NIH)下属的美国人类基因组研究所(NHGRI)。
测序人群“千人基因组计划”将测序的人群包括:尼日利亚伊巴丹区域的约鲁巴人;居住于东京的日本人;居住于北京的中国人;美国犹他州的北欧和西欧人后裔;肯尼亚Webuye的Luhya人和Kinyawa的Maasai人;意大利的Toscani居民;居住于休斯顿的Gujarati印第安人;居住于丹佛的中国人;居住于洛杉矶的墨西哥人后裔;居住于美国西南部的非洲人后裔。[1]
主要内容2010年6月21日,由中国深圳华大基因研究院、英国桑格研究所和美国国立人类基因组研究所等共同发起并主导的“国际千人基因组计划”协作组对外宣布:该计划第一阶段的3个先导项目已圆满完成,全部数据已存储于该计划所设立的公共数据库,公众可免费获取和浏览第一阶段产生的全部数据[2]。
据专家介绍,任何两个人在基因水平上99%是一样的,只有小部分的基因组序列因人而异。了解这些差异是非常重要的,它能帮助了解人与人之间对疾病的易感性、对药物和环境因素的反应性的不同。然而,现有的图谱还不够详细。新图谱能让研究者更快地锁定与疾病相关的基因变异点,从而能够使用遗传信息更快地开发常见疾病的诊断、治疗和预防的新策略。
科研人员正在做DNA鉴定[3]
“千人基因组计划”将采用几种新的高通量测序平台。若使用目前标准的DNA测序技术,同样的工作可能需要花费5亿美元以上。然而,由于该计划的创造性的努力,建立了更高效更低价的新测序技术,“千人基因组计划”的发起者希望这一计划的成本最终将降低至3000万到5000万美元。
该数据库最终将包含来自全球27个族群的2500个人的全部基因组信息。目前产生的数据量已达到50TB(5万GB),包含8万亿个DNA碱基对。这一数据资源是一个开放的公共资源,为各种疾病的关联分析提供详细的基础数据;为解释人类重大疾病发病机理、开展个性化预测、预防和治疗打下基础。此外,该项目还加深了人们对人类群体遗传学的理解,促进人类进化史的研究。
目前已完成的3个先导项目是为了验证多种测序方法对于东亚、欧洲和非洲人群中遗传多态性频率不低于1%的鉴别能力,这将大大高于之前完成的国际单倍体型计划(HapMap计划)5%~10%的遗传多态性的检出能力。
先导项目内容第一个先导项目运用多种下一代高通量测序技术平台,完成了两个核心家庭共6人的高覆盖度全基因组测序,每个基因组的测序深度在20~60倍。通过此项目,可以评价多种主要测序方法的优缺点,为“国际千人基因组计划”的后续项目扫清技术障碍。
DNA示意图第二个先导项目完成了179人的低覆盖度全基因组测序,平均测序深度在3倍。数据表明,大样本低覆盖度测序在降低成本的同时,仍然能有效识别人群中的基因多样性。
第三个先导项目通过对700人的1000个基因外显子的测序,获得了占人类基因组全部序列2%的蛋白质编码基因名录。前所未有的大样本量有助于研究人群罕见变异的表达图谱。意义第一阶段3个先导项目的完成具有重大应用价值。科学家可在下列方面大有可为:在更大的人群范围内定位人群突变基因;检测导致人类遗传疾病的相关基因;鉴定特定遗传病人群中含有的罕见致病基因。
美方协调人展望了此计划的美好前景:“先导项目完成的意义重大,为下一阶段更大样本量的研究打下了坚实的技术基础。我们的最终目标是完成2500个人的全基因组数据,我非常希望如此海量的数据能更精确地定位已发现的遗传风险因子、挖掘出更多未知的致病遗传因子,为人类健康造福。”
专家评价“千人基因组计划”,是举世闻名的人类基因组计划的延续和发展,是基因组科学研究向临床医学迈进的重要转折点。“千人基因组计划”产生的数据和研究成果将迅速通过公共数据库发布,供全球科学家免费共享。
主要意义1、自十年前“人类基因组计划”完成以来,因为难以同时对许多人进行基因测序,基因研究一直只在较小的层面上进行。本次研究不仅使大规模测序成为可能,还绘制了一个详尽的基因图谱以供比对,这标志着人类基因研究进入了一个划时代的新阶段。
DNA双螺旋结构示意图2、面对人类生长和发育、遗传疾病和健康、进化和医疗等一系列问题,一份详尽的人类基因组图谱是必不可少的。
3、弗朗西斯高度赞扬了中国科学家的成就,中国人占世界人口的五分之一,深圳华大基因研究院的研究对理解中国人的基因组具有非凡的意义,她预计到2011年,华大基因将能完成10000至20000个人类基因组测序。
4、参与此项计划的中国深圳华大基因研究院负责人、中科院院士杨焕明表示,有人喝口水都要长肉是缘于基因的不同变异,我们参与的“千人基因组计划”,就是为了搞清楚你我他为什么不一样。 杨焕明说研究院做了600个人的测序和分析,在“千人基因组计划”中的贡献超过30%。
5、深圳华大基因研究院副院长王俊博士表示,“千人基因组计划”中的黄种人基因组研究,将使中国基因组科学和相关医学研究直接跨入与国际前沿完全接轨的世界先进行列,极大地促进中国药物基因组学研究的发展。
基因研究大事记1859年~1959年1859年达尔文出版《物种起源》,提出了自然选择原则。但他无法解释生物为什么能将性状遗传给下一代。
詹姆斯·沃森和弗朗西斯•克里克发现DNA[4]
1865年 奥地利修道士孟德尔在观察过2.1万株豌豆后发现了遗传法则。
1869年 瑞士生物学家弗雷德里希•米歇尔分离出核酸。
1879年 德国胚胎学家瓦尔特•弗莱明发现染色体,并描述了细胞分裂过程中染色体的行为。
1900年 孟德尔的成果被重新发现。
1903年 美国生物学家瓦尔特•萨顿发现染色体是成对的,并携带遗传信息。
1905年 英国医生加洛德提出了人类先天代谢疾病的概念,这是人类自身遗传研究的开始。
1911年 美国遗传学家摩尔根提出基因学说,阐释基因在染色体上的分布,以及繁殖过程中染色体重组形成独特新个体的过程。
1913年 美国遗传学家斯特提万特绘制出第一张线式基因图谱。
1928年 英国生物学家弗雷德里克•格里菲斯发现了一种可以在细菌之间转移的遗传分子。
1929年 俄裔美国生物化学家列文提出DNA的化学成分和基本结构。
1944年美国细菌学家奥斯瓦德•西奥多•艾弗里、科林•麦克劳德和麦克林•麦卡第共同撰文指出,1928年格里菲斯发现的遗传分子就是DNA。
1948年 美国量子化学家鲍林提出蛋白质为螺旋形的理论。
1950年 奥地利生物化学家查加夫发现核酸中四种碱基的含量比例是一定的。
1951年 英国女生物物理学家罗莎琳德•富兰克林拍摄到了核酸的X射线衍射照片。
1952年 美国遗传学家阿尔弗雷德•赫尔希和玛莎•蔡斯通过病毒证实,传递遗传信息的是DNA而不是蛋白质。
1953年美国科学家詹姆斯•沃森和弗朗西斯•克里克在《自然》杂志上发表DNA双螺旋结构的论文。
1956年美籍华裔科学家蒋有兴和瑞典细胞遗传学家阿尔伯特•列文确定人类共有23对染色体。美国生物化学家阿瑟•科恩伯格分离出DNA聚合酶。
1957年 美国科学家弗朗西斯•克里克发表《论蛋白质合成》的演讲,提出DNA制造蛋白质的概念。
1959年 法国遗传学家杰罗姆•勒琼发现唐氏综合征是由于人体的第21对染色体变异造成的。1960年~2006年1960年 美国“分子细胞学之父”西德尼•布伦、 美国科学家弗朗西斯•克里克等人发现信使RNA(mRNA)。
弗朗西斯•克里克1966年 美国生物化学家与遗传学家马歇尔•尼伦伯格与罗伯特•霍利及哈尔•葛宾•科拉纳阐明遗传。
1969年 哈佛大学遗传学家乔纳森•贝克韦斯分离出一个细菌基因。
1972年 美国生物化学家保罗•伯格创造出第一个重组DNA分子。
1975年 美国进化生物学家玛丽-克莱尔•金和艾伦•C•威尔逊发现,人类和猩猩的基因相似度达到99%。
1977年 美国科学家沃尔特•吉尔伯特、弗雷德里克•桑格和艾伦•M•马克希姆开发出DNA测序技术