当前位置:中国企业家俱乐部>绿公司>绿公司年会>2017中国绿公司年会>年会动态>

周代星:要把更多疾病的基因数据库建立起来

作者: 时间:17-04-28 | 来自:中国企业家俱乐部

  由中国企业家俱乐部主办的“2017中国绿公司年会”于4月22日-24日在河南郑州召开,贝瑞和康CEO周代星出席并发言。周代星介绍,人类的23对染色体各司其职,如同一本书的23个章节,每个章节都起非常重要的作用,有的基因突变直接和一些疾病有关,有的突变则影响到人的性格,比如,有的会使人变得懒惰,有的则使人喜欢冒险,追求刺激。

  科学研究也表明,实际上确实有一些基因会给人类似“超人”的能力,现在发现有5种基因与此有关。有的能让人表现为耐受力更强,更精力旺盛,有的基因突变后,人只需要四小时的睡眠就够了。

  他表示,现在的无穿透检测技术,可以把所有遗传疾病,在小孩出生前查出来,只要能承担这个成本。从某种程度上,肿瘤比胎儿更容易做。因为从第一个细胞变成肿瘤细胞,到能被影像学识别的肿瘤,一般情况下差不多要十年左右,如果检测手段非常准确的话,有足够长时间把这些肿瘤查出来。

  周代星认为,人类基因测序成本每六个月下降一次,人类对自身的认识越来越深,它的应用也开始出现。今后的方向是把检测成本不断降低。现在要做的是把更多疾病的基因数据库建立起来,对治疗产生影响。

  以下为发言实录:

  基因究竟是什么?在座的各位可能多多少少有一点了解,但怎么定义一个基因?其实在人类知识发展过程中花了很长时间才对基因有所认识。我们今天能够讲得比较清楚是因为前人很多的工作。

  这张图显示了我们人从一个细胞到基因的结构过程。我们人有37万亿的细胞,细胞有各种各样的功能。除了一些比较特殊的细胞之外,每一个细胞都有一个细胞核,还有染色体。这个染色体你要不断拉伸之后,会得到脱氧核糖核酸的成分,由四个碱基组成,这些成分在我们这里用GATC来代表。

  基因是什么?基因就是染色体里面的一个片断,有大有小,大到80多万个碱基,小到几十个碱基。人的基因组由23对染色体组成,每一个染色体就像一根弹簧。

  发现人有23对染色体其实不是那么简单。在1955年之前,整个人类认为我们有48条染色体。人只有23对染色体是由一位印尼华侨蒋有兴1955年12月22号到瑞士去做研究的时候发现的。他发现人的染色体实际上只有23对,总共46条。从那儿就开始23对染色体就成了大家的共识。

  我们后面会提到的,人类基因组测序结束之后,我们知道23对染色体各司其职,你要是把染色体存在的信息看作是一本书的话,这本书共有23个章节,每个章节都起非常非常重要的作用。这些章节如果出现了偏差会对人产生什么样的影响?当然有一些偏差,大家也都知道,会产生疾病。那疾病又是什么样的?

  我们先说大的偏差,这23个章节如果有一个章节出现重复,人会是怎么样?这个图显示的是一种疾病,叫唐氏综合症,是21号染色体重复。那有没有其他的染色体重复呢?比如1号、5号染色体重复会是什么样?现在没有看到其它染色体重复的疾病,是因为这样的重复对发育太重要了,人生不出来,。所以我们只看到对唐氏综合体的存在。这是整条染色体重复的状态。

  那么有没有染色体部分的重复或缺失,有的话,对人产生什么影响?我们看小一点,一条染色体里面的一部分重复或缺失了。这张图列了几种重复缺失的存在。有一个疾病是22号染色体上面有200万个碱基缺失了。我们会看到右边这个小孩生出来是兔唇,这是DiGeorge疾病(音)的小孩。DiGeorge病人并不是所有的都兔唇。70%的DiGeorge病人有先天性心脏病,30%有先天性肾脏病。这是一个案例,就是我们染色体缺了一段,多了一段的案例。

  如果再进一步,我的染色体并不是多了或少了一段,而是只有一个字节,就一个碱基发生了改变。后面会提到人的基因组有30亿对碱基。整个信息的量相当于一部稍微长一点的电影的信息量。这个电影里面有一个字节出现了偏差,会产生什么样的情况?

  这张图显示的是是一个案例,这是最早被人类发现的一个疾病,叫黑尿症,1905年发现的,跟遗传有关,但那个时候并不知道遗传信息是什么。在接近100年的努力之后,1996年才把黑尿症的基因突变定位在3号染色体这个位置上面,到了那时候这个基因才被克隆。

  人类最普遍的遗传疾病是色盲,8%的男人是色盲。色盲为什么会这么普遍?色盲主要由三个基因主导,有两个基因在X染色体上。女性有2条X染色体,男性有一条X染色体。如果这些控制颜色识别的基因出现差错就会产生色盲,所以男性比较容易得色盲。

  我们仔细想一想这个事情,实际上我们在座的男性要知道我们是处于劣势的,人类的另一个分支女性实际上比我们要有优势,就是因为她有2条X染色体。

  我刚才提到的基因突变好像都不是那么严重,要么是尿黑了,要么识别不了颜色,都跟颜色有关。其实不然,我们人类研究了基因和疾病很多年,有几千种疾病和基因突变有关,有一些突变导致非常严重的疾病。

  这里举一个例子,NF1基因的突变,会导致一种疾病,叫Neuofibromatosis Type1,表现为外表皮肤会产生肉瘤,多了会把人的眼睛、嘴巴盖住,这些人经常会引起呼吸困难,甚至导致死亡。当然这个疾病会有一个怪的现象,每个人的身上出现的程度不太一样。最右边图显示的是这些人得的是同样位置的突变,但是他的程度不是那么严重,这牵扯到基因表达的问题,人的基因有两个拷贝,如果一个拷贝表达量超过另外一个拷贝,虽然另外一个拷贝有异常,但不一定能显示出来,这在遗传学上叫基因的穿透。

  刚才提到基因有那么多跟疾病关的突变,有没有跟疾病没有关系的突变呢?这个基因是DRD5,这个基因有4个外显子,即表达蛋白质的部分。其中第三个外显子有一个48个碱基的重复,有的人是两个重复,有的人只有一个重复,有的人有11个,平均起来差不多是4个重复,这个重复跟人的性格有很大关系。动物也有这个基因,跟动物的性格也有非常大的关系。人们曾经做过一个实验,如果把长的重复片断去掉,或者把整个基因去掉的话,小鼠会变得很懒惰,甚至懒惰到看到食物不愿意吃,最后饥饿而死的状态。在人群里面没有看到这么懒惰的人,但这个基因的重复度对性格还是起一定的作用。

  这个基因如果含有长的重复,这种人就很喜欢冒险,早上会去坐过山车,中午还觉得不够过瘾,到晚上还希望做上飞机跳个伞,很喜欢刺激。这些人静不下来。这个关联以前有人认为跟性格疾病没关,科学依据不强。一直到最近,美国一个大学做了一项研究,大学生经常有一些一夜情等的人。这项研究对他们做一个调研,发现这些人大部分都是长的重复,就是7对以上重复的人比较多,所以基因跟性格是有一定的关系。

  当然对基因想象力最大的,是大家想有没有超人基因。这张图显示的是加州东面,有一个滑雪圣地,叫Olympic Valley。这是我两个星期之前在那个地方拍的,那个地方现在在下雪。这个地方著名之处是在1960年的时候,第8届冬奥会在这儿举行。你会觉得第8届冬奥会会有什么稀奇的?冬奥会都开了7届了,第8届有什么稀奇?但第8届是第一次通过电视直播的,所以它的影响力非常非常大。

  这个冬奥会上有个芬兰的一个运动员Erro欧若(音),获得越野滑雪的冠军,大家觉得他体内有跟别人不一样的地方,是不是吃兴奋剂,最后他也承认确实吃了荷尔蒙,但那个时候在冬奥会吃点荷尔蒙是合法的。到1991年大家对他家族做了一个基因检测,发现有一个突变,19号染色体上的一个基因有一个突变,这个突变导致他体内红血球比正常增长50%。所以他的耐力非常非常强,输氧能力非常强。

  这个故事后来刺激了很多电影届的想象力,觉得人是不是有超人的基因。大家都知道,这方面有各种各样的电影,比如说X-MAN系列电影里的RavenDarkholme,能把自己的体型肤色变掉。我们在科学界,在生物界也进行了研究,想弄清楚究竟超人的基因有多少,到现在只发现了几种,其中这5种比较靠谱点,其一就是欧若的耐力比较强;还有一个生物钟调控能力比较强的基因突变,这基因突变了之后,人只睡四个小时就够了。

  相较于超人基因,与疾病相关的基因突变还是主要研究对象。这张图是2009年公布的基因和疾病图谱。看得出我们当时已经能把很多疾病跟23对染色体对应起来。这个图里的疾病数量一直在增长,增长到现在,你们看得出来密密麻麻每一个染色体上面都有对应的疾病。这是我今年4月15日重新更新的图谱。托尔斯泰说的,幸福家族的幸福都相似,不幸家族都他的不幸之处,像欧若的家族他们有幸之处是有了一个获益的突变,但是大部分家族历史遗留下来的突变基本上和疾病有关。

  既然基因信息这么重要,能不能非常简单地获取人的基因信息也就变得非常重要。刚才提到人的基因信息量犹如一部稍微长一点的电影的信息量。要获取这个信息量就需要一种好工具。这种工具叫做测序器。这个工具是从一九七几年开始发展。当时英国剑桥大学的Fred Sanger发明了第一代测序技术。这个技术到目前还在用,并且以他的名字命名。

  第一代测序技术目前产出最好的通量是每年产出7兆碱基对的数据。我们基因组数据量有如一部电影,是3个GB。用一台这样的机器,得好几年才能把这个数据产出来。这个机器虽然产出数据不是那么快,但是对人类基因组的认识起了很大的作用。从1989年到2001年之间人类做了一件大事儿,把人类基因组破解了,就是用这个机器破解的。

  这件事总共花了13年的时间,花了30亿美金,得到的就是我们刚才说的30亿碱基的数据,所以30亿美元破译30亿碱基,每个碱基1美元的代价。这个对于第一代测序技术已经是非常好的结果。我们当时从1997年开始就想,如果是这样的话,我们每个人都有一部电影要拍摄出来,这个成本和时间根本就不能适应这个需求,所以就开始研发第二代测序技术。

  经过20年左右的努力,1997年开始,到2006年第二代测序技术正式上市,到现在差不多20年的时间,我们今年能做到的当初真的不可想象。Illumina公司今年年初公布的一个测序仪,它的通量能做到每年测30万人类基因组,相当于摄制30万部电影的数据量。当然为了精确度,我们行业内不会只摄制一次,要摄制30次左右才能把这个电影拍的精准一点,所以一台机器一年可以拍摄1万个人类基因组的数据量。

  在这个过程中,我们做了很多工作让摄制的成本不断地降下来。目前的成本,差不多是800美金。刚才提到目标是100美金,以现在的技术储备今后差不多一年半时间会到100美金。我们算了一下降低的速度,每六个月下降一半的成本,从2007年开始到目前,这个速度是超摩尔定律。摩尔定律是在固定成本下每18个月计算的速度增加一倍,即在固定计算能力下每18个月计算成本缩减一半。人类基因组测序成本每六个月下降一半。这么快速的下降,这么快速的技术更新会出现什么情况?人类对自身的认识越来越深,测序技术的应用也开始出现。

  第一个应用来自我非常好的朋友,香港中文大学的卢煜明教授的发现。他1997年发现母体血液中存在着胎儿的游离DNA。这当时觉得有点不可思议,现在觉得很简单。但是就是这么一个简单的发现,在2007年的时候,我们一块设计怎么用它来检测胎儿的异常,并实现了产前无创检测技术。现在有一百多个国家正在使用这个技术。最新的技术可以把所有的遗传疾病,在小孩还没有出生之前通过母亲外周血查出来,只要孕妇(能承担)这个成本的话。

  我们国内和一百多个国家目前推广的是比较简单但比较重要的疾病的检测。现在能检测的疾病数量还比较少,成本已经压得非常非常低。今后的方向是把成本继续下降,下降到检查所有疾病的时候还有一个非常低的成本。

  同样一个概念,能否将肿瘤在还没有征兆时检查出来?胎儿在母亲体内有十个月的过程,我们在这十个月内就能抓住异常,将疾病查出来。

  肿瘤在没有出现征兆的时候能不能查的出来?从某种程度上,肿瘤比胎儿应该更容易检查。从第一个细胞变成肿瘤细胞,到能被影像学识别的肿瘤,一般情况下这个过程差不多需要十年左右的时间。刚才说胎儿发育过程是十个月,对于肿瘤来说是十年,我们如果检测的手段非常非常准确的话,我们有足够长的时间把这些肿瘤没有被影像学技术发现前就能查出来。

  但是现在问题是,大家还没有看到这样的应用。没有实现的原因是因为肿瘤没有胎儿那么大。肿瘤的DNA跟胎儿一样都会进入到血液里面,但是它的DNA含量特别低,这样对检测技术的要求就非常非常高。这是我们这个行业,包括我们自己公司都在积极努力的,研发出一种高度灵敏的检测技术。我们一定要实现这个目标。

  假定我们真的实现这个目标,能把肿瘤的突变找到,那还存在一个问题,这个突变是各种各样的突变都有,有一些有意义,有一些没意义,我们还要建一个数据库。要建这个数据库,首先得建一个基线即参照数据库。几年前我们和阿里云开始合作,建立中国人的数据库,到去年为止,有40多万中国人的数据在我们数据库里面,今天可以说我们实际上拥有中国人的突变图谱。不管这些突变致病也好,还是不致病也好,我们拥有参照数据库。光有基线也不行,我们要有病变数据库。

  这个案例大家也比较清楚,安吉丽娜朱莉的乳腺癌。我们选乳腺癌作为第一个疾病数据库。我们通过这几年努力,知道差不多有60个基因跟乳腺癌有关。安吉丽娜朱莉的突变是发生在第17号染色体上,叫BRCA1基因,在美国有3.5%的乳腺癌病人是由于这个基因的突变导致的。

  那我们中国人是怎么样?我们去年和北大肿瘤医院进行了合作,对中国乳腺癌病人进行遗传突变分析。我们把1万个乳腺癌病人的基因组测了一下,发现乳腺癌病人里面有10%的人是由于已知的遗传缺陷导致。

  但跟茱莉不太一样的地方,在中国人群里BRCA1基因不是导致中国人乳腺癌发病最高的基因。我们发现中国乳腺癌病人里有3.5%左右的病人是由另外一个基因BRCA2的突变导致的。BRCA1的突变只占1.5%左右。这个工作还在进行之中。我们现在正在建立不同的疾病突变数据库。我们希望几年之后更多的疾病基因数据库都能建立起来,对治疗产生影响。

  这几年基于基因的治疗手段进展迅速。主要分两类。一种是小核酸为主的核酸药。这些药跟以往的化学药不一样。不一样的地方在那儿?比如左边这个图是波士顿一家公司叫Alnylan正在研发的药。这是这个公司做的第一期临床实验的结果。这个药注射一针,接受实验的病人的血脂六个月之内维持降低50%左右,对应的基因能降低75%左右。这就代表了一种新型的治疗方案。今后很有可能注射一针能够实现六个月、一年,甚至更久的治疗效果。有其还他几个类似的药,现在的临床实验也证实六个月内一针就够了。

  当然长远的解决疾病问题,是小孩刚出生,甚至还没出生的时候就进行基因治疗,比如基因剪辑。这个治疗方案是另外一个跟基因有关的治疗方案。

  今后如果有了基因数据,有治疗方案,就会形成另外一个局面。这个局面对人会是什么样的状态?最近有一本书,《人类未来简史》。这本书对今后的预期实际上不那么好,就是人今后信息累计太多的时候,会变成对人类自身不利,人会演变到更新的层次,跟现在完全不一样的层次。

  这现在还不是我们关注的地方,我认为今后我们要打造的社会,最起码在今后几年之内,先从基因的信息开始,通过检测把它聚集起来,聚集之后,我们有知识能用这个基因的信息知道医院该怎么做,治疗该怎么用,再往后很有可能进入另外一个状态,改变我们基因的信息,这是另外一个阶段。到那个阶段,可能跟这本书里面写的状态有关。希望有关是良好的有关,而不像这本书里面写的那样。

关于俱乐部 | 版权声明 | 诚聘英才 | 联系我们 | Tag标签
Copyright @2007 道农 Inc. All rights reserved.京ICP备0700005号 京公网安备11010802012838号