用IT的語言講述BT的故事
——訪華大基因首席執行官王俊
本刊記者 周海勝
無論是上世紀末,還是本世紀初,人們從沒有因為移動互聯網時代的到來而懷疑過曾經的預測:全球未來最大的產業將是生物技術產業。只不過,如今的人們更是好奇,進而期待,當IT遇到BT(biotechnology),這兩項終將影響人類發展的技術碰到一起會產生怎樣的火花?科學界、產業界以及社會各界都對人的話題產生濃厚興趣,而事實上,這兩者在過去的數十年間里都在研究著對方的科學。
在3月25日舉行的2015中國(深圳)IT領袖峰會上,華大基因首席執行官王俊用IT的語言生動地講述了華大基因生命的故事。未來,BT和IT的融合將會帶來技術、科學和產業新的增長點,帶來人類更加長遠的發展。
經濟導報:當我們講數字化、計算機、IT的時候,總習慣于以硅為體系。但在講到生命的時候,卻以碳為體系。試問,生命也能講數字化嗎?
王俊:生命的基礎是碳。生命是數字化的。為什么講生命是數字化的?它能夠儲存嗎?能夠編程嗎?能夠改變不同程序來實現不同的生命形式嗎?可以做克隆嗎?
這一切當然是可以的。為什么能那么簡單從一只羊身上提一個細胞變成另一只羊呢?因為那只羊的細胞儲存了所有羊的生命程序。一個巴掌大的DNA可以儲存上百萬年,甚至上億年的時間。現在沒有任何一種存儲介質可以把這樣的信息載體儲存上百萬年,所以DNA是可以存儲的。此外,計算和編程最核心的基本單位是基因,基因是生命體最基本的構成單位。我們每個人身上蘊藏的所有信息組合就是一套生命信息基本程序,這套基本程序就是生命的語言。
起初,生命的語言就像每個程序員寫出一個功能模塊,希望所有人都用他的模塊一樣,隨后在生命體里形成一些基因、蛋白質、小分子,它們也希望不斷擴張自己。其實,美國有一本非常著名的書提到,整個擴張的過程就是不斷復制、不斷擴張、不斷延展的過程。有時候發現一個基因并不夠用,可以和其他基因一起合作。當一堆基因能夠合作更好時,就形成個體。
經濟導報:人類身上有2-3萬個基因,水稻有5萬多個基因。不同基因組合成不同的生命程序,那每一套程序代表著不同的生存策略嗎?
王俊:是的,每套不同的生存策略事實上針對于不同環境體系而言。在他檢查你的程序到底好不好用,唯一的標準就是你這套程序能不能活下去,甚至傳播更多后代。當你選擇傳播更多后代的這套程序就叫做可以適應于這套環境的生命語言。所以,我們看見所謂的達爾文進化學說、適者生存論都是在這個基礎上建立起來的。我們每個人更是基因信息的載體。每個人跟微小蟲子相比,都可以發現相似性,很多基因從那兒傳到我們身上。
對于個體來說,每個人的生命程序也不相同。為什么西藏人可以適應高山,而我們到了高原卻有強烈的高原反應。究其原因,是因為身體里沒有寫進適應高山的基因,而藏族人卻有。只有擁有這種基因的人才可以在高原上沒有任何反應,而我們卻不行。在漢族人中,僅有5%人擁有這個基因,而藏族人卻達到95%。這種基因不僅存在于西藏這個特別復雜極端的環境里,還與飲食有關,如南方傣族人因為祖先經常吃檳榔,所以體內基因很多跟檳榔相適應,這是個體水平的變化。
當我們考慮一個精子、卵子結合的時候,它發生了重組。每一代人當中,你孩子和父母之間有100個基因突變,這些基礎就形成不同生存策略。環境在時時刻刻變化、基因在時時刻刻變化,基因組卻是可以預測程序。你身上的基因是因為你祖先經過成千上萬年不斷進化而來。體內基因不會告訴你去不去高原,但是一定會告訴你去完高原會產生什么反應。
經濟導報:如果真正遵循基因規律,那么人類的壽命將可長達150歲。但是,現在的我們卻活不到150歲。這是為什么呢?
王俊:因為人會生病,這些病與人的壽命和基因有關。基因里的毛病就像書寫程序時出現的漏洞(bug)。如果連基因程序都無法運營,那么將會出現非常嚴重的問題。比如,各種各樣罕見疾病的出現。通常,患有罕見疾病的人,生存周期都很短,這方面我們有諸多事例可以證明。生命程序不斷試代碼,試代碼過程中不斷試錯。當然,每一個錯誤并不是代表新進步的可能。此前,華大基因就有收到先天性疾病患者寄來的求救信。患者多數出自瓷娃娃、魚娃娃等協會組織。他們希望,華大基因能夠利用先進的科學技術將先天性疾病變成可防可控。對此,華大基因方表示,當孩子出生之前,我們可以提前做檢測,早點發現問題,早點控制干預。
首先,利用現代科學技術檢查孩子的父母是否出現基因突變。如果是,他們生出來的孩子患有先天性疾病的概率又有多少。兩廣、福建地區地中海貧血攜帶率差不多達到19%。如果兩位地中海貧血攜帶者結為夫婦,生出患有地中學貧血孩子的機率非常大。其實,我們可以人工受精,做一個移植前檢測。目前,中國諸多醫院已經開展移植前檢測。
其次,如果已經懷孕了怎么辦?懷孕兩三個月內,我們可以對孩子進行基因檢測,尤其是針對非常罕見的基因性疾病。通過篩差,可以達到新生兒出生前防控。目前,中國耳聾發生率多為錯用抗生素。如果體內基因不能經受鏈霉素這種抗生素,那么發生耳聾的機率便增大。基因檢測得知,如果新生兒有心臟病、耳聾、自閉癥等風險,那么我們可以提前進行干預,甚至可以通過大數據找到根治罕見疾病的解決方案。
經濟導報:過去,你曾經提過一個關于超級英雄計劃。而這個超級英雄能回答什么問題?
王俊:這個計劃就是搜索100萬人的基因數據,尋找所謂的超級英雄。從基因校對來講,他應該患上某種疾病,但他卻非常健康,這種人就是超級英雄。
比較有意思的是,超級英雄體內帶有非常明確的致病基因,但他卻非常健康,這究竟是為何?研究表明,他們體內的另一套基因正在為他保駕護航。猶如程序中出現漏洞(bug)的同時也在進行修復,所以系統便顯得非常健康。如果能找出另一套基因,也許可以找到根治罕見性疾病的藥物。
面對腫瘤威脅,人類往往流露出懼怕的表情。由于受環境因素影響,你的基因程序也會出現變異。所有細胞均來源于第一個細胞——受精卵細胞。從那個細胞開始,每次變異都會引發程序變化。不同的環境會導致程序的不同,比如抽煙能增加肺部細胞變異率或者各種各樣病毒感染導致程序被黑。如果一個細胞被黑,它很有可能獲得比其他細胞更強的適應性,甚至可以不斷擴張。從一個腫瘤細胞發生到能用CT掃描出來,平均要耗時15年。也就是說,在15年內,我們可以通過基因檢測判斷出體內是否含有腫瘤細胞。
患上腫瘤該如何?事實上,每個腫瘤細胞的基因都不同,現在我們要做的是對所有細胞實行基因檢測,而不是簡單手術可以徹底解決。其實,萬物都與基因有關,慢性疾病、感染性疾病亦是如此。如果將體內細胞以人為整體劃分的話,個體細胞只占人體細胞的1/10,9/10是形形色色的微生物、病毒。哪怕你每天洗兩次澡也于事無補,細菌很快就會不請而至。90%發燒腹瀉你根本不知道是怎么回事?這時候,或許我們可以將所有DNA提取出來,不出一小時便能知道為何感染。如果我們早一點這樣做,便可早一點擺脫疾病風險。
最終,我們要完成這么一個生命公式:左邊是自己的基因,右邊是你的表現狀況。若想研究清楚絕大部分復雜疾病、基因、環境的關系,則需要收集100萬人的各種信息,才能寫出這樣的生命公式。
經濟導報:寫出這種生命公式花費貴不貴?
王俊:這種方法“造價”非常昂貴。1999年,中國華大基因參與了1%人類基因組計劃。當時,測序需要10億美金,最近已降至1萬美金,但依然耗資巨大。當前,要想搜集100萬人的數據仍需“耗資”1000美金,估計明年將推出500美金測定一個人的完整基因。
耗費如此巨大的民生工程,相信很多人會問何時才能實現免費檢測呢?事實上,免費實施的到來在于基因本身數據價值遠遠大于產生它的數據所需要的成本。按照目前的發展趨勢,我們認為5年后將能真正達到這樣的結果。
除了基因數據外,時下較流行的物聯網也能實現收集各種各樣數據的功能。為什么說基因組網絡如此重要?據聞,所有男人都來源于12萬年前的一個男人,所有女人都來源于12萬年前的一個女人。我們的科學研究發現,人類都來自于一個人。有人說,這個人是亞當和夏娃。中國70%漢族人追溯到6000年前,則是炎黃蚩尤等三人。如果將每個人的數據串聯起來,構成一個完整的基因組網絡,那么這將是一股不可小覷的醫學研究結果。
當所有基因組構成一個網絡,當所有病人組成一個網站,我們就有可能從中研究清楚基因和疾病之間的關系。目前,我們就有這樣一個網站,叫做同病相憐網站。華大基因已經在這方面做了很多事,雖然這些事似乎聽起來有點像天方夜譚。此前,我們栽種了3000株小米。期間,通過在同一地方、不同環境下小米的生長情況,對比研究它的產量、營養成分等數據。通過研究,我們幾乎可以準確預測不同環境下小米未來的長勢走向。
經濟導報:對于人類健康,未來能有研究小米這樣的能力嗎?
王俊:當我們擁有100萬人基因測序時,離這樣的能力就很近了。美國總統奧巴馬曾提出一個精準的醫療計劃,要求將100萬人的基因組庫。當所有人完成后,我們將有一個水晶球預測你未來的健康走向。生命信息的存儲,我們都叫干細胞。干細胞就是年輕時候的生命信息。
自然以山清水秀為美、人以健康長壽為福。華大基因的目標就是基因科技造福人類。
經濟導報:華大基因是個什么樣的機構?
王俊:華大基因是全球最大的基因組中心、生物信息中心,是國家基因庫承辦單位。機構遍布60多個國家,擁有5500人,平均年齡低至27歲。
在未來計算機體系里,如果給他很多生命邏輯,他會變成一個生命體嗎?如果我們計算大腦已經可以跟人腦匹配時,它會有生命性嗎?當我們擁有改變人類基因時,我們該如何控制這種能力?這些問題值得深思。作為另外一個緯度(碳基因維度)的IT人,華大基因希望給大家帶來的不僅僅是對生命的認知,而是對健康認知最佳理性的選擇。謝謝!
人物簡介:王俊是華大基因研究院的創始者之一,當前世界生物技術領域著名的科學家。他在基因工程等生命科學領域取得了一系列原創性的科研成果,在最頂尖的雜志《自然》、《科學》發表學術論文已經超過100篇,為中國基因組學的研究做出了突出貢獻,也是深圳新型研究機構的典型代表。王俊入選了《自然》雜志2012年科學界十大人物,去年王俊還榮獲了國內陳嘉庚青年科學獎。