人類基因組是一套完整的人類基因,位於23對獨立的染色體裡。將其中的22對依照尺寸大小進行排序,並分別命名為1~22號染色體,1號**,22號*小。剩下的那對是性染色體,在女性體內是兩條大的X染色體,在男性體內則是一條大的X染色體和一條小的Y染色體。就尺寸大小而言,X染色體處於第7號和第8號染色體之間,Y染色體則是*小的。
就基因數量而言,“23”這個數目沒有任何特殊的意義。許多物種擁有更多的染色體,與人類關繫*近的近親猿類就是這樣的,也有很多物種的染色體要少一些。而相似的基因或有著類似功能的基因也不一定聚集在同一條染色體上。幾年前我通過筆記本電腦和演化生物學家戴維·黑格(DavidHaig)聊天時,他說*喜歡第19號染色體。我很驚訝。他解釋道,那條染色體上有各種調皮搗蛋的基因。在那之前我從來沒有想過染色體竟然還有不同的性格,歸根結底,它們不過是基因的組合。但是黑格的話卻在我心中植入了一個想法,一直以來都揮之不去:人類**次探索人類基因組,發現了各種細節,並將其一一展現出來。為什麼不試著從每條染色體上都選擇一個**代表性的基因,講述一下基因組的故事呢?普裡莫·萊維(PrimoLevi)在他的自傳體短篇小說集裡就用類似的方法講述素周期表,每素是一個章節,分別講述了他接素的那段時期裡發生的事情。
於是,我想到:人類基因組本身就是一部人類的自傳,它從生命誕生之時起,便用“基因語言”記錄了人類和人類祖先所經歷的世事更迭與變遷。有些基因從*早的單細胞生物誕生起,就沒有發生變化;有些基因是當我們的祖先還是線蟲的時候出現的;有些基因是當我們的祖先還是魚的時候出現的;有些基因因為近期的一場流行病,變成了目前的形態;還有些基因可以用來研究過去幾千年裡人類遷移的歷史。從40億年以前到*近幾個世紀,人類基因組譜寫了人類的自傳,記錄了人類歷史中的每個重要時刻。
我寫下這23對染色體的名單,並在每條旁邊列出對應的人類本性中的一些重要內容。這是一個緩慢而艱難的過程,我開始尋找那些具有代表性的基因,有時無法找到合適的基因,有時找到了合適的基因卻發現它位於其他染色體上,真是令人沮喪。如何排列X和Y染色體是我遇到的另一個難題,在這本書中,我根據尺寸大小把它們放在了第7對染色體之後—對於X染色體而言,這再合適不過了。
乍一看來,本書似乎頗具誤導性,似乎我在暗示1號染色體*早出現,其實不然。抑或是我在暗示11號染色體隻與人類的性格有關,亦非如此。人類基因組裡有6萬~8萬個基因,我無法一一道來,部分是因為截至本書成稿,隻發現了不到8000個(盡管這個數字還在以每月幾百個的速度增加)。還有一部分原因是它們中的大部分主要負責人體生化反應,描述起來既枯燥又無味。
我要向大家展示的是人類完整基因組中的驚鴻一瞥,在基因組裡*有趣的地方稍作逗留,看看它們告訴我們的關於人類自己的一些事情。我們這一代是幸運的,因為我們是閱讀《基因組》這本書的**批人。能夠閱讀基因組,意味著我們能夠更好地了解人類的起源、人類的進化、人類的本性以及人類的思維,這將超過迄今為止科學帶給我們的關於人類的所有知識。它將給人類學、心理學、醫學、古生物學和幾乎所有其他學科帶來一場革命。這並非宣揚基因就是一切,或者基因比其他任何因素都重要。但是,基因的重要性是毋庸置疑的。
本書的主題不是關於人類基因組工程—基因定位與測序技術的,而是講述了這一工程有何發現。2000年6月26日,**份人類完整的基因組草圖的繪制完成,僅僅用了短短幾年時間,我們就從對於人類基因幾乎一無所知變得無所不知。我堅信,我們正在經歷著人類智力活動史上無與倫比的偉大時刻。同時,也有人發出了不同的聲音。他們認為,僅用基因無法涵蓋人類的全部。我並不否認這一點,每個人所擁有的遠遠超過一份遺傳密碼。但在此之前,人類基因幾乎是一個謎,我們將是**批破解這個謎團的人—我們即將揭曉重要的新答案,但也將面對更多的新問題,這也是我希望在本書中呈現給讀者的。
導論
前言的第二部分作為本書的導論。在這個部分中,我把與基因和基因作用機制有關的主題以詞彙表的形式展現出來,並加以解釋。希望讀者快速瀏覽這部分內容,以便在閱讀本書的過程中遇到不清楚的術語時,能夠返回此部分查詢。現代遺傳學術語無數,錯綜復雜。本書力求少用技術術語,但有些還是無法避免的。
人體有大約100萬億個細胞,大多數細胞直徑不到1/10毫米。每個細胞內部都有黑色的一團,叫作細胞核。細胞核裡有兩套完整的人類基因組(卵細胞、精子細胞和血紅細胞除外。精子細胞、卵細胞隻有一套基因組,血紅細胞內沒有基因),其中一套來自母親,另一套來自父親。從理論上講,每套基因組都有相同的23對染色體,上面有相同的6萬~8萬個基因。但實際上,來自父親和母親的基因對上常常有著細小的差別,正是這些差別決定了人的眼睛是藍色還是棕色。人類在生育時,來自父親和母親的染色體經過交換和重組,便將一套完整的基因組傳給了下一代。
想像一下,“基因組”是這樣的一本書:
●全書共23章,每章都是一對染色體。
●每章都包含幾千個故事,每個故事都是一個基因。
●每個故事由不同的段落組成,稱為外顯子。段落之間是廣告,名為內含子。
●每個段落由詞語組成,叫作密碼子。
●每個詞語由字母構成,叫作堿基。
如果基因組是一本書,那麼這本書有10億個單詞,長度是本書的5000多倍,或者是《聖經》的800