一、CRISPR 系統的發(fā)現-從細菌的獲得性免疫說(shuō)起
CRISPR 系統實(shí)際是細菌的一種獲得性免疫系統。細菌被 phage 侵染之后,可以獲得 phage 的 DNA 片段整合進(jìn)基因組形成記憶,當再次遭到入侵時(shí),從對 phage 形成免疫。
1)早在 1987 年,日本人在大腸桿菌中發(fā)現有串聯(lián)間隔重復序列。但一直不清楚功能。后來(lái)的研究發(fā)現,這種重復序列廣泛存在于細菌和古細菌中。2002 年才正式命名為 CRISPR(Clustered regulatory interspaced short palindromic repeats).
(這些和植物的 siRNA, 高等動(dòng)物的獲得性免疫一樣,都是獲取入侵病毒的一個(gè)片段形成記憶,從而再次遭到入侵時(shí)可以對抗入侵的一種方式)
這中間還有很多故事(mark 先,待補充,還有 adaptation 的過(guò)程的發(fā)現),比如,
1)Phage 上和 CRISPR 重復序列同源的序列突變后,Phage 又可以重新可以侵染細菌。這顯示在這一系統的工作過(guò)程中存在著(zhù)一個(gè)序列配對機制。
2)有些 Cas 蛋白突變后,細菌還可以獲得入侵的 DNA 片段整合進(jìn)基因組,但不能降解外源的 DNA 片段。這證明 Cas 系統中有的蛋白負責獲取并整合外源 DNA 片段,而另一些酶負責在再次入侵時(shí)降解外源 DNA。
3)在 Cas9 功能不清楚時(shí),其實(shí)就發(fā)現這個(gè)基因上的某些點(diǎn)突變可以導致整個(gè)系統不 work。等 Cas9 的核酸酶的身份揭曉時(shí),再回去看以前的數據,一切都豁然開(kāi)朗了。這些突變恰恰就是 Cas9 核酸酶的活性位點(diǎn)。
二、謎團逐漸解開(kāi)-從嗜熱鏈球菌說(shuō)起
2007 年 Science 上又發(fā)表了一篇文章,作者是 DANISCO 公司的科學(xué)家,講的是關(guān)于 Streptococcus Thermophilus(嗜熱鏈球菌),這個(gè)菌大家可能不熟悉,但他們的產(chǎn)品大家可能天天吃。這是工業(yè)上生產(chǎn)酸奶的菌種。工業(yè)生產(chǎn)中常遇到的問(wèn)題就是這些乳酸菌會(huì )被 Phage 侵染,因此這些食品生產(chǎn)企業(yè)需要開(kāi)發(fā)各種抗 Phage 的策略和分離抗 phage 的菌株,研究也發(fā)現抗 Phage 的菌株和敏感的菌株在 CRIPSR 的這些位點(diǎn)有差別,前面也講到其他研究組發(fā)現 CRISPR 中間的重復序列和 Phage 的序列高度同源。于是,他們就想看一看通過(guò)增加和敲除 CRISPR 位點(diǎn)中間的重復序列是不是可以調節乳酸菌對 Phage 的敏感性。果然,實(shí)驗結果正如他們所料。
隨著(zhù)研究的進(jìn)一步深入,大家逐漸地意識到,細菌抵抗外界入侵的流程大致如上圖所示,Cas 位點(diǎn)編碼多個(gè)核酸酶和解旋酶,他們把入侵的 DNA 切割,整合到 CRISPR 的重復序列中,形成記憶。當再次遭到入侵時(shí),轉錄出 RNA,Cas 蛋白復合物利用這些和入侵的 DNA 同源的 RNA 去切割摧毀外源的 DNA。
三、Type I and Type III CRISPR 系統
隨后對不同的菌的基因組測序及其他研究工作的積累,也使得 CRIPSR 的機理逐漸清晰。越來(lái)越多的不同菌中的 CRISPR 系統被發(fā)現,隨后研究者們根據他們降解外源的遺傳物質(zhì)的方法,將他們分為了三類(lèi)。如圖中的 Type I and Type III. 這兩套系統由于參與的蛋白眾多,需要幾個(gè)復合物共同作用才能發(fā)揮作用,使得它不宜操作和改造。但其他幾個(gè)系統的發(fā)現的過(guò)程也是非常值得一講的,都是非常漂亮的工作。(mark 先,待補充)
四、窗戶(hù)紙就快捅破了-Cas9
很多同學(xué)知道 Cas9, 并不知道還有 Cas1,Cas2,Cas etc 還有很多蛋白。
2012 年突破終于來(lái)了,Jennifer A. Doudna(mark for 八卦,最年輕的女院士,女神 etc)和 Emmanuelle Charpentier 的這篇 Science 發(fā)現了一個(gè)比較簡(jiǎn)單的 CRISPR(TypeII)系統的機理。這一系統就簡(jiǎn)單多了,一個(gè)巨大的 160KD 的蛋白 Cas9 利用 RNA, 就可以完成識別和切割靶向的 DNA。他們發(fā)現了
1)Type II CRISPR 系統中的 Cas9 是個(gè)核酸酶,這個(gè)核酸酶結合兩個(gè) RNA(crRNA, tracrRNA) 就可以切割雙鏈 DNA.
2)同時(shí),他們進(jìn)一步闡明了 RNA 和目標 DNA 配對的原則,同時(shí)將 crRNA-tracrRNA 連接成了 chimera RNA,這樣只需要 Cas9 蛋白和一條定制的 RNA 就可以編輯性的 DNA。
3)同時(shí)他們進(jìn)一步分析了 Cas9 作為核酸酶的活性位點(diǎn):連個(gè)核酸酶活性分別切割靶 DNA 的兩條鏈。
所有這些工作為現在的風(fēng)生水起的 CRISPR/Cas9 的應用奠定了最根本的基礎。到這里,大家都知道這個(gè)新的基因編輯系統即將呼之欲出了。
五、真核系統的應用
幾乎同時(shí),三個(gè)研究組發(fā)表三篇論文,兩篇在《科學(xué)》雜志,一篇在《Elife》上報告了他們在哺乳動(dòng)物細胞的應用。這就是拼人力、物力和效率來(lái)了(所以,可以跟科技部的領(lǐng)導說(shuō)說(shuō),國內要發(fā)展綠色通道,開(kāi)發(fā)自己的試劑,留住自己的人才,假設我們同時(shí)開(kāi)始做這個(gè)課題,國外文章發(fā)了,我們還在等抗體)。核心思想早就在那里了,主要改進(jìn)大家都一樣,
1)優(yōu)化密碼子,讓 Cas9 蛋白可以在哺乳動(dòng)物系統中很好的表達。
2)加了核定位序列 (NLS),這樣可以把 Cas9 送到細胞核內進(jìn)行基因組編輯。
3)當然,同時(shí)需要表達一個(gè) guide RNA,把 Cas9 定位到靶 DNA 處。
用這個(gè)技術(shù),就可以很方便高效廉價(jià)地在細胞上做基因編輯:包括敲除、修改、插入。
六、進(jìn)一步用 Nickase 增加編輯特異性
因為 Cas9 介導的靶向主要依賴(lài)于 guide RNA 和目標 DNA20 左右的堿基的配對,大家開(kāi)始重視脫靶效應(off-target)。一系列的研究表明,這種方法的脫靶效應是廣泛存在的。這很好理解,因為 RNA-DNA 的配對不是那么完美的。很快,MIT 的張峰在 Cell 上發(fā)表了 Double Nick 的方法(當然同時(shí)也有很多人做,后面陸續也有不少組都有文章)。文章的原理很簡(jiǎn)單,其實(shí)早在 2012 那篇奠定基礎的《科學(xué)》文章里就已經(jīng)埋下了種子。Cas9 會(huì )在目標 DNA 上切兩刀,如果把其中一個(gè)核酸酶活性位點(diǎn)突變掉,它就變成了一個(gè)切口酶。用兩對這樣的 sgRNA 把這種切口酶帶到基因組上的特異位點(diǎn),這樣就大大提高了靶向的特異性。
(本文轉載丁香通)