
-
生物通官微
陪你抓住生命科技
跳動的脈搏
解讀單細(xì)胞RNA-seq技術(shù)
【字體: 大 中 小 】 時間:2014年06月20日 來源:生物通
編輯推薦:
多年來,跟蹤一個單細(xì)胞的轉(zhuǎn)錄組,超出了我們的能力。但是現(xiàn)在,時代已經(jīng)變了,新型單細(xì)胞RNA-seq方法,可以分析大量的細(xì)胞及它們的命運(yùn)。
生物通報道:多年來,跟蹤一個單細(xì)胞的轉(zhuǎn)錄組,超出了我們的能力。但是現(xiàn)在,時代已經(jīng)變了,新的單細(xì)胞RNA-seq方法,可以分析大量的細(xì)胞及它們的命運(yùn)。
我們都參加過大型生日派對:在擁擠的房間里,與許多人聊天、吃飯和慶祝。但是,試想你并不知道壽星是誰,只是像一個局外者看待這個派對。你可能會覺得整個事件看起來與其他的生日派對沒有什么不同。然而,派對上的每個人都在壽星的生活故事里擔(dān)當(dāng)獨(dú)特的角色。所以,如果不知道每位來賓和他們的角色,一個局外人可能就會做出錯誤的假設(shè),或錯認(rèn)聚會上的人。
復(fù)雜器官的細(xì)胞成分,有點(diǎn)類似于生日派對。細(xì)胞群體在特定的時刻聚在一起,執(zhí)行關(guān)鍵的功能,形成一種器官。細(xì)胞亞群以不同的方式起作用,在特定的時間點(diǎn)履行專門的職責(zé)。(如同在聚會上,不同的人帶來禮物、吃食或幫助安排活動)。從技術(shù)的角度來看,仔細(xì)分析這些細(xì)胞如何單獨(dú)起作用,制造一個器官,為研究人員帶來了巨大的挑戰(zhàn)。但是,隨著科學(xué)家們不斷設(shè)計出的巧妙新技術(shù),梳理每個細(xì)胞在許多復(fù)雜過程中所起的作用,這些挑戰(zhàn)都會逐漸消失。
一系列事件
當(dāng)進(jìn)入一個生日聚會時,大多數(shù)人所做的第一件事情就是,簡單的觀察,跟來賓交談。他們是誰?他們做什么?他們來自哪里?他們認(rèn)識壽星多久了?
在解決“單個細(xì)胞如何在復(fù)雜系統(tǒng)中起作用”的過程中,科學(xué)家采取了相似的路徑。他們選擇單個細(xì)胞并孤立地研究它們。然而,分離單個細(xì)胞進(jìn)行分子分析,非常棘手,而接下來的問題是,一旦分離出它們之后,如何研究它們?那就是,測定特定時刻每個細(xì)胞正在制造的RNA轉(zhuǎn)錄本,對正在發(fā)生的事情獲得一個快照。有了足夠多的快照,就有可能漸漸弄清復(fù)雜的細(xì)胞事件和不同生物學(xué)過程所需的時間。
單細(xì)胞RNA測序(RNA-seq),是從2008年高通量測序變革陰影中出現(xiàn)的新一代測序(NGS)應(yīng)用,當(dāng)時有幾個實驗室報道了測定生物學(xué)樣本RNA含量的不同方法。在過去的六年中,RNA-seq已經(jīng)給我們展示了RNA世界的驚人多樣性,從我們已經(jīng)知道的轉(zhuǎn)錄合成蛋白質(zhì)的mRNA,到在細(xì)胞中發(fā)揮調(diào)節(jié)作用的非編碼RNA。相關(guān)閱讀:利用RNA-seq研究非模式生物。
早期的RNA-seq研究主要集中在細(xì)胞群體,在細(xì)胞周期不同時間點(diǎn)的細(xì)胞混合物,對其進(jìn)行測序,以確定正在表達(dá)的RNA轉(zhuǎn)錄本。而這些轉(zhuǎn)錄譜能提供已知的和新的RNA目錄,這一信息可告訴你參加聚會的賓客名單。這是一個很好的開始,但沒有提供你可能會喜歡的詳盡細(xì)節(jié)。
時間就是一切
哈佛大學(xué)醫(yī)學(xué)院的再生生物學(xué)和干細(xì)胞助理教授John Rinn,致力于探索RNA世界。他已經(jīng)發(fā)現(xiàn)了一些新的功能性非編碼RNA(ncRNA),ncRNA一度被認(rèn)為是跟轉(zhuǎn)錄噪聲差不多的分子。
長非編碼RNA(LncRNA,例如XIST)是一類專門的RNA,其生物學(xué)作用最近才開始為人所了解。Rinn稱:“我們可以利用單細(xì)胞測序,進(jìn)一步了解XIST的功能。”
在2012年,Rinn的研究小組開始尋找更多功能形式的長非編碼RNA,特別尋找充當(dāng)強(qiáng)大細(xì)胞調(diào)控因子的RNA。為此,他和同事們應(yīng)用單細(xì)胞RNA-seq,來檢測細(xì)胞分化這類過程中基因轉(zhuǎn)錄的pseudotemporal動力學(xué)。通過編目所有的細(xì)胞RNA,連同它們在細(xì)胞中的出現(xiàn)和消失時間,Rinn希望找到一些有趣的新lncRNA,他能夠?qū)⑻囟ǖ墓δ軞w因于這些新lncRNA。但是,很奇怪的事情發(fā)生了:他發(fā)現(xiàn)了無聊的舊mRNA。
Rinn將這些結(jié)果發(fā)表在今年3月份的《Nature Biotechnology》雜志,介紹了肌細(xì)胞生成的6種新細(xì)胞調(diào)控因子,他解釋說:“細(xì)胞沒有定義明確的mRNA表達(dá)模式,它不像‘現(xiàn)在打開’和‘關(guān)閉’那么簡單。”然而,對Rinn來說最大的驚喜可能就是,他在數(shù)據(jù)中觀察到了基因表達(dá)的隨機(jī)性,相當(dāng)于在生日聚會上不斷來去的人們,每一分鐘都在改變著房間的動態(tài)。你如何捕捉所有這些變化并分析這些數(shù)據(jù)呢?
隨機(jī)性總是為生物學(xué)家?guī)硖魬?zhàn)。在這種情況下,在單個細(xì)胞之間基因表達(dá)數(shù)據(jù)顯示出非常高程度的可變性。生物學(xué)變化不是唯一的問題——Rinn也需要考慮測序文庫制備過程中的實驗可變性。但是可變性也提出了可能性。
Rinn指出:“實際上,可變性和多樣性會告訴你調(diào)控因子在哪里。”想象一個調(diào)控因子不受可變性的影響——這會產(chǎn)生更多的數(shù)據(jù)可信性。他們的解決方案是,開發(fā)一種無人監(jiān)督的聚類算法,稱為Monocle,能夠提高單細(xì)胞RNA-seq數(shù)據(jù)的時間分辨率,并處理基因表達(dá)數(shù)據(jù)中的變化。利用Monocle的分類方法,Rinn能夠找到六種新的肌細(xì)胞生成調(diào)控因子,同時解釋數(shù)據(jù)集中的實驗和生物學(xué)變化。
諸如Monocle的程序的出現(xiàn),最終會為研究人員提供一種途徑,以一種有意義的方式,檢測生物學(xué)過程的基因表達(dá)動力學(xué),使他們能理解來自RNA-seq轉(zhuǎn)錄本目錄的所有數(shù)據(jù),較全面地了解細(xì)胞動力學(xué)。
準(zhǔn)備一個大型聚會
當(dāng)研究很少數(shù)的細(xì)胞時,用今天的測序技術(shù)和分析平臺,去確定在轉(zhuǎn)錄級聯(lián)早期或晚期階段中正在打開的是什么,是一個相當(dāng)簡單的實驗。但是,怎樣處理較大數(shù)量的細(xì)胞,獲得更詳細(xì)的信息呢?
通過在小型生日聚會上與別人交談,可以了解更多關(guān)于壽星的事情。然而,這不難看出,隨著聚會越來越大,很難發(fā)現(xiàn)那些相同的模式、趨勢和信息。如果你只跟一小部分的客人交談,如果偶然他們告訴我們關(guān)于壽星的完全不同的故事、給我們的信息太少,以至于不能建立聯(lián)系并得出結(jié)論,會發(fā)生什么情況?顯而易見的答案是,我們需要跟更多的人交談。在單細(xì)胞分析中同樣如此。
Rinn說:“用200個細(xì)胞,你開始了解情況。但是原則上,你采用的細(xì)胞越多,分辨率就越高。”分析幾百個單細(xì)胞全轉(zhuǎn)錄組的實驗,即使用今天的測序系統(tǒng),工作量也很大,這還不考慮數(shù)據(jù)分析在內(nèi)。
魏茨曼研究所免疫系的Ido Amit面臨著這種情況。測定有限數(shù)量細(xì)胞的轉(zhuǎn)錄組,特別是那些已經(jīng)用特殊細(xì)胞標(biāo)記分離出來的細(xì)胞,因此,這對復(fù)雜的細(xì)胞過程和每個細(xì)胞所起的作用,只能提供有限的認(rèn)識。此外,需要公正的信息來了解從每個分析的細(xì)胞所獲得的獨(dú)特轉(zhuǎn)錄譜。
為了解決這個通量限制,產(chǎn)生較高容量的轉(zhuǎn)錄組數(shù)據(jù),Amit及其同事開發(fā)出一種大規(guī)模并行RNA-seq工作流程,能夠同時破譯數(shù)百甚至數(shù)千個轉(zhuǎn)錄組,而不需要特定的標(biāo)記,相關(guān)研究結(jié)果發(fā)表在今年4月份的《Science》雜志。這一工作流程的關(guān)鍵是,能夠收集單細(xì)胞樣本,然后barcode和多重RNA-seq反應(yīng)。
最初,通過熒光激活的細(xì)胞分選(FACS)將單個細(xì)胞分類到384孔板中。然后,利用標(biāo)記的材料和三個級別的barcoding,集中處理細(xì)胞。Amit研究小組利用該工作流程,能夠測定4000多個小鼠脾臟的單細(xì)胞RNA,這些細(xì)胞被濃縮用于表達(dá)CD11c表面標(biāo)記。多路復(fù)用實驗可讓1536個細(xì)胞在一個單軌道進(jìn)行測序,在來自每個細(xì)胞的200和1500種不同RNA分子之間,產(chǎn)生22000個對齊的讀長(reads)。類似于Rinn的發(fā)現(xiàn),Amit的數(shù)據(jù)也顯示大量基因的高度細(xì)胞變異,這明確表明,檢測的脾臟細(xì)胞群具有異質(zhì)性,并且有機(jī)會發(fā)現(xiàn)新的調(diào)控因子和通路。
近年來,RNA-seq方法和分析工具有了很大的提高,這使得單細(xì)胞分析不僅能表明變異存在,也為研究人員提供了一種方法,來了解這一轉(zhuǎn)錄變異背后的生物學(xué)意義。
(生物通:王英)
生物通推薦原文摘要:
1. The dynamics and regulators of cell fate decisions are revealed by pseudotemporal ordering of single cells
Abstract: Defining the transcriptional dynamics of a temporal process such as cell differentiation is challenging owing to the high variability in gene expression between individual cells. Time-series gene expression analyses of bulk cells have difficulty distinguishing early and late phases of a transcriptional cascade or identifying rare subpopulations of cells, and single-cell proteomic methods rely on a priori knowledge of key distinguishing markers1. Here we describe Monocle, an unsupervised algorithm that increases the temporal resolution of transcriptome dynamics using single-cell RNA-Seq data collected at multiple time points. Applied to the differentiation of primary human myoblasts, Monocle revealed switch-like changes in expression of key regulatory factors, sequential waves of gene regulation, and expression of regulators that were not known to act in differentiation. We validated some of these predicted regulators in a loss-of function screen. Monocle can in principle be used to recover single-cell gene expression kinetics from a wide array of cellular processes, including differentiation, proliferation and oncogenic transformation.
2. Massively Parallel Single-Cell RNA-Seq for Marker-Free Decomposition of Tissues into Cell Types
Abstract: In multicellular organisms, biological function emerges when heterogeneous cell types form complex organs. Nevertheless, dissection of tissues into mixtures of cellular subpopulations is currently challenging. We introduce an automated massively parallel single-cell RNA sequencing (RNA-seq) approach for analyzing in vivo transcriptional states in thousands of single cells. Combined with unsupervised classification algorithms, this facilitates ab initio cell-type characterization of splenic tissues. Modeling single-cell transcriptional states in dendritic cells and additional hematopoietic cell types uncovers rich cell-type heterogeneity and gene-modules activity in steady state and after pathogen activation. Cellular diversity is thereby approached through inference of variable and dynamic pathway activity rather than a fixed preprogrammed cell-type hierarchy. These data demonstrate single-cell RNA-seq as an effective tool for comprehensive cellular decomposition of complex tissues.
生物通微信公眾號