周魯林,楊潤坤,張 文,馮 林,肖 汀,程書鈞,張開泰,張 蕾*
(1.國家癌癥中心/國家腫瘤臨床醫(yī)學研究中心/中國醫(yī)學科學院北京協(xié)和醫(yī)學院腫瘤醫(yī)院分子腫瘤學國家重點實驗室,癌發(fā)生及預防分子機理北京市重點實驗室,北京 100021;2.哈爾濱醫(yī)科大學附屬第二醫(yī)院結直腸腫瘤外科,哈爾濱150086;3.國家癌癥中心/國家腫瘤臨床醫(yī)學研究中心/中國醫(yī)學科學院北京協(xié)和醫(yī)學院腫瘤醫(yī)院免疫學研究室,北京 100021;4.國家癌癥中心/國家腫瘤臨床醫(yī)學研究中心/中國醫(yī)學科學院北京協(xié)和醫(yī)學院腫瘤醫(yī)院內鏡科,北京 100021)
腫瘤是一個高度異質性的復雜系統(tǒng),腫瘤細胞與腫瘤微環(huán)境中的各類細胞相互影響、相互依存[1]。解析腫瘤組織中各類細胞亞群的特征和分布是認識腫瘤異質性的必然要求,也是了解腫瘤病因和制定治療決策的需要[2]。近年來出現(xiàn)的單細胞轉錄組分析技術為此類問題的解答提供了新的有利線索[3]。例如在2016年,Tirosh等[4]首次利用單細胞測序技術剖析了轉移性黑色素瘤的微環(huán)境特征;隨后在2017年,Zhang等[5]也利用該技術繪制出了第一張肝癌內浸潤性T細胞的免疫圖譜。然而早期的單細胞轉錄組測序方法,多采用口吸管分離[6]或無限稀釋[7]等方法獲得單細胞,逐一進行單細胞轉錄組擴增和文庫構建測序,成本高,通量低。近年來微流控和分子標記技術的發(fā)展使單細胞分離和標記獲得了前所未有的通量和分辨率[3,8]。2015年發(fā)表在同期《細胞》雜志上的2篇文章,介紹了dropseq和indrop兩種高通量的液滴微流控單細胞RNA測序的技術[9-10],使單細胞轉錄組分析進入了一個新階段。
在drop-seq方法中,通過正交式微流控裝置將單個細胞和單個標記微球共包裹在1個油包水型乳濁液微滴中。通過微球上串聯(lián)攜帶的細胞特異性的條形碼(cell barcode,每個微球不同)、分子特異性的條形碼(unique molecular identifiers,UMIs,同一個微球上的每個引物分子均不同),以及捕獲mRNA用的polyT的引物序列[9],來實現(xiàn)單個細胞mRNA的捕獲和標記(如圖1)。正是得益于這種高通量的細胞包裹和分子標記方法,我們可以一次標記成千上萬個細胞,并對它們同時進行測序。
圖1 液滴微流控單細胞轉錄組檢測技術的原理及流程的示意圖
在本研究中,我們組裝建立了一套基于“dropseq”原理的微流控單細胞標記系統(tǒng),通過調節(jié)微流控的參數(shù),獲得了最適的細胞標記率。利用混合的人和小鼠的兩種腫瘤細胞系評價了該系統(tǒng)的精確性,表明該技術在腫瘤研究中具有廣泛的潛在應用價值。
人急性早幼粒白血病細胞系HL-60和小鼠黑色素瘤細胞系B16-F10購自北京協(xié)和細胞資源中心。RPMI-1640培養(yǎng)基、胎牛血清(fetal bovine serum,F(xiàn)BS)購自Gibco公司。Barcoded microparticles購自Chemgenes公司;droplet generation oil購自Bio-Rad公司;Maxima H Minus Reverse Transcriptase購自Thermo Fisher Scientific公司;十三氟-1-辛醇(Perfluorooctanol)購自Sigma公司;Exonuclease I購自NEB公司;KAPA Hifi HotStart ReadyMix購自KAPA BioSystems公司;Nextera XT DNA sample preparation kit購自Illumina公司;Ampure XP beads購自Beckman Coulter公司;BioAnalyzer High Sensitivity Chips購自Agilent公司。
人急性早幼粒白血病細胞系HL-60、小鼠黑色素瘤細胞系B16-F10均使用含10%胎牛血清的RPMI-1640培養(yǎng)基,于37℃、CO2體積分數(shù)為5%的細胞培養(yǎng)箱中培養(yǎng),2~3 d更換培養(yǎng)基。
將對數(shù)生長期的細胞消化后用40μm的細胞濾膜過濾去除細胞團,重懸在含0.01%牛血清白蛋白(BSA)的磷酸緩沖鹽溶液(PBS)中制備成單細胞懸液。將兩種單細胞懸液按照細胞數(shù)量1∶1的比例混合后,調整細胞濃度為250個/μL。
1.3.1 液滴微流控設備的組裝和運行 液滴微流控單細胞分離系統(tǒng)主要由動力裝置、流路裝置和控制裝置組成。系統(tǒng)的各種裝置主要由英國Dolomite公司提供。壓力泵為液體提供穩(wěn)定的動力,流量傳感器能夠精確地監(jiān)測液體的流速。利用管路將壓力泵、流量傳感器與液滴微流控芯片緊密連接。流體控制軟件通過控制壓力泵的壓力調節(jié)流速產生高度均一的液滴。該系統(tǒng)還包括1個注射閥門和樣本環(huán),用于裝載微球溶液,使微球能夠均勻地排列在管路中。
先打開空氣壓縮機和壓力泵,分別將油(droplet generation oil)和細胞裂解緩沖液[200 mmol/L Tris-HCl緩沖液(pH 7.5),6%聚蔗糖400溶液,0.2%十二烷基肌氨酸鈉溶液,20 mmol/L乙二胺四乙酸]放入壓力泵的液體艙中,壓力泵設置壓力為2 000 mbar,使液體充滿管路。
1.3.2 加入樣本和微球實現(xiàn)細胞與微球的包裹 將裝有單細胞懸液的1.5 mL離心管放入壓力泵的液體艙內,打開磁力攪拌器使細胞處于懸浮狀態(tài)。使用注射器向樣本環(huán)中快速加入0.5 mL微球溶液。設置細胞、微球和油的流速分別為30、30和200μL/min,按照油-細胞-微球的順序分別打開對應的壓力泵。在芯片出口處用50 mL離心管接收產生的乳濁液。
1.4.1 破裂液滴 將收集到的乳濁液去除底部多余的油,加入30 mL的6×SSC緩沖液和1 mL的十三氟-1-辛醇溶液,渦旋震蕩30 s破裂液滴。1 000 g離心1 min。將油和水界面中間的微球轉移至新的離心管中,加入30 mL的6×SSC溶液。1 000 g離心1 min。
1.4.2 反轉錄和酶切 按照Maxima 5×RT buffer 40 μL,20%蔗糖400溶液40 μL,dNTPs(10 mmol/L)20 μL,RNA酶抑制劑5 μL,反轉錄引物(RT primer,50 μmol/L)10 μL,Maxima H-RTase 10 μL和75 μL水,總體系200μL配制反轉錄反應體系。向微球中加入反轉錄體系,37℃旋轉孵育35 min,40℃旋轉孵育90 min。再將微球分別用1 mL的TE-SDS溶液和TE-TW溶液各洗一遍。核酸外切酶反應體系為:10×Exo I buffer 20μL,水170μL,核酸外切酶I 10 μL,總體積200μL。向微球中加入核酸外切酶反應體系,37℃旋轉孵育40 min。
1.4.3 PCR擴增和產物純化 用1 mL水重懸微球,平均每2 000個微球分裝到1個PCR管中。每個PCR管的PCR反應體系為:水為24.6μL,PCR引物(PCR Primer,100 μmol/L)為 0.4 μL,Kapa HiFi Hotstart Readymix(2×)為25 μL,總體系50 μL,在PCR儀上進行PCR擴增。反應條件:94℃、3 min;97℃、20 s,66℃、45 s,74℃、3 min,共4個循環(huán);97℃、25 s,68℃、25 s,74℃、3 min,共10個循環(huán);74℃、5 min。 向每個PCR反應產物中加入30μL的AMPure XP beads,操作過程嚴格按照純化試劑盒說明書的要求,最終10μL的水洗脫。利用BioAnalyzer High Sensitivity Chips檢測純化樣本cDNA的質量。
1.4.4 建庫和測序 取600 pg純化的cDNA樣本總體積5μL,加入10μL的 Nextera TD buffer和5μL的Amplicon tagment enzyme,55℃孵育5 min。再向PCR管中依次加入15μL的Nextera PCR mix,8μL的水,上、下游PCR引物(P5-PCR primer,Nextera N70X oligo,10 μmol/L)各 1 μL,在 PCR 儀上進行PCR反應。PCR反應條件:95℃、30 s;95℃、10 s,55℃、30 s,共12個循環(huán);72℃、30 s。PCR產物用AMPure XP beads純化。純化的cDNA產物用BioAnalyzer High Sensitivity Chips檢測構建文庫的質量。構建的文庫利用Hiseq Xten測序平臺完成測序獲得測序原始數(shù)據(jù)。
1.5.1 序列比對和生成數(shù)字表達矩陣 首先利用Picard軟件包和drop-seq工具集[9]從測序原始數(shù)據(jù)中提取出細胞標簽(cell barcode)和分子標簽(UMIs),并去除PCR接頭序列和polyA序列,以及測序質量較低的序列,獲得清潔數(shù)據(jù)(clean data)。隨后使用STAR v2.4.0a軟件[11]將清潔數(shù)據(jù)與人和小鼠的基因組(hg38和mm10 reference genomes)進行比對,進而獲得每一個細胞的數(shù)字表達矩陣。
1.5.2 單細胞數(shù)字表達矩陣分析 利用R語言包Seurat[12]對單細胞數(shù)字表達譜進行篩選,標準如下:每個合格細胞內檢測到基因的數(shù)量應≥200;每個合格的基因應在≥4個人源細胞或≥10個鼠源細胞內被檢出;同時,每個細胞內線粒體基因表達量在全部基因表達總量中所占比例應≤10%。數(shù)據(jù)進一步標準化后進行主成分分析(PCA)[13],t-分布領域嵌入算法(t-SNE)[14]亞群聚類分析,差異基因分析和亞群特異性標志物鑒定。
表1 引物序列
我們利用實驗室搭建的微流控平臺實現(xiàn)了單細胞的分離與標記。正交式微流控單細胞分離芯片的設計是將兩種匯合的水路溶液快速穿過一個油通路,在水路和油路的交匯處每分鐘可以產生超過1×105個液滴(如圖2)。其中一條水相的通路里是含有微球的細胞裂解液(用于裂解細胞),另外兩條水相溶液是待標記的單細胞懸液。當一個細胞和微球包裹到同一個液滴里,細胞裂解釋放的RNA可被微球上的引物捕獲,我們認為這個細胞后期可被測序分析(如圖1B、C)。1個細胞僅被1個微球成功包裹進1個液滴中的概率,我們稱為細胞的標記率。在流速一定的情況下,我們通過調節(jié)微球和細胞的濃度,以期提高細胞的標記率,降低單細胞測序的錯誤率。
圖2 液滴微流控單細胞分離系統(tǒng)的建立
為了確定最適的微球濃度,我們設置油、細胞和微球的流速分別為200、30和30μL/min,觀察在不同的微球濃度(250~650個/μL)下含有單個微球的液滴占所有液滴的比例即微球的捕獲率。結果表明,隨著微球濃度的增加,微球的捕獲率增加(如圖3A),但同時兩個微球進入同一個液滴的比例也增加,而且還出現(xiàn)堵塞芯片的現(xiàn)象。綜合多因素考慮,我們認為微球的最適濃度為400個/μL,此時微球的捕獲率為(11.87±3.75)%(如圖3B)。從概率學的角度分析,細胞的標記率在數(shù)值上等于含有微球的液滴占所有液滴的比例即微球的捕獲率。所以,當微球濃度為400個/μL,細胞濃度為250個/μL時,細胞的標記率約為11%。
我們以混合的人和小鼠的細胞為模擬樣品,評價液滴微流控單細胞轉錄組檢測平臺所獲得的單細胞轉錄組數(shù)據(jù)的可靠性。向單細胞分離系統(tǒng)輸入人和鼠混合的細胞7.5萬,在理論細胞標記率為11%時,可獲得7 535個細胞的轉錄組,其中小鼠的細胞5 935個,人的細胞1 530個。人和鼠轉錄組混合的細胞有70個,僅占全部細胞的0.9%(如圖4A)。HL-60細胞平均檢測到432條轉錄本,345個基因;B16-F10細胞平均檢測到897條轉錄本,651個基因(如圖4B、C)。結果表明,我們建立的液滴微流控單細胞檢測平臺能夠獲得單細胞轉錄組數(shù)據(jù),而且檢測結果具有較高的準確性。
我們進一步分析了7 535個單細胞基因表達譜的特征(見圖5)。t-分布領域嵌入算法(t-SNE)聚類分析結果顯示,根據(jù)細胞基因表達譜的差異,所有的細胞主要分為兩個細胞群(細胞群1和細胞群2),與已知的細胞種類基本一致(圖5A)。
圖3 微球濃度對含有單個微球液滴比例的影響
圖4 混合的人和鼠細胞樣本轉錄組測序的初步分析結果
圖5 腫瘤細胞非監(jiān)督聚類和分析結果
我們又篩選了在2個細胞群特異性高表達的基因,在細胞群1中特異性高表達的基因前5位是NEDD4、FTH1、VIM、TPM1和ACTB,在細胞群2中特異性高表達的基因前5位是NUCB2、TMSB4X、UBA52、B2M和RPS6(如圖5B)。隨后我們用數(shù)據(jù)庫證明了這些特異性表達的基因分別在黑色素瘤細胞和粒細胞白血病細胞中均高表達。以上結果證明我們獲得的單細胞轉錄組數(shù)據(jù)能夠篩選出每類細胞的特異性表達標志物。
近年來,單細胞測序技術取得了快速發(fā)展,而目前最受關注的方法是微流控單細胞測序技術,因為該技術可以方便地捕獲和處理細胞,減少了勞動力和實驗成本,同時提高了數(shù)據(jù)的一致性[15]。但是,目前微流控單細胞分離的過程中仍然存在許多因素影響單細胞測序的結果,例如當2個細胞與1個微球同時包裹到1個液滴中時,則會出現(xiàn)混合有2個細胞轉錄組的數(shù)據(jù),這將可能會導致細胞類型識別錯誤,在單細胞分離的過程中要避免。類似的,當2個微球與1個細胞同時包裹到1個液滴中時,這1個細胞則會在數(shù)據(jù)上被識別為2個細胞,從而可能在估計細胞數(shù)目時產生一定的偏差。因此,微流控單細胞測序技術的優(yōu)化和發(fā)展仍然是重要的研究方向。
到目前為止,利用drop-seq方法發(fā)表的單細胞測序的文章有十多篇,單細胞測序的焦點主要在胚胎發(fā)育和神經系統(tǒng)的研究[16-19],而在腫瘤中的應用相對較少。近期也有文章報道:利用drop-seq方法,輸入的所有細胞只有5%或更少的細胞能夠被測序[20]。在本研究中,我們組裝建立了一套基于“drop-seq”原理的液滴微流控單細胞分離系統(tǒng),提高了整體系統(tǒng)的穩(wěn)定性,并通過調節(jié)微球的濃度,達到了理想的細胞標記率,同時降低了轉錄組數(shù)據(jù)的錯誤率。
為了分析我們建立的微流控單細胞轉錄組檢測方法的準確性,我們用混合的人白血病細胞(HL-60細胞)和小鼠黑色素瘤細胞(B16-F10細胞)進行了實驗,分析了每個單細胞轉錄組數(shù)據(jù)中人和小鼠基因組的讀取比例。我們的結果顯示,人和鼠轉錄組混合細胞僅占全部細胞的0.9%,表明了我們的單細胞測序結果具有較高的保真度。然而,我們也注意到,本研究中每一個細胞檢測到的轉錄本數(shù)量與其他文章報道的結果相比要少[9-10,22]??赡茉蚴俏覀儥z測到的總細胞數(shù)目較多,在數(shù)據(jù)量一定的情況下,平均每個細胞的數(shù)據(jù)量就會減少。后期的實驗我們可以減少每次上樣的細胞數(shù)量,增加測序的數(shù)據(jù)量。同時,我們也注意到在測序的結果中,小鼠和人的細胞數(shù)量上存在差異。這可能與細胞的大小和生長方式有關,但仍需要進一步實驗驗證。
與目前已經面世的商品化單細胞轉錄組標記和建庫平臺(如10×Genomics公司的單細胞測序技術[21]相比,我們建立的液滴微流控單細胞轉錄組檢測平臺具有模塊化、靈活度高,以及成本相對較低的優(yōu)點。而也恰恰因為該系統(tǒng)的靈活度高,必然會增加對操作人員的培訓難度;同時相對于商品化平臺的整機包裹,該平臺整個微流控系統(tǒng)幾乎全部裸露在外,因此對于外部環(huán)境的清潔度、桌面穩(wěn)定性等要求都比較高。盡管如此,考慮到高通量單細胞轉錄組研究的巨大前景,我們仍認為將來該平臺在腫瘤細胞亞群的分析和腫瘤標志物的篩選方面具有很高的應用價值。
綜上所述,我們建立了一套液滴微流控單細胞標記系統(tǒng),通過調節(jié)微球的濃度,獲得了最適的細胞標記率,為drop-seq單細胞測序技術的完善提供了寶貴的經驗,也為腫瘤單細胞測序的研究提供了新的方法。